画像圧縮

記事数:(6)

保存・圧縮

JPEG: 写真を美しく、小さく

写真や絵を計算機で扱うためには、画像の情報を数値データに変換する必要があります。しかし、そのままではデータ量が膨大になり、保存や伝送に時間がかかってしまいます。そこで、画像のデータ量を減らす技術である圧縮方式が用いられます。数ある圧縮方式の中でも、「ジェイペグ」は写真に特化した方式として広く使われています。 ジェイペグが写真に向いている理由は、人の目の特性をうまく利用している点にあります。人は、色のわずかな違いよりも、明るさの変化に敏感です。例えば、空の色が微妙に変わったとしても、気づきにくいものです。一方、明るい太陽と暗い影の濃淡ははっきりと認識できます。ジェイペグはこの特性に着目し、色の情報を少しだけ間引くことでデータ量を減らしています。明るさの情報はそのまま残すので、人の目には画質が大きく下がったようには感じられません。 色の情報を間引くとは、具体的には次のような処理です。まず、画像を小さなブロックに分けます。そして、それぞれのブロックの中で、似た色の部分は同じ色として扱います。例えば、空の青色の濃淡を平均化して、一つの青色で表現するのです。このように、色の種類を減らすことでデータ量を大幅に削減できます。 ジェイペグによって、ファイルの大きさは元の10分の1から100分の1程度まで小さくなります。このおかげで、たくさんの写真を記憶装置に保存したり、通信網を通して速やかに画像を送ったりすることが可能になります。携帯電話や計算機などで写真を見るのが当たり前になった現代社会において、ジェイペグはなくてはならない技術と言えるでしょう。
保存・圧縮

データ圧縮の基礎: 不可逆圧縮とは

近ごろの情報化社会では、情報のやり取りが活発になり、動画や音楽、写真など、様々なデータが飛び交っています。これらのデータはどれも容量が大きく、そのままでは保存する場所がたくさん必要になったり、送受信に時間がかかったりしてしまいます。そこで重要となるのが、データの容量を小さくする圧縮技術です。圧縮技術には、大きく分けて元に戻せる圧縮方式と元に戻せない圧縮方式の二種類があります。この記事では、元に戻せない圧縮方式について詳しく説明します。元に戻せない圧縮方式は、データの一部を削除することで容量を小さくする仕組みです。例えば、人の目にはわからないような細かい色の違いや、聞こえにくい高い音などを削ってしまうことで、データのサイズを大幅に減らすことができます。この方式を使うと、元に戻せる圧縮方式よりも更に容量を小さくできるという大きな利点があります。しかし、一度削ってしまった情報は二度と戻ってこないため、画質や音質が少し劣化してしまう場合もあります。劣化の程度は圧縮率によって異なり、強く圧縮するほど画質や音質は下がりますが、容量は小さくなります。そのため、用途に合わせて適切な圧縮率を選ぶことが大切です。例えば、インターネットで動画を見る場合は、多少画質が落ちても読み込み速度が速い方が良いでしょう。しかし、大切な写真を保存する場合は、高画質を保つために、元に戻せる圧縮方式や、元に戻せない圧縮方式でも圧縮率を低く設定する方が良いでしょう。このように、元に戻せない圧縮方式は、容量を小さくする効果が高い反面、データの一部が失われてしまうという特徴を持っています。この特徴を理解した上で、状況に応じて使い分けることが大切です。
保存・圧縮

画像と音声の圧縮技術:DCT入門

情報の変換方法を説明します。情報をそのまま記録すると多くの記憶場所が必要ですが、変換することで必要な記憶場所を減らすことができます。この変換は、例えば写真や音声といった情報に利用されます。 離散余弦変換(略称DCT)という方法で情報を周波数という波の成分に分解します。人間の目や耳には、高い周波数の成分はあまり聞き取ったり、見分けたりすることができません。高い周波数の成分は、写真の細かい部分や音のノイズに関係しています。重要なのは低い周波数の成分で、写真の全体の明るさや音の高さといった主要な情報を表しています。DCTでは、高い周波数の成分を省略することで記憶場所を減らしているのです。 具体的な方法としては、まず情報を小さな区画に分けます。次に、それぞれの区画に対してDCTを適用します。変換後の情報は、低い周波数から高い周波数の順に並べ替えられます。不要な高い周波数の情報は削除されます。このように、人間の目や耳の特徴に合わせて、重要な情報だけを残すことで、効率よく記憶場所を減らすことができます。 変換後の情報は、「量子化」という処理でさらに記憶場所を減らします。そして、最終的にファイルの大きさが小さくなります。元の情報に戻すためには、逆DCTという処理を行います。しかし、減らした情報があるので完全に元と同じには戻りません。情報の減少は、記憶場所の削減量と写真や音の質のバランスで調整されます。
画像

YUV:色の表現方法

私たちの周りは、鮮やかな色彩で溢れています。携帯電話で撮った写真や動画、テレビで流れる番組、パソコン画面に映し出される画像など、どれも何らかの方法で色を表現することで、私たちはそれを認識することができます。色の表現方法は実に様々ですが、今回は「YUV」と呼ばれる色の表現方法について詳しく説明します。 YUVは、人間の目の仕組みをうまく利用した、効率的な色の表現方法です。人間の目は、明るさの変化には敏感ですが、色の変化にはそれほど敏感ではありません。YUVはこの特性を利用し、明るさを表す情報と色の情報を分けて扱うことで、データ量を圧縮しつつ、人間の目には自然に見えるように工夫されています。具体的には、Yは明るさを表す輝度信号、UとVは色を表す色差信号です。輝度信号Yは、白黒画像を作る際に使われる信号と同じものです。色差信号UとVは、基準となる明るさからの色のずれを表しています。 このように、YUVでは明るさと色を分けて扱うため、人間の視覚特性に合わせた効率的なデータ圧縮が可能になります。例えば、動画を配信する場合、データ量が大きすぎると通信回線に負担がかかり、映像が途切れたり、画質が落ちたりすることがあります。YUVを用いることで、データ量を抑えつつ、高画質の映像を配信することができるのです。また、YUVは様々な機器やシステムとの互換性が高いため、多くの場面で活用されています。 YUVは、色の表現方法として、人間の目の特性をうまく利用することで、データの効率的な保存と伝送を実現していると言えるでしょう。私たちの身の回りにある様々な映像機器やサービスの裏側で、YUVは重要な役割を果たしているのです。
保存・圧縮

画像と音の魔法、離散コサイン変換とは?

視覚や聴覚といった人の感覚は、情報の変化に敏感で、情報の細かな違いを見分ける力を持っています。一方で、情報そのものの絶対的な大きさには鈍感です。例えば、明るい場所で小さな光の変化を見つけることは難しいですが、暗い場所では小さな光でもすぐに気が付きます。この性質を利用した技術が、離散コサイン変換です。 離散コサイン変換は、画像や音声、動画などのデジタルデータを、周波数成分と呼ばれる大小の波の重ね合わせとして表現する方法です。低い周波数は緩やかな変化、高い周波数は細かな変化に対応しています。そして、人間の感覚が鈍感な高い周波数成分をあえて省略することで、データ量を大幅に減らすことができます。 写真を例に考えてみましょう。写真の色の変化は、空のような緩やかな変化と、木の葉のような細かな変化が混ざり合っています。離散コサイン変換を使うと、これらの変化を周波数成分に分けることができます。そして、人間の目にはあまり影響がない高周波数成分、つまり細かな変化の情報の一部を捨て去ることで、データ量を小さくするのです。 このようにしてデータ量を小さくしても、残された低い周波数成分の情報から、元の画像のおおよその形や色を復元できます。そのため、見た目の印象は大きく変わらずに、データの容量だけを減らすことができるのです。まるで魔法のようにデータ量を操る離散コサイン変換は、現代のデジタル社会を支える重要な技術と言えるでしょう。
保存・圧縮

データ圧縮の仕組み:非可逆圧縮とは

電算機で扱う情報は、画像や音声、動画など、時に莫大な量になることがあります。そのため、情報を扱う際には、記憶装置の容量を抑えたり、通信にかかる時間を減らすことが重要になります。こうした課題を解決するために、様々な方法で情報を小さくする技術、すなわち圧縮技術が用いられています。圧縮技術には大きく分けて、元通りに復元できる可逆圧縮と、完全に元通りには復元できない非可逆圧縮の二種類があります。この文章では、後者の非可逆圧縮について、その仕組みや特徴、活用事例などを詳しく説明します。 非可逆圧縮は、元データと完全に同じ状態に戻すことはできません。しかし、人間の目や耳では違いが分からない程度に情報を減らし、ファイルのサイズを大幅に縮小できます。例えば、音楽データの場合、人間の耳には聞こえにくい高い音や低い音の情報などを削ることで、音質の変化を最小限に抑えつつ、ファイルサイズを小さくします。画像データであれば、人間の目にはほとんど区別できないわずかな色の違いをまとめてしまうことで、データ量を減らします。 このように、非可逆圧縮はある程度の情報を失う代わりに、高い圧縮率を実現できます。動画配信や音楽配信サービスなど、大量のデータを扱うサービスにおいては、この非可逆圧縮が欠かせません。もし非可逆圧縮技術がなければ、動画や音楽を高画質・高音質で配信するために、膨大な通信容量と時間が必要となり、現在のサービス提供は難しくなるでしょう。容量と通信速度の節約という点で、非可逆圧縮は現代の情報社会を支える重要な技術の一つと言えるでしょう。 非可逆圧縮には、JPEG、MP3、AACなど、様々な種類があります。それぞれ得意とするデータの種類や圧縮方式が異なり、用途に応じて使い分けられています。これらの具体的な種類や仕組みについては、後の章で詳しく解説します。