JPEG

記事数:(6)

保存・圧縮

JPEG: 写真を美しく、小さく

写真や絵を計算機で扱うためには、画像の情報を数値データに変換する必要があります。しかし、そのままではデータ量が膨大になり、保存や伝送に時間がかかってしまいます。そこで、画像のデータ量を減らす技術である圧縮方式が用いられます。数ある圧縮方式の中でも、「ジェイペグ」は写真に特化した方式として広く使われています。 ジェイペグが写真に向いている理由は、人の目の特性をうまく利用している点にあります。人は、色のわずかな違いよりも、明るさの変化に敏感です。例えば、空の色が微妙に変わったとしても、気づきにくいものです。一方、明るい太陽と暗い影の濃淡ははっきりと認識できます。ジェイペグはこの特性に着目し、色の情報を少しだけ間引くことでデータ量を減らしています。明るさの情報はそのまま残すので、人の目には画質が大きく下がったようには感じられません。 色の情報を間引くとは、具体的には次のような処理です。まず、画像を小さなブロックに分けます。そして、それぞれのブロックの中で、似た色の部分は同じ色として扱います。例えば、空の青色の濃淡を平均化して、一つの青色で表現するのです。このように、色の種類を減らすことでデータ量を大幅に削減できます。 ジェイペグによって、ファイルの大きさは元の10分の1から100分の1程度まで小さくなります。このおかげで、たくさんの写真を記憶装置に保存したり、通信網を通して速やかに画像を送ったりすることが可能になります。携帯電話や計算機などで写真を見るのが当たり前になった現代社会において、ジェイペグはなくてはならない技術と言えるでしょう。
保存・圧縮

画像と音声の圧縮技術:DCT入門

情報の変換方法を説明します。情報をそのまま記録すると多くの記憶場所が必要ですが、変換することで必要な記憶場所を減らすことができます。この変換は、例えば写真や音声といった情報に利用されます。 離散余弦変換(略称DCT)という方法で情報を周波数という波の成分に分解します。人間の目や耳には、高い周波数の成分はあまり聞き取ったり、見分けたりすることができません。高い周波数の成分は、写真の細かい部分や音のノイズに関係しています。重要なのは低い周波数の成分で、写真の全体の明るさや音の高さといった主要な情報を表しています。DCTでは、高い周波数の成分を省略することで記憶場所を減らしているのです。 具体的な方法としては、まず情報を小さな区画に分けます。次に、それぞれの区画に対してDCTを適用します。変換後の情報は、低い周波数から高い周波数の順に並べ替えられます。不要な高い周波数の情報は削除されます。このように、人間の目や耳の特徴に合わせて、重要な情報だけを残すことで、効率よく記憶場所を減らすことができます。 変換後の情報は、「量子化」という処理でさらに記憶場所を減らします。そして、最終的にファイルの大きさが小さくなります。元の情報に戻すためには、逆DCTという処理を行います。しかし、減らした情報があるので完全に元と同じには戻りません。情報の減少は、記憶場所の削減量と写真や音の質のバランスで調整されます。
画像

YUV:色の表現方法

私たちの周りは、鮮やかな色彩で溢れています。携帯電話で撮った写真や動画、テレビで流れる番組、パソコン画面に映し出される画像など、どれも何らかの方法で色を表現することで、私たちはそれを認識することができます。色の表現方法は実に様々ですが、今回は「YUV」と呼ばれる色の表現方法について詳しく説明します。 YUVは、人間の目の仕組みをうまく利用した、効率的な色の表現方法です。人間の目は、明るさの変化には敏感ですが、色の変化にはそれほど敏感ではありません。YUVはこの特性を利用し、明るさを表す情報と色の情報を分けて扱うことで、データ量を圧縮しつつ、人間の目には自然に見えるように工夫されています。具体的には、Yは明るさを表す輝度信号、UとVは色を表す色差信号です。輝度信号Yは、白黒画像を作る際に使われる信号と同じものです。色差信号UとVは、基準となる明るさからの色のずれを表しています。 このように、YUVでは明るさと色を分けて扱うため、人間の視覚特性に合わせた効率的なデータ圧縮が可能になります。例えば、動画を配信する場合、データ量が大きすぎると通信回線に負担がかかり、映像が途切れたり、画質が落ちたりすることがあります。YUVを用いることで、データ量を抑えつつ、高画質の映像を配信することができるのです。また、YUVは様々な機器やシステムとの互換性が高いため、多くの場面で活用されています。 YUVは、色の表現方法として、人間の目の特性をうまく利用することで、データの効率的な保存と伝送を実現していると言えるでしょう。私たちの身の回りにある様々な映像機器やサービスの裏側で、YUVは重要な役割を果たしているのです。
保存・圧縮

ロッシー圧縮:データ容量を減らす技術

今の世の中、色々な情報が、目に見える形、耳に聞こえる音、動画など、様々な形で飛び交っています。そして、これらの情報は全て数字の集まり、つまりデータとして扱われています。写真や音楽、動画などは特にデータ量が大きく、そのままではパソコンやスマホの容量をすぐに使い切ってしまったり、インターネットで送るのに時間がかかってしまったりします。 そこで、これらのデータの大きさを小さくする技術が「圧縮」です。圧縮には大きく分けて二つの種類があります。一つは「元に戻せる圧縮」で、もう一つは「元に戻せない圧縮」です。元に戻せる圧縮は、服を小さく畳むようなもので、元に戻せば元の服と同じ形になります。一方、元に戻せない圧縮は、粘土で作った作品の一部を削って形を変えるようなもので、一度削ってしまったら元には戻せません。 この二つの圧縮方法のうち、元に戻せない圧縮は「ロッシー圧縮」と呼ばれ、このロッシー圧縮について詳しく説明していきます。ロッシー圧縮は、データの一部を削ってしまうため、元のデータとは完全に同じではなくなります。しかし、削る部分は人の目や耳にはあまり違いが分からない部分を選んでいるため、品質の低下は最小限に抑えられます。例えば、音楽データの場合、人間の耳では聞き取れない高い音や低い音の情報などを削ることで、データ量を大幅に減らすことができます。 このように、ロッシー圧縮はデータ量を大幅に減らせるというメリットがあるため、動画配信や音楽配信など、様々な場面で活用されています。このブログ記事を通して、ロッシー圧縮の仕組みや特徴を理解し、データ圧縮技術への理解を深めていきましょう。
画像

画像の種類:ビットマップ画像とは?

計算機で絵を描くには、色のついた小さな点々を隙間なく並べる方法があります。この小さな点は「画素」と呼ばれ、一つ一つに色が指定されています。一つ一つの画素はとても小さく、肉眼では点々と認識できないほどです。 この画素を、まるで色のついた小さなビーズのようにたくさん並べることで、複雑な模様や写真のような滑らかな色の変化も表現できます。例えば、空のグラデーションを表現したいときには、青い画素と白い画素を少しずつ混ぜながら並べていくことで、自然な色の変化を作り出せます。 この画素の集まりで絵を表現する方法は「ビットマップ画像」と呼ばれています。ビットマップ画像は、写真のように色の変化が複雑な絵を忠実に再現するのに優れています。まるで、たくさんの色のビーズを使って、巨大な絵を描くようなものです。 絵の鮮明さや色の豊かさは、画素の数と色の種類で決まります。画素の数を増やすと、より細かい表現が可能になり、絵が鮮明になります。色の種類を増やすと、より自然で豊かな色の表現が可能になります。例えば、夕焼けの空を表現するために、赤、橙、黄色の微妙な色の変化を表現するには、たくさんの色の種類が必要です。 このように、計算機では、小さな色の点である画素を並べることで、様々な絵を表現しているのです。まるで、目に見えない小さな手で、一つ一つ丁寧にビーズを並べて、美しい絵を作り上げているかのようです。
保存・圧縮

画像と音の魔法、離散コサイン変換とは?

視覚や聴覚といった人の感覚は、情報の変化に敏感で、情報の細かな違いを見分ける力を持っています。一方で、情報そのものの絶対的な大きさには鈍感です。例えば、明るい場所で小さな光の変化を見つけることは難しいですが、暗い場所では小さな光でもすぐに気が付きます。この性質を利用した技術が、離散コサイン変換です。 離散コサイン変換は、画像や音声、動画などのデジタルデータを、周波数成分と呼ばれる大小の波の重ね合わせとして表現する方法です。低い周波数は緩やかな変化、高い周波数は細かな変化に対応しています。そして、人間の感覚が鈍感な高い周波数成分をあえて省略することで、データ量を大幅に減らすことができます。 写真を例に考えてみましょう。写真の色の変化は、空のような緩やかな変化と、木の葉のような細かな変化が混ざり合っています。離散コサイン変換を使うと、これらの変化を周波数成分に分けることができます。そして、人間の目にはあまり影響がない高周波数成分、つまり細かな変化の情報の一部を捨て去ることで、データ量を小さくするのです。 このようにしてデータ量を小さくしても、残された低い周波数成分の情報から、元の画像のおおよその形や色を復元できます。そのため、見た目の印象は大きく変わらずに、データの容量だけを減らすことができるのです。まるで魔法のようにデータ量を操る離散コサイン変換は、現代のデジタル社会を支える重要な技術と言えるでしょう。