MPEG | A I 時代の I T テクノロジー＆用語ナビ

動画圧縮の原点：MPEG-1

今では動画配信の場を使って、高画質の動画を手軽に楽しむことができます。少し前までは、貸出店へ行き、ビデオテープを借りて映画などを視聴するのが当たり前の光景でした。家庭用のビデオテープの画質は、決して高いとは言えず、現在の高画質映像とは比べ物になりません。ぼやけた映像やノイズに悩まされた方も多いのではないでしょうか。しかし、レンタルビデオの登場は、家庭で手軽に動画を楽しめるようになったという点で、革新的な出来事でした。映画館に行かなくても、好きな時間に好きな映画を自宅で見ることができるようになったのです。この手軽さが、ビデオテープの人気を支えていました。その後、ビデオテープ並みの画質でありながら、ＣＤに動画を記録できる技術が登場しました。これは動画の歴史における大きな転換点と言えるでしょう。比較的小さなＣＤに動画が記録できるようになったことで、動画の持ち運びや保存がより簡単になりました。そして、この革新的な技術こそが、今回紹介するＭＰＥＧ－１なのです。ＭＰＥＧ－１とは、動画と音声を圧縮して、データの大きさを小さくする技術です。動画や音声のデータはそのままでは非常に大きいため、記録媒体に保存するには、データの大きさを小さくする必要があります。ＭＰＥＧ－１はこの圧縮技術により、ＣＤという比較的小さな記録媒体に、１時間程度の動画を保存することを可能にしました。これは当時としては画期的なことで、ＣＤの普及を後押しする大きな要因の一つとなりました。ＭＰＥＧ－１は、その後の動画圧縮技術の基礎となる重要な技術であり、現在の高画質動画配信時代への礎を築いたと言えるでしょう。

2025.01.22

規格

動画圧縮の技術 MPEG-4

動画圧縮とは、動画のデータ量を小さくする技術のことです。動画は、そのままでは膨大なデータ量になるため、通信回線を使って送ったり、機器に保存したりするには負担が大きすぎます。そこで、動画圧縮技術を使ってデータ量を減らすことで、円滑なやり取りや効率的な保存を可能にしています。動画圧縮には、主に二つの種類があります。一つは「非可逆圧縮」と呼ばれるものです。非可逆圧縮は、画質を多少落とす代わりに、高い圧縮率を実現できます。つまり、データ量は大幅に減りますが、元の画質とは完全に同じではなくなります。もう一つは「可逆圧縮」です。可逆圧縮は、画質を全く落とさずに圧縮します。そのため、元の画質を完全に再現できますが、非可逆圧縮に比べると圧縮率は低くなります。どちらの方法を選ぶかは、求める画質とデータ量のバランスによって決まります。動画圧縮技術は、様々な場面で活用されています。例えば、インターネットで動画を配信する際や、DVD、ブルーレイディスクなどに動画を記録する際にも使われています。近年、動画配信の利用者が増え、高画質動画への需要も高まっているため、動画圧縮技術の重要性はますます高まっています。より綺麗な映像を、より少ないデータ量で配信するために、常に新しい技術が開発されています。例えば、人工知能を用いた圧縮技術も研究されており、今後の更なる発展が期待されます。

2025.01.22

規格

MPEG-2：動画と音声の圧縮方式

動画と音声の情報をぎゅっと小さくまとめる技術、エムペグツーについて説明します。正式には「動画と音声の符号化方式エムペグツー」と呼ばれ、その名の通り、動画と音声のデータを圧縮する技術です。この技術が登場するまでは、高画質の動画や高音質の音声を扱うには、膨大なデータ量が必要でした。そのため、限られた容量の記録媒体や、限られた帯域幅の電波では、高品質な動画や音声を扱うのは難しいことでした。しかし、エムペグツーによって状況は大きく変わりました。エムペグツーは、人間の目や耳には感じにくい情報を削ったり、似た情報をまとめて表現したりすることで、データ量を大幅に減らすことができます。例えば、ほとんど変化のない背景の部分や、人間の耳には聞こえにくい高音域や低音域の音などは、データ量を減らす対象となります。このように、エムペグツーは人間の知覚特性をうまく利用することで、画質や音質を損なうことなく、データ量を圧縮することを実現しています。エムペグツーは、様々な機器やサービスで利用されています。例えば、かつて広く普及した記録媒体であるデーヴィーディーでは、エムペグツーが標準の動画圧縮技術として採用されていました。また、電波を使って動画や音声を届ける地上デジタル放送でも、エムペグツーが活用されています。他にも、衛星放送やケーブルテレビなど、様々な場面でエムペグツーは活躍しています。エムペグツーは、私たちが日常的に高画質の動画や高音質の音声を楽しめるようになった背景には、このエムペグツーの技術が大きく貢献していると言えるでしょう。エムペグツーは、現代の映像、音声体験を支える重要な技術の一つです。

2025.01.22

規格

MP3: 音声圧縮技術の革命

音の情報は、そのままではデータ量が非常に大きく、情報のやり取りや機器への保存には適していません。そのため、データの大きさを小さくする圧縮技術は必要不可欠です。音声の圧縮技術は、人の耳の仕組みをうまく利用することで、音質への影響を抑えながらデータ量を減らす工夫が凝らされています。人は、全ての音を均等に聞いているわけではありません。例えば、大きな音のすぐ後に小さな音が鳴ると、小さな音はかき消されて聞こえにくくなります。また、特定の高さの音が他の高さの音に埋もれてしまう現象も起こります。これは、ある音によって他の音が聞こえにくくなる「マスキング効果」と呼ばれています。音声圧縮技術では、このマスキング効果を巧みに利用します。聞こえにくい音や、他の音に埋もれてしまう音は、データとして記録する必要がないため、削除することでデータ量を減らすことができます。圧縮の方法は様々ですが、大きく分けて「可逆圧縮」と「非可逆圧縮」の2種類があります。可逆圧縮は、圧縮前の状態に完全に復元できる方法です。データの欠落がないため、元の音質を完全に再現できます。一方、非可逆圧縮は、一部のデータを削除して圧縮するため、完全に元の状態には戻せません。しかし、可逆圧縮に比べて圧縮率が高く、データ量を大幅に減らすことができます。よく使われるMP3は、この非可逆圧縮を用いた音声圧縮技術の一つです。MP3は、人間の耳には聞こえにくい音の成分を特定し、そのデータを削除することで、音質の劣化を最小限に抑えつつ、大幅なデータ圧縮を実現しています。このように、人間の聴覚特性を考慮した高度な技術によって、高音質とデータ量の縮小を両立させているのです。

2025.01.22

保存･圧縮

動画圧縮のMPEGを詳しく解説

動画や音声を小さくまとめる技術のことを、エムペグと呼びます。正式には、「動く絵の専門家集団」という意味を持つ「Moving Picture Experts Group」と言い、その頭文字を取ってエムペグとなっています。この技術を生み出したのは、世界規模で規格を定める国際標準化機構と国際電気標準会議が共同で作った組織です。エムペグは、動画や音声を扱う場面で欠かせない技術となっています。例えば、動画を保存したり、インターネットで動画を配信したり、動画を探す時にも、この技術が役立っています。私たちが普段見ている動画の多くは、エムペグによって小さく圧縮されているおかげで、手軽に見ることが出来るのです。エムペグの技術は、様々な機器やサービスで使われています。例えば、映画などを楽しむためのデービーデーや、より綺麗な映像を見られるブルーレイディスク、テレビ放送やインターネットで動画を配信するサービスなど、幅広い分野でエムペグは活躍しています。エムペグには、「エムペグいち」「エムペグに」「エムペグよん」「エムペグなな」など、様々な種類があります。面白いことに、「エムペグさん」「エムペグご」「エムペグろく」といった番号は使われていません。これは、技術の進歩や、市場の需要の変化など、様々な理由が重なった結果です。このように、エムペグは動画や音声の圧縮技術において、とても重要な役割を担っています。私たちが手軽に動画を楽しめるのは、エムペグのおかげと言えるでしょう。

2025.01.22

規格

画像と音声の圧縮技術：DCT入門

情報の変換方法を説明します。情報をそのまま記録すると多くの記憶場所が必要ですが、変換することで必要な記憶場所を減らすことができます。この変換は、例えば写真や音声といった情報に利用されます。離散余弦変換（略称ＤＣＴ）という方法で情報を周波数という波の成分に分解します。人間の目や耳には、高い周波数の成分はあまり聞き取ったり、見分けたりすることができません。高い周波数の成分は、写真の細かい部分や音のノイズに関係しています。重要なのは低い周波数の成分で、写真の全体の明るさや音の高さといった主要な情報を表しています。ＤＣＴでは、高い周波数の成分を省略することで記憶場所を減らしているのです。具体的な方法としては、まず情報を小さな区画に分けます。次に、それぞれの区画に対してＤＣＴを適用します。変換後の情報は、低い周波数から高い周波数の順に並べ替えられます。不要な高い周波数の情報は削除されます。このように、人間の目や耳の特徴に合わせて、重要な情報だけを残すことで、効率よく記憶場所を減らすことができます。変換後の情報は、「量子化」という処理でさらに記憶場所を減らします。そして、最終的にファイルの大きさが小さくなります。元の情報に戻すためには、逆ＤＣＴという処理を行います。しかし、減らした情報があるので完全に元と同じには戻りません。情報の減少は、記憶場所の削減量と写真や音の質のバランスで調整されます。

2025.01.21

保存･圧縮

YUV：色の表現方法

私たちの周りは、鮮やかな色彩で溢れています。携帯電話で撮った写真や動画、テレビで流れる番組、パソコン画面に映し出される画像など、どれも何らかの方法で色を表現することで、私たちはそれを認識することができます。色の表現方法は実に様々ですが、今回は「YUV」と呼ばれる色の表現方法について詳しく説明します。YUVは、人間の目の仕組みをうまく利用した、効率的な色の表現方法です。人間の目は、明るさの変化には敏感ですが、色の変化にはそれほど敏感ではありません。YUVはこの特性を利用し、明るさを表す情報と色の情報を分けて扱うことで、データ量を圧縮しつつ、人間の目には自然に見えるように工夫されています。具体的には、Yは明るさを表す輝度信号、UとVは色を表す色差信号です。輝度信号Yは、白黒画像を作る際に使われる信号と同じものです。色差信号UとVは、基準となる明るさからの色のずれを表しています。このように、YUVでは明るさと色を分けて扱うため、人間の視覚特性に合わせた効率的なデータ圧縮が可能になります。例えば、動画を配信する場合、データ量が大きすぎると通信回線に負担がかかり、映像が途切れたり、画質が落ちたりすることがあります。YUVを用いることで、データ量を抑えつつ、高画質の映像を配信することができるのです。また、YUVは様々な機器やシステムとの互換性が高いため、多くの場面で活用されています。YUVは、色の表現方法として、人間の目の特性をうまく利用することで、データの効率的な保存と伝送を実現していると言えるでしょう。私たちの身の回りにある様々な映像機器やサービスの裏側で、YUVは重要な役割を果たしているのです。

2025.01.20

画像

画像と音の魔法、離散コサイン変換とは？

視覚や聴覚といった人の感覚は、情報の変化に敏感で、情報の細かな違いを見分ける力を持っています。一方で、情報そのものの絶対的な大きさには鈍感です。例えば、明るい場所で小さな光の変化を見つけることは難しいですが、暗い場所では小さな光でもすぐに気が付きます。この性質を利用した技術が、離散コサイン変換です。離散コサイン変換は、画像や音声、動画などのデジタルデータを、周波数成分と呼ばれる大小の波の重ね合わせとして表現する方法です。低い周波数は緩やかな変化、高い周波数は細かな変化に対応しています。そして、人間の感覚が鈍感な高い周波数成分をあえて省略することで、データ量を大幅に減らすことができます。写真を例に考えてみましょう。写真の色の変化は、空のような緩やかな変化と、木の葉のような細かな変化が混ざり合っています。離散コサイン変換を使うと、これらの変化を周波数成分に分けることができます。そして、人間の目にはあまり影響がない高周波数成分、つまり細かな変化の情報の一部を捨て去ることで、データ量を小さくするのです。このようにしてデータ量を小さくしても、残された低い周波数成分の情報から、元の画像のおおよその形や色を復元できます。そのため、見た目の印象は大きく変わらずに、データの容量だけを減らすことができるのです。まるで魔法のようにデータ量を操る離散コサイン変換は、現代のデジタル社会を支える重要な技術と言えるでしょう。

2025.01.20

保存･圧縮