音声圧縮

記事数:(15)

保存・圧縮

AAC:高音質を実現する革新的音声圧縮技術

音は空気の振動が波となって伝わっていく現象であり、コンピュータで扱うためには、このアナログ信号をデジタル信号に変換する必要があります。デジタル化した音の情報はそのままではデータ量が膨大になるため、容量を小さくして扱いやすくする技術が音声圧縮技術です。音声圧縮技術には、大きく分けて二つの種類があります。一つは「非可逆圧縮」と呼ばれる方式で、元に戻せない情報を取り除くことで、ファイルサイズを大幅に縮小します。人間の耳には聞こえにくい高い音や低い音、あるいは大きな音に隠れてしまう小さな音といった、知覚できない音の情報は思い切って削ってしまうのです。この方式では、音楽配信サービスなどで使われているMP3やAACなどが代表的です。高い圧縮率を実現できる一方、どうしても元の音と完全に同じようには再生できないという欠点があります。もう一つは「可逆圧縮」と呼ばれる方式です。こちらは、圧縮前のデータと圧縮後のデータを完全に一致させられる方式です。音声データの中に同じパターンが繰り返し現れる場合、そのパターンを短い記号に置き換えることでデータ量を減らします。例えるなら、何度も繰り返す言葉の代わりに記号を使って文章を短くするようなものです。この方式は、圧縮率は非可逆圧縮に比べると低いものの、元の音質を全く劣化させずに保存・再生できるという利点があります。会議の音声記録や、音楽制作の現場などで、音質を落とせない場合に活用されています。このように、音声圧縮には様々な方式があり、それぞれに長所と短所があります。用途や目的に合わせて最適な方式を選ぶことが重要です。例えば、音楽を楽しむだけなら、多少の音質劣化を許容してファイルサイズを小さくできる非可逆圧縮が適しています。一方で、重要な会議の内容を記録する場合などは、音質を優先して可逆圧縮を選ぶべきでしょう。音声圧縮技術は、限られた記憶容量や通信帯域を有効に活用するために、これからも進化し続けていくでしょう。
規格

動画圧縮の原点:MPEG-1

今では動画配信の場を使って、高画質の動画を手軽に楽しむことができます。少し前までは、貸出店へ行き、ビデオテープを借りて映画などを視聴するのが当たり前の光景でした。家庭用のビデオテープの画質は、決して高いとは言えず、現在の高画質映像とは比べ物になりません。ぼやけた映像やノイズに悩まされた方も多いのではないでしょうか。しかし、レンタルビデオの登場は、家庭で手軽に動画を楽しめるようになったという点で、革新的な出来事でした。映画館に行かなくても、好きな時間に好きな映画を自宅で見ることができるようになったのです。この手軽さが、ビデオテープの人気を支えていました。その後、ビデオテープ並みの画質でありながら、CDに動画を記録できる技術が登場しました。これは動画の歴史における大きな転換点と言えるでしょう。比較的小さなCDに動画が記録できるようになったことで、動画の持ち運びや保存がより簡単になりました。そして、この革新的な技術こそが、今回紹介するMPEG-1なのです。MPEG-1とは、動画と音声を圧縮して、データの大きさを小さくする技術です。動画や音声のデータはそのままでは非常に大きいため、記録媒体に保存するには、データの大きさを小さくする必要があります。MPEG-1はこの圧縮技術により、CDという比較的小さな記録媒体に、1時間程度の動画を保存することを可能にしました。これは当時としては画期的なことで、CDの普及を後押しする大きな要因の一つとなりました。MPEG-1は、その後の動画圧縮技術の基礎となる重要な技術であり、現在の高画質動画配信時代への礎を築いたと言えるでしょう。
規格

動画圧縮の技術 MPEG-4

動画圧縮とは、動画のデータ量を小さくする技術のことです。動画は、そのままでは膨大なデータ量になるため、通信回線を使って送ったり、機器に保存したりするには負担が大きすぎます。そこで、動画圧縮技術を使ってデータ量を減らすことで、円滑なやり取りや効率的な保存を可能にしています。動画圧縮には、主に二つの種類があります。一つは「非可逆圧縮」と呼ばれるものです。非可逆圧縮は、画質を多少落とす代わりに、高い圧縮率を実現できます。つまり、データ量は大幅に減りますが、元の画質とは完全に同じではなくなります。もう一つは「可逆圧縮」です。可逆圧縮は、画質を全く落とさずに圧縮します。そのため、元の画質を完全に再現できますが、非可逆圧縮に比べると圧縮率は低くなります。どちらの方法を選ぶかは、求める画質とデータ量のバランスによって決まります。動画圧縮技術は、様々な場面で活用されています。例えば、インターネットで動画を配信する際や、DVD、ブルーレイディスクなどに動画を記録する際にも使われています。近年、動画配信の利用者が増え、高画質動画への需要も高まっているため、動画圧縮技術の重要性はますます高まっています。より綺麗な映像を、より少ないデータ量で配信するために、常に新しい技術が開発されています。例えば、人工知能を用いた圧縮技術も研究されており、今後の更なる発展が期待されます。
規格

MPEG-2:動画と音声の圧縮方式

動画と音声の情報をぎゅっと小さくまとめる技術、エムペグツーについて説明します。正式には「動画と音声の符号化方式エムペグツー」と呼ばれ、その名の通り、動画と音声のデータを圧縮する技術です。この技術が登場するまでは、高画質の動画や高音質の音声を扱うには、膨大なデータ量が必要でした。そのため、限られた容量の記録媒体や、限られた帯域幅の電波では、高品質な動画や音声を扱うのは難しいことでした。しかし、エムペグツーによって状況は大きく変わりました。エムペグツーは、人間の目や耳には感じにくい情報を削ったり、似た情報をまとめて表現したりすることで、データ量を大幅に減らすことができます。例えば、ほとんど変化のない背景の部分や、人間の耳には聞こえにくい高音域や低音域の音などは、データ量を減らす対象となります。このように、エムペグツーは人間の知覚特性をうまく利用することで、画質や音質を損なうことなく、データ量を圧縮することを実現しています。エムペグツーは、様々な機器やサービスで利用されています。例えば、かつて広く普及した記録媒体であるデーヴィーディーでは、エムペグツーが標準の動画圧縮技術として採用されていました。また、電波を使って動画や音声を届ける地上デジタル放送でも、エムペグツーが活用されています。他にも、衛星放送やケーブルテレビなど、様々な場面でエムペグツーは活躍しています。エムペグツーは、私たちが日常的に高画質の動画や高音質の音声を楽しめるようになった背景には、このエムペグツーの技術が大きく貢献していると言えるでしょう。エムペグツーは、現代の映像、音声体験を支える重要な技術の一つです。
保存・圧縮

MP3: 音声圧縮技術の革命

音の情報は、そのままではデータ量が非常に大きく、情報のやり取りや機器への保存には適していません。そのため、データの大きさを小さくする圧縮技術は必要不可欠です。音声の圧縮技術は、人の耳の仕組みをうまく利用することで、音質への影響を抑えながらデータ量を減らす工夫が凝らされています。人は、全ての音を均等に聞いているわけではありません。例えば、大きな音のすぐ後に小さな音が鳴ると、小さな音はかき消されて聞こえにくくなります。また、特定の高さの音が他の高さの音に埋もれてしまう現象も起こります。これは、ある音によって他の音が聞こえにくくなる「マスキング効果」と呼ばれています。音声圧縮技術では、このマスキング効果を巧みに利用します。聞こえにくい音や、他の音に埋もれてしまう音は、データとして記録する必要がないため、削除することでデータ量を減らすことができます。圧縮の方法は様々ですが、大きく分けて「可逆圧縮」と「非可逆圧縮」の2種類があります。可逆圧縮は、圧縮前の状態に完全に復元できる方法です。データの欠落がないため、元の音質を完全に再現できます。一方、非可逆圧縮は、一部のデータを削除して圧縮するため、完全に元の状態には戻せません。しかし、可逆圧縮に比べて圧縮率が高く、データ量を大幅に減らすことができます。よく使われるMP3は、この非可逆圧縮を用いた音声圧縮技術の一つです。MP3は、人間の耳には聞こえにくい音の成分を特定し、そのデータを削除することで、音質の劣化を最小限に抑えつつ、大幅なデータ圧縮を実現しています。このように、人間の聴覚特性を考慮した高度な技術によって、高音質とデータ量の縮小を両立させているのです。
規格

動画圧縮のMPEGを詳しく解説

動画や音声を小さくまとめる技術のことを、エムペグと呼びます。正式には、「動く絵の専門家集団」という意味を持つ「Moving Picture Experts Group」と言い、その頭文字を取ってエムペグとなっています。この技術を生み出したのは、世界規模で規格を定める国際標準化機構と国際電気標準会議が共同で作った組織です。エムペグは、動画や音声を扱う場面で欠かせない技術となっています。例えば、動画を保存したり、インターネットで動画を配信したり、動画を探す時にも、この技術が役立っています。私たちが普段見ている動画の多くは、エムペグによって小さく圧縮されているおかげで、手軽に見ることが出来るのです。エムペグの技術は、様々な機器やサービスで使われています。例えば、映画などを楽しむためのデービーデーや、より綺麗な映像を見られるブルーレイディスク、テレビ放送やインターネットで動画を配信するサービスなど、幅広い分野でエムペグは活躍しています。エムペグには、「エムペグいち」「エムペグに」「エムペグよん」「エムペグなな」など、様々な種類があります。面白いことに、「エムペグさん」「エムペグご」「エムペグろく」といった番号は使われていません。これは、技術の進歩や、市場の需要の変化など、様々な理由が重なった結果です。このように、エムペグは動画や音声の圧縮技術において、とても重要な役割を担っています。私たちが手軽に動画を楽しめるのは、エムペグのおかげと言えるでしょう。
保存・圧縮

MP3:音楽データ圧縮の革命

音楽を小さなデータ量で楽しめるようにする技術、それがエムピースリーです。正式にはエムペグオーディオレイヤー3と言い、動画を小さくするためのエムペグ1という技術から生まれた音声専用の圧縮方式です。コンパクトディスクと同じくらいの音質を保ちつつ、ファイルの大きさを大幅に小さくできるのが特徴です。エムピースリーが登場する前は、音楽データをやり取りするには大きな容量が必要で、時間もかかっていました。しかし、エムピースリーのおかげで、インターネットを通じて音楽を簡単に送受信できるようになりました。音楽配信の広まりに大きく貢献した立役者と言えるでしょう。今では、音楽ファイルの代表的な形式として、世界中で広く使われています。エムピースリーは、人間の耳には聞こえにくい音を削ったり、似たような音をまとめて表現したりすることで、データ量を減らしています。そのため、元の音源と全く同じではありませんが、ほとんどの人は違いに気づかない程度です。この巧みな圧縮技術のおかげで、限られた容量でもたくさんの音楽を持ち運べるようになりました。近年は、より高音質でデータ量の少ない新しい音声圧縮技術も登場していますが、エムピースリーは今なお手軽さや互換性の高さから、多くの機器やサービスで利用されています。長年にわたり、音楽を楽しむためのなくてはならない技術として、私たちの生活を豊かにしてくれています。
ハードウエア

MD:懐かしの音声記録媒体

エムディーは、日本の会社であるソニーが開発した、音を記録するための円盤です。光と磁気の両方を利用して情報を記録する、少し変わった仕組みを持っています。この円盤は、カセットテープと同じように、音を録音したり、録音した音を再生したりすることができます。エムディーが登場したのは、西暦1990年代から2000年代にかけてです。小さくて持ち運びやすいことから、多くの人に利用されました。当時、音を記録する手段としてはカセットテープが主流でしたが、エムディーはカセットテープよりも音質が良いという特徴がありました。また、聞きたい曲の始めにすぐ移動できる、頭出し機能も備えていたため、音楽を聴くことが好きな人々に特に人気がありました。エムディーには、録音できる時間の長さが異なる、いくつかの種類がありました。60分、74分、そして80分録音できる円盤が販売されていました。さらに、それぞれの円盤には、録音時間を2倍、あるいは4倍に伸ばす特別な機能も搭載されていました。この機能を使うと、音質は少し落ちてしまいますが、一枚の円盤により多くの音を録音することができました。例えば、80分録音できる円盤に4倍録音の機能を使うと、最大で320分もの長い時間の音を記録することができました。このように、エムディーは、録音時間の長さを自由に調整できるため、様々な場面で役立ちました。会議の内容を記録したり、長い時間かかる音楽を録音したり、人々はそれぞれの目的に合わせてエムディーを使いこなしていました。
保存・圧縮

高音質をコンパクトに:Windows Media Audio

「ウィンドウズメディアオーディオ」は、マイクロソフト社が開発した音声の圧縮技術で、略して「ダブリューエムエー」と呼ばれています。この技術は、音楽などの音声データの大きさを縮小することで、記憶装置の容量を節約したり、通信にかかる時間を短縮したりすることを目的としています。開発の背景には、インターネットの普及が挙げられます。かつては通信速度が遅く、大きな音声データをやり取りするには多くの時間が必要でした。「ダブリューエムエー」は、限られた通信環境でもスムーズに音声データを伝送できるように開発され、普及期のインターネットにおける音楽配信に大きく貢献しました。この技術は、音声データの容量を小さくしながらも、音質の劣化を抑える工夫が凝らされています。そのため、小さな音声データでも、元の音源に近い高音質で音楽を楽しむことができます。この特徴から、記憶容量の限られた携帯音楽機器などにも活用され、多くの楽曲を持ち運べるようになりました。「ダブリューエムエー」は、音声データの圧縮技術だけでなく、その技術を用いて圧縮された音声データの形式や、圧縮・展開を行うためのソフトウェア全体の総称としても使われています。つまり、「ダブリューエムエー」形式の音声データは、「ダブリューエムエー」の技術を使って圧縮されており、「ダブリューエムエー」に対応したソフトウェアで再生できるということです。現在でも、音楽配信サービスや動画の音声部分などで広く利用されており、私たちの生活の中で身近な技術となっています。インターネットを通じて音楽を聴いたり、動画を視聴したりする際に、「ダブリューエムエー」が活躍している場面は多いでしょう。この技術によって、高音質の音声を手軽に楽しめるようになったと言えるでしょう。
保存・圧縮

データ圧縮の基礎: 不可逆圧縮とは

近ごろの情報化社会では、情報のやり取りが活発になり、動画や音楽、写真など、様々なデータが飛び交っています。これらのデータはどれも容量が大きく、そのままでは保存する場所がたくさん必要になったり、送受信に時間がかかったりしてしまいます。そこで重要となるのが、データの容量を小さくする圧縮技術です。圧縮技術には、大きく分けて元に戻せる圧縮方式と元に戻せない圧縮方式の二種類があります。この記事では、元に戻せない圧縮方式について詳しく説明します。元に戻せない圧縮方式は、データの一部を削除することで容量を小さくする仕組みです。例えば、人の目にはわからないような細かい色の違いや、聞こえにくい高い音などを削ってしまうことで、データのサイズを大幅に減らすことができます。この方式を使うと、元に戻せる圧縮方式よりも更に容量を小さくできるという大きな利点があります。しかし、一度削ってしまった情報は二度と戻ってこないため、画質や音質が少し劣化してしまう場合もあります。劣化の程度は圧縮率によって異なり、強く圧縮するほど画質や音質は下がりますが、容量は小さくなります。そのため、用途に合わせて適切な圧縮率を選ぶことが大切です。例えば、インターネットで動画を見る場合は、多少画質が落ちても読み込み速度が速い方が良いでしょう。しかし、大切な写真を保存する場合は、高画質を保つために、元に戻せる圧縮方式や、元に戻せない圧縮方式でも圧縮率を低く設定する方が良いでしょう。このように、元に戻せない圧縮方式は、容量を小さくする効果が高い反面、データの一部が失われてしまうという特徴を持っています。この特徴を理解した上で、状況に応じて使い分けることが大切です。
保存・圧縮

WMA:高音質を実現する音声圧縮技術

音声を伝えるデータは、そのままではサイズが非常に大きく、通信回線で送受信したり、機械に保管したりするには向きません。そのため、音声データを小さくする技術がこれまで数多く開発されてきました。マイクロソフト社が開発したWMAも、そのような音声データ縮小技術の一つです。限られた容量で、いかに音質を落とさずに済むか、という課題に挑戦して開発されました。インターネットが広く使われるようになるにつれ、音声データをやり取りする機会が増え、高音質を保ちつつ、効率よく縮小できる技術への期待が高まりました。このような時代の流れが、WMA開発の後押しとなったのです。WMAは、当時の他の音声縮小技術と比べて、小さいサイズで済む上に、音質も良かったため、急速に広まりました。特に、マイクロソフト社の基本ソフトであるWindowsに標準で搭載された再生ソフト「WindowsMediaPlayer」でWMAが再生できたことが、普及の大きな要因となりました。WindowsMediaPlayerがWMAに対応していたため、Windowsを使っている人は特別なソフトを用意しなくてもWMAを再生できたのです。この手軽さが、WMAの普及を加速させました。インターネットを通して音声の情報を届ける際の効率化に大きく貢献し、今あるような音楽配信の普及にも役立ちました。WMAは現在でも様々な場面で使われており、音声縮小技術の歴史の中で重要な位置を占めています。
保存・圧縮

画像と音の魔法、離散コサイン変換とは?

視覚や聴覚といった人の感覚は、情報の変化に敏感で、情報の細かな違いを見分ける力を持っています。一方で、情報そのものの絶対的な大きさには鈍感です。例えば、明るい場所で小さな光の変化を見つけることは難しいですが、暗い場所では小さな光でもすぐに気が付きます。この性質を利用した技術が、離散コサイン変換です。離散コサイン変換は、画像や音声、動画などのデジタルデータを、周波数成分と呼ばれる大小の波の重ね合わせとして表現する方法です。低い周波数は緩やかな変化、高い周波数は細かな変化に対応しています。そして、人間の感覚が鈍感な高い周波数成分をあえて省略することで、データ量を大幅に減らすことができます。写真を例に考えてみましょう。写真の色の変化は、空のような緩やかな変化と、木の葉のような細かな変化が混ざり合っています。離散コサイン変換を使うと、これらの変化を周波数成分に分けることができます。そして、人間の目にはあまり影響がない高周波数成分、つまり細かな変化の情報の一部を捨て去ることで、データ量を小さくするのです。このようにしてデータ量を小さくしても、残された低い周波数成分の情報から、元の画像のおおよその形や色を復元できます。そのため、見た目の印象は大きく変わらずに、データの容量だけを減らすことができるのです。まるで魔法のようにデータ量を操る離散コサイン変換は、現代のデジタル社会を支える重要な技術と言えるでしょう。
保存・圧縮

データ圧縮の仕組み:非可逆圧縮とは

電算機で扱う情報は、画像や音声、動画など、時に莫大な量になることがあります。そのため、情報を扱う際には、記憶装置の容量を抑えたり、通信にかかる時間を減らすことが重要になります。こうした課題を解決するために、様々な方法で情報を小さくする技術、すなわち圧縮技術が用いられています。圧縮技術には大きく分けて、元通りに復元できる可逆圧縮と、完全に元通りには復元できない非可逆圧縮の二種類があります。この文章では、後者の非可逆圧縮について、その仕組みや特徴、活用事例などを詳しく説明します。非可逆圧縮は、元データと完全に同じ状態に戻すことはできません。しかし、人間の目や耳では違いが分からない程度に情報を減らし、ファイルのサイズを大幅に縮小できます。例えば、音楽データの場合、人間の耳には聞こえにくい高い音や低い音の情報などを削ることで、音質の変化を最小限に抑えつつ、ファイルサイズを小さくします。画像データであれば、人間の目にはほとんど区別できないわずかな色の違いをまとめてしまうことで、データ量を減らします。このように、非可逆圧縮はある程度の情報を失う代わりに、高い圧縮率を実現できます。動画配信や音楽配信サービスなど、大量のデータを扱うサービスにおいては、この非可逆圧縮が欠かせません。もし非可逆圧縮技術がなければ、動画や音楽を高画質・高音質で配信するために、膨大な通信容量と時間が必要となり、現在のサービス提供は難しくなるでしょう。容量と通信速度の節約という点で、非可逆圧縮は現代の情報社会を支える重要な技術の一つと言えるでしょう。非可逆圧縮には、JPEG、MP3、AACなど、様々な種類があります。それぞれ得意とするデータの種類や圧縮方式が異なり、用途に応じて使い分けられています。これらの具体的な種類や仕組みについては、後の章で詳しく解説します。
保存・圧縮

高音質を実現する技術:ATRAC3

音声データは、そのままではサイズが大きいため、記録装置に保存したり、通信網を通して送ったりするには、データを小さくする技術が欠かせません。この技術を音声圧縮技術と言います。音声圧縮技術の中でも、音質を保ちつつ、データの大きさを効果的に小さくする技術が求められています。その中で、日本の電機メーカーである集電器工業が開発した音声圧縮技術の一つに、エーティーアールエーシー3と呼ばれるものがあります。エーティーアールエーシー3は、高音質を保ちながら、データの大きさを効率的に小さくすることを目指して作られました。これは、音楽を通信網で送ったり、持ち運びできる音楽再生機で使ったりする際に、限られた容量で質の高い音を楽しむために重要な技術です。これまでの音声圧縮技術では、音質が悪くなってしまうこともありました。しかし、エーティーアールエーシー3は、独自の計算方法を使うことで、高音質を保ちながら高い圧縮率を実現しています。エーティーアールエーシー3は、人間の耳には聞こえにくい音を特定し、その部分のデータ量を減らすことで、全体のデータ量を小さくしています。また、人間の耳が敏感な音の部分は、できるだけ劣化しないように工夫されています。このように、エーティーアールエーシー3は、限られた容量の中で高音質な音楽を楽しむための、重要な技術となっています。近年では、さらに高音質、高圧縮率を実現したエーティーアールエーシー3plus、エーティーアールエーシーアドバンストロスレスといった技術も開発され、様々な場面で活用されています。
保存・圧縮

ATRAC: 音を圧縮する技術

今では、様々な機器で手軽に音楽を楽しめるようになりました。かつては、持ち運べる音楽といえば、レコードやカセットテープが主流でした。これらのアナログ方式では、音は物理的な溝や磁気の変化として記録されます。しかし、これらの記録方式は、どうしても劣化しやすい性質がありました。何度も再生したり、保管状態が悪いと、音が変わってしまうことも珍しくありませんでした。時代が進み、音楽を数字のデータとして扱う技術が登場しました。これがデジタル化の始まりです。デジタル化により、理論上は何度再生しても音質が劣化しない音楽再生が可能となりました。しかし、高音質の音楽データは、容量が非常に大きいため、当時の限られた記憶装置には大量の楽曲を保存することができませんでした。そこで、音質をなるべく落とさずにデータ量を小さくする技術が求められるようになったのです。そのような中、ソニーが開発した技術の一つにATRAC(エーティーラック)があります。この技術は、人間の耳には聞こえにくい音の成分を特定し、その部分をデータから間引くことで、データ量を小さくする仕組みです。まるで、絵を描く際に、細かい部分ではなく、主要な部分だけを描き出すことで、少ない線で絵を表現するようなものです。人間の耳には聞こえにくい音は省いても、音質への影響は少ないため、限られたデータ容量でも高音質な音楽を楽しむことが可能になりました。特に、ATRACは、当時のデジタル音楽機器の普及において大きな役割を果たしました。記憶容量の少ない機器でも、たくさんの音楽を持ち運べるようになったことで、デジタル音楽は急速に普及していったのです。これは、まさに革新的な出来事でした。