オーディオコーデック

記事数:(2)

保存・圧縮

AAC:高音質を実現する革新的音声圧縮技術

音は空気の振動が波となって伝わっていく現象であり、コンピュータで扱うためには、このアナログ信号をデジタル信号に変換する必要があります。デジタル化した音の情報はそのままではデータ量が膨大になるため、容量を小さくして扱いやすくする技術が音声圧縮技術です。音声圧縮技術には、大きく分けて二つの種類があります。一つは「非可逆圧縮」と呼ばれる方式で、元に戻せない情報を取り除くことで、ファイルサイズを大幅に縮小します。人間の耳には聞こえにくい高い音や低い音、あるいは大きな音に隠れてしまう小さな音といった、知覚できない音の情報は思い切って削ってしまうのです。この方式では、音楽配信サービスなどで使われているMP3やAACなどが代表的です。高い圧縮率を実現できる一方、どうしても元の音と完全に同じようには再生できないという欠点があります。もう一つは「可逆圧縮」と呼ばれる方式です。こちらは、圧縮前のデータと圧縮後のデータを完全に一致させられる方式です。音声データの中に同じパターンが繰り返し現れる場合、そのパターンを短い記号に置き換えることでデータ量を減らします。例えるなら、何度も繰り返す言葉の代わりに記号を使って文章を短くするようなものです。この方式は、圧縮率は非可逆圧縮に比べると低いものの、元の音質を全く劣化させずに保存・再生できるという利点があります。会議の音声記録や、音楽制作の現場などで、音質を落とせない場合に活用されています。このように、音声圧縮には様々な方式があり、それぞれに長所と短所があります。用途や目的に合わせて最適な方式を選ぶことが重要です。例えば、音楽を楽しむだけなら、多少の音質劣化を許容してファイルサイズを小さくできる非可逆圧縮が適しています。一方で、重要な会議の内容を記録する場合などは、音質を優先して可逆圧縮を選ぶべきでしょう。音声圧縮技術は、限られた記憶容量や通信帯域を有効に活用するために、これからも進化し続けていくでしょう。
保存・圧縮

MP3: 音声圧縮技術の革命

音の情報は、そのままではデータ量が非常に大きく、情報のやり取りや機器への保存には適していません。そのため、データの大きさを小さくする圧縮技術は必要不可欠です。音声の圧縮技術は、人の耳の仕組みをうまく利用することで、音質への影響を抑えながらデータ量を減らす工夫が凝らされています。人は、全ての音を均等に聞いているわけではありません。例えば、大きな音のすぐ後に小さな音が鳴ると、小さな音はかき消されて聞こえにくくなります。また、特定の高さの音が他の高さの音に埋もれてしまう現象も起こります。これは、ある音によって他の音が聞こえにくくなる「マスキング効果」と呼ばれています。音声圧縮技術では、このマスキング効果を巧みに利用します。聞こえにくい音や、他の音に埋もれてしまう音は、データとして記録する必要がないため、削除することでデータ量を減らすことができます。圧縮の方法は様々ですが、大きく分けて「可逆圧縮」と「非可逆圧縮」の2種類があります。可逆圧縮は、圧縮前の状態に完全に復元できる方法です。データの欠落がないため、元の音質を完全に再現できます。一方、非可逆圧縮は、一部のデータを削除して圧縮するため、完全に元の状態には戻せません。しかし、可逆圧縮に比べて圧縮率が高く、データ量を大幅に減らすことができます。よく使われるMP3は、この非可逆圧縮を用いた音声圧縮技術の一つです。MP3は、人間の耳には聞こえにくい音の成分を特定し、そのデータを削除することで、音質の劣化を最小限に抑えつつ、大幅なデータ圧縮を実現しています。このように、人間の聴覚特性を考慮した高度な技術によって、高音質とデータ量の縮小を両立させているのです。