MiniTool Software Ltd.が提供するこの記事では、非圧縮音声形式と圧縮音声形式の違いを比較します。また、可逆圧縮オーディオフォーマットと非可逆圧縮オーディオフォーマット(どちらも圧縮音声ファイル形式です)の比較についても説明しています。
音声形式とは?
音声ファイル形式は、コンピュータシステムにおいてデジタル音声データを格納するファイル形式です。オーディオデータ(メタデータを除く)のビットレイアウトは、音声コーデックフォーマットと呼ばれます。ビットレイアウトは、ファイルサイズを削減するために非可逆圧縮によって圧縮することができ、圧縮しないこともできます。データは、音声コーデックフォーマットの生のビットストリームであることがあります。ただし、通常は、コンテナフォーマットや、定義されたストレージ層を備えたオーディオデータフォーマットに埋め込まれます。
音声コーデックフォーマット vs オーディオコンテナ vs オーディオコーデック
コーデックは生の音声データをエンコードおよびデコードし、こうしたエンコードされたデータは(通常は)コンテナファイルに格納されます。ほとんどのオーディオファイル形式は、オーディオエンコーダによって作成された単一の種類の音声エンコードデータのみをサポートしますが、AVIやMatroskaなどのマルチメディアコンテナ形式は、複数の種類の音声およびビデオデータをサポートします。
音声ファイル形式の種類
一般的に、音楽のファイル形式には3つの分類があります。
#1 非圧縮音声形式
以下は一般的な非圧縮オーディオファイル形式です。
- Waveform audio file format(WAV)
- Audio Interchange File Format(AIFF)
- Au file format(AU)
- Raw header-less pulse-code modulation(PCM)
- Broadcast wave format(BWF)
- Direct Stream Digital(DSD)
#2 可逆圧縮オーディオフォーマット
可逆圧縮音声フォーマットは、情報を失うことなく、より少ないスペースにデータを保存できます。そして、元の非圧縮データは、圧縮バージョンから再作成できます。
非圧縮の音声ファイル形式は、音と無音の両方を単位時間あたり同じビット数でエンコードします。1分間の非圧縮の完全な無音をエンコードすることと、1分間の非圧縮の音声をエンコードすることのファイルサイズは同じです。
ただし、1 分間の完全な無音を可逆圧縮フォーマットでエンコードすると、スペースをほとんど占有しないファイルが生成されます。したがって、ロスレス音声ファイルは、非圧縮音声ファイルよりもサイズが小さくなります。
したがって、可逆音楽形式は、良好な音質を維持しながら処理時間を短縮させることが目的です。
一般的なロスレス圧縮/可逆圧縮オーディオファイル形式には、以下の種類があります:
- Free lossless audio codec (FLAC)
- WavPack lossless
- Monkey’s Audio (.APE)
- Apple lossless audio codec (ALAC) / Apple lossless encoder (ALE)
- MPEG-4 audio lossless coding (ALS)
- Adaptive transform acoustic coding (ATRAC) advanced lossless
- Dolby TrueHD
- DTS-HD master audio
- HD-AAC (MPEG-4 scalable to lossless or MPEG-4 SLS)
- OptimFROG
- Original sound quality (OSQ)
- RealAudio lossless
- True audio (TTA)
- Windows media audio (WMA) lossless
上記の可逆音声形式の圧縮比は約2:1です。つまり、同じサイズの生の音声データに対して、これらの形式でエンコードされたファイルは、PCM形式でエンコードされたファイルの半分のサイズになるということです。
#3 非可逆圧縮オーディオ形式
非可逆圧縮(ロッシー圧縮)音声形式は、音声ファイルのサイズをさらに圧縮できます。オーディオ情報の一部を削除し、データを簡略化します。その結果、音質も劣化することになります。
しかし、多くの技術は、知覚される音質に最も影響を及ぼさない部分を除去するために応用されます。そして、これらの技術は、プロセス中に追加される可聴ノイズの生成も最小限に抑えます。
- MPEG-1, 2, 2.5 audio layer III (MP3)
- MPEG-1, 2 audio layer II (MP2)
- Advanced audio coding (AAC)
- Dolby digital (Dolby AC-3)
- Multi-band excitation (MBE)
- Adaptive multi-rate audio codec (AMR)
- Adaptive multi-rate wideband (AMR-WB) / G.722.2
- Extended adaptive multi-rate wideband (AMR-WB+)
- AptX
- Adaptive transform acoustic coding (ATRAC1)
- ATRAC3
- ATRAC3plus
- BroadVoice (BV16 & BV32)
- Codec2
- Dolby digital plus / enhanced AC-3 (E-AC3)
- Enhanced aptX (E-aptX)
- Global system for mobile communications half rate (GSM-HR or GSM 06.20)
- Global system for mobile communications full rate (GSM-FR or GSM 06.10)
- Global system for mobile communications enhanced full rate (GSM-EFR or GSM 06.60)
- High-efficiency advanced audio coding (HE-AAC)
- Harmonic vector excitation coding (HVXC)
- Internet low bitrate codec (iLBC)
- Internet speech audio codec (iSAC)
- Master quality authenticated (MQA)
- Musepack (MPC)
- Opus
- RealAudio
- SILK
- Siren 7
- Siren 14
- Siren 22
- Speex
- Variable-rate multimode wideband (VMR-WB)
- Vorbis (Ogg)
- WavPack lossy
- Windows media audio (WMA) standard
- Windows media audio (WMA) Pro
ほとんどの非可逆音楽ファイル形式は、ある程度の範囲の圧縮率を提供しており、通常はビットレートで測定されます。ビットレートが低ければ低いほど、ファイルは小さくなり、品質も悪くなります。
関連記事: