音声のデジタル化とは

現実の音は空気の振動(アナログ信号)です。これをデジタルファイルにするには「1秒間に何回測定するか」(サンプルレート)と「測定をどれくらいの精度で行うか」(ビット深度)を決める必要があります。

この2つの設定が音質の基本を決めます。

サンプルレートとは

サンプルレートは1秒間に音声を何回サンプリング(測定)するかを表す値です。単位はHz(ヘルツ)またはkHz(キロヘルツ)。

一般的なサンプルレートの比較

サンプルレート 主な用途
44,100Hz(44.1kHz) 音楽CD・MP3・iTunesの標準
48,000Hz(48kHz) 映像・放送・動画の標準
88,200Hz(88.2kHz) 音楽のハイレゾ録音
96,000Hz(96kHz) 映像のハイレゾ録音

ナイキストの定理

サンプルレートの半分の周波数まで収録できます(ナイキスト周波数)。

  • 44.1kHz → 22.05kHzまで(人間の可聴域 20kHz をカバー)
  • 48kHz → 24kHzまで(余裕を持ってカバー)

どちらも人間の耳で聞こえる範囲(20Hz〜20kHz)をカバーしています。44.1kHzと48kHzの音質差は実際の使用では「ほぼ聴き分けられない」レベルです。

イベント・配信収録では48kHzが標準

映像を伴う収録には48kHzを使います。 これは業界標準です。

理由:映像ファイルは内部的に音声を48kHzとして扱うものが多く、44.1kHzで収録した音声を動画に埋め込むと変換処理が発生します。変換には品質の劣化と処理の手間が生じます。

統一ルール: ミキサー・レコーダー・DAW・OBSすべてを48kHzに統一します。44.1kHzが混在するとピッチズレ(音程がわずかにずれる)の原因になります。

ビット深度とは

ビット深度は音の大きさをどれだけ細かく記録できるかを示します。ダイナミックレンジ(最大音量と最小音量の差)に直結します。

ビット深度の比較

ビット深度 ダイナミックレンジ 主な用途
16bit 約96dB CD・一般的な配信・WebAudio
24bit 約144dB プロ録音・放送・イベント収録
32bit float 理論上の上限なし DAW内部処理・ハイエンド録音

ダイナミックレンジが重要な理由

イベント会場では音量が予測できません。静かなトークから大きな拍手まで、音量が大きく変動します。

  • 16bit: 音が大きすぎると「クリップ(歪み)」が起きる。やり直せない
  • 24bit: 余裕のあるヘッドルームがあり、後から音量を調整しても音質が保たれる

現場では収録レベルを少し低めに設定しておくことで、突発的な大音量でのクリップを防げます。24bitなら低いレベルで録っても編集時に引き上げても品質が保たれます。

32bit float の特徴

一部の最新レコーダー(ZOOM F3・F6等)は32bit floatに対応しています。

32bit floatは「クリップしない」という強力なメリットがあります。どんな音量でも後から調整できるため、現場でのレベル設定ミスが問題にならなくなります。

機材の設定を統一する

イベント収録では複数の機材を使います。設定が統一されていないと問題が起きます。

チェックリスト:

  • PAミキサーのサンプルレート:48kHz
  • レコーダー(ZOOM等):48kHz / 24bit
  • OBSの音声設定:48kHz
  • 動画編集ソフト(Premiere等)のプロジェクト:48kHz

まとめ

イベント・配信収録の基本設定は48kHz / 24bitです。44.1kHzは音楽CD向けの規格で、映像収録では使いません。ビット深度は24bitにしておくことで、音量調整の余裕が生まれ、後編集での品質劣化を防げます。機材全体でサンプルレートを統一しておくことが、ピッチズレを防ぐ最重要ポイントです。