遥かなる「知」平線

歴史、科学、芸術、文学、社会一般に関するブログです。

オーディオの再開

良い絵や良い音楽を鑑賞することは、創作におけるインフラとなる。
茂木健一郎『脳と創造性』)

机の上であれこれ考えても、たいてい失敗する。
行動と経験だけが、洞察力を高めてくれる。
(中村繁夫『放浪ニートが、340億社長になった』のコピー)

物事から意味が生まれるとき、一つのものが何か特定の意味を持つのではなく、
何かと何かとの差異が意味を生み出す。
(フェルディナンド・ソシュール

f:id:monmocafe:20210601133609j:plain


アレクサンドル・デュマを書こうか、それとも三台目のPCについて書こうかと思っているうちに、筆者の関心はオーディオに向かってしまった。
大学時代から集めたLPレコードも、CDが出てからはレコードの時代は終わったと思い、引っ越しの時全部捨ててしまった。

バッハベートーヴェンモーツアルトなどのクラシックやロイド・ウェーバーポップスなど大きな段ボール箱一箱分のLPレコードだったのだが・・・、今は捨ててしまったことを少し後悔している。

初代のステレオはイオニア製で、チューナー、アンプ、レコードプレーヤー、カセットデッキ、スピーカー、後にCDプレーヤーを加えたのだが、それももう30年近く前に捨ててしまった。仕事も忙しくなり、オーディオをやる余裕が無くなってしまったというのが正直なところだった。

そして家には、それまで買ったCDが大量に残ったまま、たまにベームモーツアルトをPCで再生したり、PCに取り込んだ音源を聴くぐらいだったのだが、PCや安価なPCスピーカでは、いい音は期待できるはずもなかった。

そして、ハイレゾの時代である。
持っているCDの9割は、PCに取り込んである。
これを再び、いい音で聴けないものだろうか、と思ったのだった。

f:id:monmocafe:20210601141035j:plain


というわけで、再びオーディオの世界の扉を開いてみることにした。
「オーディオの『沼』へようこそ」というわけだ。
が、今や音響世界は、劇的に変化してしまっていた。

音響メーカーのパイオニアオンキョーダイヤトーンサンスイなどはもう市場からほぼ姿を消してしまっていて、まだ頑張っている日本のメーカーは、ソニーヤマハなど数が少なくなってしまった。
1980年代に元気のあった音響メーカーも鉄鋼、造船などの重工業や家電、半導体、コンピュータ産業の衰退と期を同じくして先細りになっていった。EV自動車の時代になれば、現在は日本の基幹産業である自動車産業も衰退していくのではないかと心配してしまう。
いったい、日本には何が残るのだろう、と思わざるを得ない。

この時代の現実を受け入れて、興味を持ったことに取り組むことしか筆者にはできないのだが・・。
それはともかく先ずは、オーディオについての基礎知識から見ていこう。

ハイレゾ音源】
High Resolution(高い解像度)を意味する「ハイレゾ」の定義は下記のようになっている。

電子情報技術産業協会JEITA)
サンプリング周波数」「量子化ビット数」のどちらかがCDスペックを超えていれば「ハイレゾ」と呼んでいい。

日本オーディオ協会JAS)
「サンプリング周波数」/「量子化ビット数」が、96KHz/24bit以上、又はDSD
アナログ信号では40kHz以上。
スピーカーなどの再生機器は40kHz以上が、実際に出ていればいい。
この定義を満たしているデジタル音源、デバイスJAS「Hi-Res」マークを承認している。

ということは、ハイレゾの厳密な規格があるわけではなく、割と緩い定義のようだ。

ハイレゾ理解のための基礎知識】

・「サンプリング」とは、アナログ信号から一定の時間間隔で区切ってデータを採取すること。この時間間隔を「サンプリング周波数」と呼びHz(ヘルツ)という単位で示す。1秒に1回が1Hz。
CDは44.1kHzだから1秒間に44.1×1000=44100回データ採取を行う。
サンプリング周波数の数値が高い(細かい時間間隔)ほど高音質。

44.1/48/96/192kHzが一般的。

・「量子化」とは、標本化で採取されたデータを数値にすること。
この数値の大きさを「量子化ビット数」と呼ぶ。
信号の振幅幅(縦方向)を四捨五入して数値に変換し、これで信号の振幅を何段階で表現するかを示すことができる。単位はbit(ビット)

量子化ビット数」の数値が高いほど高音質で、振幅の大きさがどれだけ細かく記録されるかが、音の解像度に直結する。16/24/32ビットが一般的。16ビットでは2の16乗で65536段階で表現することが出来る。
CDは16bit。

DSDと言われる形式のデジタル音源は、振幅としては1Bit固定(0か1、オンかオフ)で、周波数の疎密で音を表現する。振幅が固定されるため、音の大小を記録する解像度はサンプリング周波数の時の量子ビット化の端数処理がなくなり、高音質とされる。
情報量を増やすためには、オンオフの時間単位をより短くすることで対応する。
そのため、周波数の大きさが情報量に直結する。2.8MHz/5.6MHz/11.2MHzが使われている。

f:id:monmocafe:20210601134832j:plain
音の波形データで扱える最大/最小音の比率「ダイナミックレンジ」量子化ビット数で決まる。
人間の聴覚が持つダイナミックレンジは0~120dB
量子化ビット数が16bitなら96dB、24bitなら144dB、32bitなら192dB(6dB/bit換算)。

周波数はサンプリング周波数で決まる。周波数はサンプリング周波数の約半分となるので、人間の聴力の範囲をカバーする周波数帯域は、20Hz~20kHz

ダイナミックレンジと人間の聴力の範囲(周波数)の関係にハイレゾ音源を被せると下記のようになる。

f:id:monmocafe:20210601135012j:plain
つまり、人間の聴力をカバーするハイレゾ音源は、[24bit/48kHz]DSD[1bit/2.8MHz]と言うことになる。CDの量子化ビット数は16bitだからダイナミックレンジとしては96dB。人間の聴力は120dBまで聴けるので、CDでは人間の能力をカバーできていないことになる。

以上から、データ量がオーディオCD以上であること、量子化ビット数が24bit以上であることを踏まえ、人間の能力をカバーできる「サンプリング周波数が44.1KHz以上かつ量子化ビット数が24bit以上」の音源が、ハイレゾと考えていい。

【アナログ音声の圧縮と保存形式】
アナログ信号を量子化し、得られた数値を特定の形式にすることを「符号化」という。
オーディオCDで用いられる音声データの形式を「リニアPCM」といい、アナログ信号をそのままデジタルの信号に符号化して保存する。これで、全く加工されていない本来の音(原音)として残すことが出来る。

但し、リニアPCM録音された音声は、全く圧縮されていないので非常に大きな容量になり、人間が聞き取りにくい部分のデータを間引くことで音質の劣化を抑えながら容量を圧縮して保存するのが現実的かつ実用的になる。

圧縮には2通りある。

可逆圧縮(Lossless)
リニアPCMを符号化しデータをコンパクトにする。再生時にリアルタイムに元のリニアPCMへ変換する。
元のデータに完全に復元できる圧縮方法なので、理論上音質劣化はない。

非可逆圧縮(Lossy)
符号化の時、可聴帯域外の音(人間が聞き取れないとされる高周波数帯)を除去する。ハイレゾの利点とされるリアルな音場、奥行きの表現は、可聴帯域外の音の存在が大きく影響していると考えられているため、非可逆圧縮で処理された音はハイレゾに分類されない。元のデータには復元できない処理を行う代わりに高い圧縮を行う方法。

f:id:monmocafe:20210601135417j:plain

Bluetoothコーデック】
音楽をヘッドセットやイヤフォンで聴くときは、Bluetoothを使うことが多い。
この場合の音質は、Bluetoothコーデックに依存する。
コーデックとは、Bluetoothで音声を無線伝送する際に使用する「音声圧縮変換方式」のこと。
ヘッドセットなど、オーディオ接続プロトコルA2DPに対応しているコーデックは下記。

f:id:monmocafe:20210601135603j:plain

【オーディオハード機器
ではオーディオシステムを構成するハード機器にはどのようなものがあるかを次に見ていく。

ネットワークプレーヤー
LAN環境に設置して、インターネット音楽配信サイトからストリーミングサービスを受けたり、NASに保存するデジタル音源を、既存のオーディオシステムに受け渡したりする。スマホタブレットでコントロールして音楽を聴くことが出来る。インターネット、LAN環境にあるデジタル音源をPCを使わずに楽しむことが出来る。

USB-DAC(Dgital Anarog Connbater)
デジタル音源をきちんと聞こうと思えばアンプを介してスピーカーに音を送ることになる。音源はデジタルだから、スピーカーにはアナログに変換して信号を送らなくてはならない。
デジタルをアナログに変換し、アンプにアナログ信号を送る機器がUSB-DACである。

アンプ
アンプには入力の切替や音質の調整を行うプリアンプ、信号を増幅してスピーカーに送るパワーアンプがある。多くのアンプはこの2つの機能を一緒にしたプリメインアンプとして製品化されている。

スピーカー
スピーカーには様々なタイプがあるが下記に整理できるようである。

Bluetoothスピーカー
主にスマホなどの音源からBluetoothで音楽を聴くようなスピーカー。安価で手軽に持ち運べてバッテリー内臓が多いので野外に持ち出せる。但し、近距離(ニア・フィールド)で音源と1:1で使う。音質はコーデックに依存する。

ネットワークスピーカー
ルーターに接続(Wi-Fi接続が多い)してネットワーク上のNAS音源などを聴くようなスピーカー。Bluetoothよりは長い距離で利用でき音質もいい。ハイレゾに対応したものもある。

パッシブスピーカー
昔からあるスピーカーで、アンプからの信号を受けて人が聞く音として出力する。

アクティブ(パワード)スピーカー
DACやアンプを内蔵したスピーカーなので、DACやアンプを別途購入しなくてもいいし、移動も楽。しかも多くは小型だからPC周辺に設置してニア・フィールドで使用することが多く、今はこれが主流かも知れない。

ヘッドフォン/イヤフォン
昼間スピーカーで音楽を聴いていても、夜になればさすがにスピーカーで聴くのは遠慮してしまう。ヘッドフォンがあれば周りを気にすることもない。Bluetoothで聴く場合の音質はコーデックに依存する。

CDプレーヤー
CDがあるならCDプレーヤーも必要な場合がある。CDをPCに取り込む(リッピング)方法によっては音質が劣化する。高音質でそのままファイルに保存しようとすれば、ファイル容量が増えPCストレージを圧迫する。なので、そのままCDで聴くほうがいい場合はCDプレーヤーを用意する。

【音楽再生ソフト】
Windows標準のメディアプレーヤーは、他の複数の音声を集めて処理を行うカーネルミキサーを経由するので音質が劣化するとされている。

WASAPI排他モード
音楽再生ソフトの中に、カーネルミキサーを回避して音質の劣化を防ぐ処理(WASAPI排他モード)を行っているものがある。WSAPI排他モード使用中は他の音は出ない。

ASIO(Audio Stream Input Output)
同じく、カーネルミキサーを回避するものにASIOがある。
これはサウンドドライバーの規格の一つで対応デバイスのドライバーが対応していないと使えない。

DSDの音楽再生
DSD再生に対応したUSB-DACでは、Windows向けに「ASIO対応ドライバー」を提供している。
DSDの再生には二つの方式がある。
DoPDSD Audio over PCM Frames);DSDデータを24ビットのPCMデータに載せて出力(WindowsのWASAPIはDoP方式)
ASIO;PCMに変換せずそのまま再生(DSDネイティブ再生
PCMに変換しないのでデータ効率に優れ、DACの能力をフルに引き出せる。

WASAPIとASIOのソフトウェア上の位置づけは下記URLを参照のこと。

pcde24bit192khz.blogspot.com

音楽再生ソフトの導入
上記を理解したうえで、音楽再生ソフトを導入することになる。

foobar2000;無料、代表的な音楽再生ソフト、日本語パッチ一部適用、ASIOはプラグインで対応
MusicBee;無料、日本語選択可、使い勝手がいい、DSD形式のファイルは一部しか扱えないようだ。
「設定」⇒「プレーヤー」の「出力」に「WASAPI(Exclusive)」、「サウンドバイス」に「スピーカー(USB AUDIO DAC)」選択して「保存」。これでカーネルミキサーを回避できる。
TuneBrowser;Free版は500曲まで。
など多数の再生ソフトがある。

f:id:monmocafe:20210601140817j:plain

今日的なオーディオ環境としては以上のようなものである。

30年以上も前なら、家電としてアンプやスピーカーなどを買ってきてコードをつなげれば音を出すことが出来た。が、アナログ音楽情報がデジタル音源として実用的なハンドリングができる圧縮が可能となり、コンピュータとネットワークが扱うことのできる素材となったとき、オーディオシステム・機器もまたコンピュータ化したと言っていい。

さて、こうしたオーディオ環境についての基礎知識を踏まえ、いかなるシステムを構築したいのか。
それを次回のテーマと致しましょう。