iFI-Audio.jp News and Blog: iFIオーディオ主任エンジニア、トルステン博士かく語りき（4）連載インタビュー付録：PCM vs DSD

実際に何が“ネイティブDSD”、またはネイティブPCMを構成しているのかは、重要な問題になっています。PCMとDSDは根本的に異なるフォーマットです。このことはPCMとDSDのそれぞれのデジタル化された波形の素の状態を観察すればはっきりと分かります。

それぞれのフォーマットは異なる長所と短所を備えています。一つのフォーマットからもう一つのフォーマットに変換する際は必ずデータの損失が発生します。さらに悪いことに、そのプロセスの中で、私たちはひとつのフォーマットを並外れたものにしているものを何でもかまわず取り除き、その上同時にもう一方のフォーマットの限界を押しつけてしまうという傾向があります。結果として、私たちは両方のベストが得られるどころか、片方のベストすら享受することなく、両方の“悪いところ取り”をしてしまいます。

はじめに少しばかり歴史的なお話をしてしまいますが、お付き合いください。

デジタルオーディオはPCM（日本のEIJA標準規格による14と16bit PCMが主流ですが、Deccaが採用していた標準外規格もありました）とビットストリームシステム（基本的なところで似ていますが、デジタルオーディオプロセッサー「DBX Model 700」のDSDシステムよりも性能は劣っていました）の2つでスタートしました。

元もとCDにとって標準のシステムであるPCMは、音楽信号を毎22.7マイクロ秒（44.1kHzのサンプリングレート）の速度で読み取り、65,536通りの値（216 – 16 bitのバイナリ偏差値）から一つの値に変換します。つまりどのタイミングにおいてもリファレンスと比較した絶対値があって、ちょうどアナログシステムのようになっています。キーポイントになる相違点は、継続的な波形がなく、元の波形に近い矩形波となっていて、アナログローパスフィルターにより矩形波を滑らかなものに変換しているところです。

もし44.1kHz/16BitのPCM信号を可視化するなら、１秒間で44,100ピクセルの幅と、65,536ピクセルの高さ情報により画像を表現することができます。PCM信号は振幅に対して常に絶対的な精度と解像度を備えています。欠点としては、厳密に再エンコードする際に、アナログ信号にローパスフィルターをかけなければならないのですが、そうすると、付随するフェーズ及びタイムドメインのエラーと、きわめて粗いタイムドメイン解像度を伴うことになるのです。

44.1KHz PCM digital audio system (e.g. Sony PCM F1)Mr. Loesch’s own Sony PCM F1 portable recording system, originally owned by Alan Parsons

比較してみると、DBXビットストリームシステムは、仮に信号が最終のサンプリング値から上下に変動した場合、1.55マイクロ秒ごとに値を特定します。これはDSDの約1/4となるサンプリングレートである644kHz に相当します。つまりそれぞれのポイントで絶対値はなく、22.7マイクロ秒の長さを持つタイムウインドウ（これはPCMの44.1kHzウインドウに相当します）の中で、PCMの65536という値に比べて、わずか14.6という値のみが処理されるのです。

ノイズシェーピングという技術を使えばより多くの値を処理できますが、タイムウインドウをもっと長くする（平均値を適用する）必要が生じます。DSDのより高いサンプリングレートはある程度この問題を改善しています。

644kHzのDBXビットストリームシステムを可視化したいと思えば、１秒で644,000ピクセルの幅と2ピクセルの高さの画像が得られるでしょう。シングルビット/ビットストリームシステムは振幅のドメイン情報において正確性と解像度に欠ける傾向があるものの、タイムドメイン情報における正確性には富んでいます。おまけにこのビットストリームシステムは、PCMで必要になる急勾配なアンチエイリアスフィルターが不要です。ただローパスフィルターはやはり必要です。

Classic Bitstream digital audio system - dbx Model 700 Bitstream AD & DA Processor

どちらのシステムも、再生側である種のローパスフィルターが必要であり、可聴帯域外ノイズとフェーズ/タイムドメインエラーの間で何を生かし何を犠牲にするかについての、様々な選択要素があります。

このPCMとビットストリームの“フォーマット戦争”において、第1ラウンドはPCMが圧倒的勝利を収め、デジタルオーディオの事実上の業界標準となりました。その後にはCDやDVDの音声標準にもなったのです。DBX Model 700が歴史の片隅に追いやられ、ほとんど忘れられてしまったのに対して、ソニーのセミプロ向けポータブル機「PCM-F1」や、スタジオプログレードの「PCM1630」などの機材は、デジタル録音の草創期に業界標準のデジタルプロセッサーになりました。

appx. late 90’s digital audio system – single-bit ADC to CD or DVD to single-bit DAC in 16 Bit / 44KHz or 24Bit / 96KHz

リアルPCMによるオーディオ録音・再生は録音中にマルチビット処理によるアナログ→デジタル変換（ADC）を行い、（再生時に）デジタル→アナログ変換(DAC)を行っていました。このようなマルチビット処理のコンバーターは複雑で処理に時間がかかるため、製造コストも高く付きますが、デジタルオーディオの初期10年間には一世を風靡しました。

これと比較すると、シングルビット/ビットストリームタイプのADCとDACは、ずっと簡易な構造であるため製造コストも安価に抑えられます。だから90年代初頭には、ハードウェア（ADCとDACチップ）の市場はシングルビット/ビットストリームコンバーターに流行が移り、リアルPCMからは遠ざかっていったのです。

Crystal CS4303 Delta Sigma DAC and Asahi Kasei AK5327 Delta Sigma ADC

でも例外は存在しました。1990年代終わり頃には最後の砦となっていたPacific Microsonic社がマルチビット処理のADCシステム「Model 1(そしてそれに続いて非常によく似たタイプのModel 2)」を製造していました。オーディオ用マルチビットDACは何とか持ちこたえて、今日でもまだ究極のUltra-Fidelityな再生システムに使われています。もっとも、低コストの製品についてはシングルビット/ビットストリームデバイスの機器が大半ですが。

今やほとんどのADC/DACがシングルビット/ビットストリーム機となりましたが、AD処理されたシングルビット/ビットストリーム信号はCDに収録するためにはPCMに変換される必要があり、さらにCDのPCM信号をシングルビット/ビットストリーム対応のDACで出力するには、CDのPCM信号を再びシングルビット/ビットストリームに変換し直さなければなりません。このように2度手間となる変換処理は最悪のシナリオです。情報ロスが2回生じるため、2度ものダメージを被った音源がつくられます。同じく、いわゆるラウドネス戦争の影響もこれにかさなり、商用音楽レコーディングの品質は1990年中頃から2000年中頃までの間に、非常に品質が落ちてしまいました。

そのため、1990年代半ば以降にリリースされた“PCM”録音は、“HD”PCMと書かれていながらも、実際にはシングルビットADC（つまりDSDとよく似た）により録音され、編集、マスタリング、リリースの際にPCMに変換されていたのです。

Yamaha 01V Digital Mixer with single-bit ADC’s and 16 Bit PCM output to CD to Marantz CD-Player with single-bit DAC

事実のところ、Pacific Microsonic 社の「Model 1」、または「Model 2」で録音された音源だけが唯一、本物のHD PCMであると考えられ、非常に珍しいコンバーターであるがゆえに、録音タイトルも同様に数は多くありません。したがって、わずかな人々だけが真の“PCM”オーディオを聴いていて、さらに稀少な方々が“HD”のPCMオーディオを聴いていたというのが、悲しいけれど本当のことなのです。

appx. late 90’s HD PCM digital audio system – Pacific Microsonic Model 2 Studio 24-Bit / 176.4KHz Multi-bit AD/DA Processor with HDCD

90年代の終盤のこういった問題を考えて（そしてその他のより商業的な理由により）、ソニーとフィリップスはDSDという名称で、商用ビットストリームフォーマットを（再度）起ち上げようとしました。まずはアーカイブ用として、続いてスーパーオーディオCD（SACD）と呼ばれるCDに代わるオーディオフォーマットをつくりました。DSDはシングルビットからPCMへの変換、そしてその逆の変換手順を省略して、直接シングルビット/ビットストリームで録音します。このようにシングルビット/ビットストリームでAD変換したソースをシングルビット/ビットストリームでDA変換して再生するDSD/SACDは、CDからの大きな進化となりました。

appx. late 90’s DSD digital audio system – SACD

しかしこのビットストリームフォーマットはマーケティング的な観点からみれば、やはり成功したとは言えないものでした。この間に、アナログレコードにすら後塵を拝するほどSACDの売り上げは停滞していました。

DVDや動画側でより高いサンプリングレート、ビット深度による収録が標準化すると、ハードウェア産業は“CDを超える”品質を持ったAD/DA変換への解決法を迫られるようになります。彼らはそもそもシングルビット/ビットストリームの技術が適していないという結論に至り、“マルチビット”変換に相当する数ビットをビットストリーム変換と組み合わせた、様々な、いわゆる“ハイブリッド”システムが新しい標準となりました。

appx.2013 typical DSD revival digital audio system – “DSD capable DAC”

この技術を使ったADC/DACの中で最も良いものは、デジタル変換における事実上の最新スタンダードになりました。しかしながら、もちろん問題もあります。今や6〜8ビットで駆動して、256または512回のオーバーサンプリング処理に対応するADCがあります。同様のスペックのDACもあります。これは、おそらくは24bit駆動で768kHzのマルチビット能力を持った真のマルチビッットADCやDACとまったく同じではないでしょうが、原理的には、従来のシングルビット/ビットストリーム機器の性能ははるかに凌ぐポテンシャルを持っています。

しかしこういった技術を使用したADCとDAC間の “転送”は、DSDまたはPCMの可変速度処理にのみ対応しています。この新しいシステムに“ネイティブ”のフォーマットはないので。これは、DSDによって解決しようとしたのと同じ問題を、より高次ながらも、再度つくりだしました。録音をする際にはDSDかPCMに変換を行いますが、どちらの場合もオリジナル録音だけが持っているクオリティを多少とも失ってしまいます。

もしも352.8kHz/24bitのDXD-PCM信号を、1bit/2.822MHzのDSDに変換するとしたら、PCMフォーマットで可能な振幅情報の99.96％ほどを捨てなければならず、また一方でDSDで可能なタイムドメイン情報の12.5%しか得ることができません。

もしDSDからDXDへ、すなわち1 bit / 2.822MHzから352.8kHz/24 bitの信号に変換するなら、DSDソースが持つ87.5％のタイムドメイン情報を捨てなければなりません。それらすべてを振幅ドメインに理論的にリマッピングすることは可能ですが。

つまり実際には両方のフォーマットのベストというより、むしろ最悪の部分を取り出してしまう結果になるのです。

これらのADC/DACの部品は、一般にはPCM中心の市場向けに開発されていました。そこでは、レコーディング/編集/マスタリング/リリースの全工程がPCMで処理され、ADCは全般にPCMで出力され、DACはPCM信号の入力を想定しています。そしてそれらは、このオペレーションに最適化されている傾向にあります。

DSDはしばしば“それらしい用語を使って流行に合わせる”ため、後から補足的に取ってつけられる機能になりがちです。こういった多くのDACは、例えばデジタルフィルタリングとデジタルボリュームコントロールの付いた完全なPCMオーディオパスを持っています。その内部では、DSDはまずPCMに変換され、デジタルフィルターをかけて（ここでPCMからDSDデータストリームへの変換で生じる全ての悪影響が追加されてしまい）、最終的にマルチビットによるDelta Sigma変換が行われます。つまり望ましくない2つの変換処理が、DACチップと呼ばれるブラックボックスの心臓部分で行われることになるのです。

最終的に私たちは、過去から現在に、そして“ネイティブ”のDSDとPCMに戻ってきました。もしも本当にDSDからベストな音を引き出したいのならば、まずはPCMに変換してからPCMの信号データとして処理を行って、マルチビットのDelta Sigmaとして再生することで、実際はDSDを直でPCMに変換して、PCMとして再生することとほぼ同義になります。このようなことが「DSD対応DAC」と呼ばれる製品の多くで起こっているのです。

Single-bit ADC with DSD output to File played on Mac/Audirvana and “Brand X” “DSD DAC” with hybrid DAC

このようなPCMとDSD間の変換に対応するコンバーターから、私たちが聴き分けられる音の違いは、厳密に変換アルゴリズムによって生じているものであり、フォーマットそのものの違いによるものではありません。元の手を付けていないDSD音源に比べれば、信号ロスは避け難いものです。

理想的であるのは、本当のマルチビットDACを使ってPCMをPCMとして再生することです（オリジナルのAD変換されたソースが何であっても、1段階の処理工程に伴うロスを被らないですむのです）。そしてデジタルドメインの中で余計な処理を加えずに、DSD信号をピュアなDelta Sigmaとして再生することです（オリジナルのAD変換されたソースが何であっても、1段階の処理工程に伴うロスを被らないですむのです）。これが我々の望みであるとしたら、最新のフラグシップと呼ばれるDACの大半は非常に良くないということがわかります。多くの製品はPCMとDSDともに台無しにしています。

nano iDSD（そして近々発売の全てのiDSDレンジ）では、私たちこれを提供するためにあらゆることをやっています。DSDとPCMの両方を適切に扱えるDACチップをすぐにも見つけることは大変な難題でした。メーカーは一般的にチップの内部情報を公開したがらないので、本当はどんな処理が行われているのか知るためには、実際のパーツを手に入れてから独自に入念なテストをしなければならないのです。

nano iDSDで使っているDACチップでは少し変わった処理を行っています。PCMオーディオの上位6bitの信号に対して、6bitトゥルーマルチビットDACを用いることで、Burr BrownのマルチビットDACの有名な特質である、暖かいと同時に迫力のあるサウンドを実現しています。これより下位のビット情報は全て、等級の低い256スピードのDelta Sigma変調器により（事実上のDSD256）変換され、PCM再生時に、Delta Sigma DACとDSDの有名な特質である滑らかなサウンドを提供します。

DSDの再生時には同じDelta Sigma変調器が、直接DSDのビットストリームからアナログ信号に変換するかたちで使用されます。もちろん、DSDに使うことができるデジタルフィルターやデジタルボリュームコントロールは存在しないので、これらの機能は元々あるべきアナログドメインに追加しなければなりません。最後にiDSD nanoの魅力を、私の第2の故郷である英国のことわざにあるように、“プディングの味は食べてみればわかる”（論より証拠）という言葉に例えて皆さんにお伝えしておきたいと思います。

（翻訳：山本敦）

AudioStreamのインタビュー記事より原文

iFI-Audio.jp News and Blog

2014年7月3日木曜日

iFIオーディオ主任エンジニア、トルステン博士かく語りき（4）連載インタビュー付録：PCM vs DSD

0 件のコメント:

コメントを投稿

自己紹介