最近、ハイレゾ対応のヘッドホンや、パソコンなんかが出て、だんだん、音質のハイレゾ化が進んできていて、ハイレゾの普及で、MP3よりFLACがはやりだしているようです。
FLACというのは、MP3のようなファイルの方式の事で、「情報損失の無い可逆圧縮」が可能になった事で、ハイレゾを聞くのにちょうどいいファイル形式です。
MP3だと、せっかく、いいヘッドホンを買っても、気持ちよく音が抜けてくれないなどの不満が出てきますが、FLACで、いいヘッドホンで、特に、オープンエアー型ヘッドホンで聴くと、音が気持ちよく抜けてくれて、いい感じの音で聴こえます。
昔のMP3が普及し出した時期と違って、今現在は、保存容量が、テラの時代になったので、FLACのような比較的大きめなファイルでも大丈夫になってきた事も理由の1つです。
ハイレゾといっても、今の所は、「MP3の悪い音質で耳が慣れてしまったので、普通のCDの音が綺麗に聴こえる」といった感じの雰囲気がまだ強い感じですが、きちんと、「ハイレゾ」が再現できる環境が全て揃うまでには、もう少し時間がかかりそうです。
ハイレゾ対応のヘッドホンとかをせっかく買っても、MP3とか、昔のソニーのMDのような、無茶苦茶で強引に音域を削除してある圧縮方式のもので聴いても、まったく効果はなくて、むしろ、「音の抜けが悪い」などの悪い箇所が明瞭にわかってしまって、よくないです。
このように、ハイレゾといっても、「再生環境」、「圧縮方式」、「元の録音環境」、「テレビとかの放送や伝送の方式」とかの全ての技術が揃わないと、技術はきちんと反映されてきません。
特に、「元の録音環境」の方は、「再生環境」よりも、若干、オーバースペックが必要になります。
例えば、見る環境が、「現在のハイビジョンテレビ」で、テレビ局が撮影しているカメラが「4Kや8Kカメラ」で撮影した場合には、「ハイビジョンで撮影して、ハイビジョンで見る」よりも、はるかに数倍以上綺麗に見えます。
ですから、ハイレゾをやるには、「作成環境」の方は、「聴く時のハイレゾ環境」よりも、さらに、スペックが上のものが必要になるわけです。
「作成環境」と「試聴環境」が、まったく同じレベルだと、ギリギリで、かつかつな環境なので、思ったよりも、寸詰まり感が出てしまったり、「音が綺麗に抜けてくれない」とか、「透明感が無い」とかになりがちです。
クリプトンの海外のソフトウェアのダウンロード販売をしているSONICWIREの所で、珍しいツールが販売される予定のようです。
オーディオファイルから「ボーカル」、「伴奏」を分離できるツールで、「TRAX」というツールのようです。
しかし、MacOSにしか対応していません。
高速なCPUや、メモリを大量に積んでおいた方がいいです。
簡易版もありますが、「TRAX PRO」という全部の機能が使えるバージョンでないと、おそらく不満が出てくると思うので、はじめから「PRO」版を買った方がいいような気がします。
1番使用用途が高いのは、「リミックス用」、「音声合成技術や、外国語の語学などで、音声データコーパスの収集(言語学解析)」辺りだと思います。
このツールでできる事は、
・非常に古い時代の音源で、カラオケ用の伴奏の作成が不可能な楽曲から、「カラオケ」が作れる。(主に、「歌ってみた」とか用に使える)
・音楽作成には様々な手法があるが、「リミックス用素材」の作成(おそらく、「TRAX PRO」でないと不満が出てくるはず)
・洋画の吹き替え用に、セリフを取り除く
・特定のノイズ除去や、抜き出し(「TRAX PRO」での細かい解析が必要。例えば、動画の背景音で、効果音や街中の音が必要な時に、その中の一部の音だけを抜き出す、あるいは、消す)
・音声合成技術や、外国語の語学などで、これからの時代に必要となってくる「音声データコーパス」の収集や蓄積からの解析用データを集める。(言語学解析)
(TRAX PRO)(SONICWIRE)
http://sonicwire.com/product/99225
(これからのオーディオ・動画・写真は、「超超大容量型集中データベース」型(2TB以上)になりそう?)
いわゆる、最近はやりの「ホームネットワークオーディオ」という物との関連なわけですが、仕組みは、「iPod」などの携帯向けオーディオ機器を家で聞くなどの場合や、ハイビジョンテレビで見たりといった場合には、「超超大容量HDD、メモリーカードなど(2TB以上とか)」を「サーバ」的に使って、そこに、「音楽、動画、写真」などを入れておけば、ハイビジョンテレビでも、「iPod」でも、どこでも、聞ける!見れる!という仕組みです。
どうも、この関連で、これからの「HDD」や「SDメモリーカード」などの、メモリーカードなどが、一気に!超超大容量化(2TB以上とか)!の方が、市場や流通、生産などで、主流になりそうな気配です。
注目のキーワードとしては、「音楽、動画、写真などの超超大容量型集中データベース」型という中の、「データベース」という所にあるわけです。
なぜか?というと、実は、オーディオ業界、テレビなどの家電業界などでは、「技術的に、今までなかった”データベース”」という部分が、これから必須になるからなのです!
なぜ?最近では、「ホームネットワークオーディオ」などのように、「音楽、動画、写真などの超超大容量型集中データベース」型になっているのか?というと、「iPod」が、世の中に出てから、デジタルオーディオ機器の考え方が、全般的に、かなり変わりましたが、その第2波(?いくつ目か?)の時期に入っているわけですが、それは、「iPod」などのデジタルオーディオ機器が出てから「時間が、けっこうたった事」による、ユーザーの「超大量データを、扱いこなせないとか、どうさばくのか?」という、「データベース機能」が必須になったからなのです!
例えば、あるユーザーが、「〜という”感じ”の曲、動画、写真などは、”どこにあったっけな?”」という悩みが増えて、結局、「大量過ぎるデータ量が、”データベース的に”さばけないと、ユーザーは、使い勝手が悪いと思ったり、あきてしまって使えなくなってきたからなのです!」
問題なのは、大量のデータだと、この場合の「〜という”感じ”の」という部分が、やっかいであって、ユーザーは、けっこう「うろ覚えだが、けっこう、いい曲だったので、聴きたくなった!けど、探せなかったので、不便に感じる」というのが、多くなってくるわけです!
これを、どう「データベース」的に、処理するのか?というのが、これからの「メーカー」の技術者の腕の見せ所なわけですが、1つには、「iTunes」などのようにして、「タグ」などから、「全部の、音楽、動画、写真などから、一瞬で検索できるようにする」という仕組みですが、基本的に、「オーディオ」メーカーなどは、このように、「音楽」ではない部分の技術開発は、簡単な事でも苦手で、「音楽、動画、写真などのタグなどに付いた、大量の文字をさばいて、検索するシステム」は、未知の領域である場合が多いのです。
(「音楽、動画、写真などの超超大容量型集中データベース」型で、何ができそうか?)
しかし、どうも、この「音楽、動画、写真などの超超大容量型集中データベース」型ができると、「ただ検索するだけ」ではなくて、「複合的に、面白そうな事ができそうな、新しい時代に入ったシステム」になりそうなのです!
これは、まったく未知の「音楽、動画、写真」などの楽しみ方の時代で、昔でも、若干あったわけですが、例えば、検索を「音楽、動画、写真」などの全部にかけると、関連の「音楽、動画、写真」などが、パッと出てきて、「写真や、動画」をバックにしながら、関連音楽を、BGVのように楽しむとかが、「ランダム」でもできるとか、そんな感じですが、「データベース」になると、「未知の情報発見」や、まったく新しい未知の「音楽、動画、写真」制作などの文化の時代に突入しそうなわけです。
例えば、データベースと検索の仕組みだと、「音楽の歌詞」にも検索が引っかかってきますが、そうすると、「未知の音楽文明の時代」に入って、例えば、人類史は、数千年になりますが、ジャズや、ポップスなどの歌詞の中で、「海」が含まれた曲とか、海外の曲で「wind」が含まれた曲が、パッと出てくるとかすると、「何か?新しい発見などの、未知の音楽文明の創造」の時代に突入しつつあるようです!
つまり、「人類史、全体のデータをさばける人」が、新しい文化を作っていく時代です。
このように「データベース」ができると、いろいろな事が複合的にできるようになってくるわけですが、恩恵がありそうなのが、
・「歌詞の中で、よくわからなかった単語を、「音楽(音声)、動画、写真」などから、「辞書のように検索して調べられる」事ができるので、例えば、「windstorm」「thunderstorm」という歌詞が出てきたけど、「実際には、どのような感じの物か?知らない」場合でも、「windstorm」「thunderstorm」の動画、写真などと共に、曲を流したりもできる事で、「今まで、把握できなかった出来事」まで知った上での、深い文化の理解からの、創作活動などができる。とか、普通は、音楽などだと、「イメージ力、とか、インパクト」になったりするわけですが、「人類史、全体のデータをさばける人」が、新しい文化を作っていく時代に突入し出しているわけです!
ここで、「データベース」や、世界中の曲の歌詞で問題になるのは、「外国語の文字の曲の歌詞」まで、文字種として、データベース的に扱える技術開発が、絶対!必要になってくる事!なのですが、パソコンだと「ユニコード」だと、何語でも、世界中の、かなりマイナーな文字でも、「古今東西、人類が生み出した全ての文字」が表示できます!
実は、このシステム用の技術開発を、もうしていかなければいけない時期にきているのですが、世界中の文字が扱えるには、「けっこう、専用の処理パワーが要ります!」
しかし、もう「21世紀になっているのに、英語のアルファベットと、日本語のみが、ずらずらと並んでいる歌詞などの文字部分というのは、少し技術的に情けないというか、頼りない状態なわけです。」
これが完成すれば、「フランス語」だろうが、「ギリシャ語」だろうが、「ロシア語」だろうが、かなりのマイナーな文字の歌詞でも表示できたり、データベースとして、検索したりできます!
文字システムとしては、データベースとして扱えるには、「独自仕様だと、全く意味がない」ので、パソコンなどで、編集したりするデータも扱える中では、「ユニコード」対応が必須になってきます!
これで、フランス語でも、ヘブライ語でも、曲の歌詞が出るようになります!
よく子供の語学学習では、「勉強」よりも、「普通の音楽などから、慣れた方が速い」と言いますが、これが技術的に完成すると、けっこう、賢い子供が増える、新しい時代に突入する気がします。
まあ、普通の使い方だと、「ジャケット写真」が出て「歌詞」が曲に合わせて、画面の中を流れて、カラオケ機能になったり、「好きな動画、写真をバックにして、ランダムで曲を再生したりする」といった使い方や、「うろ覚えだった曲が探しやすくなる」などの使い方になると思います。
(「音楽、動画、写真などの超超大容量型集中データベース」型を作るのに必要な技術項目)
(1)「音楽、動画、写真」などの、「タグ」から全体を複合的に検索できるか?
(2)世界中の各外国語の文字の歌詞や、検索が扱えるだけの文字種か?(ユニコードは、必須!)(21世紀になっているのに、英語だけだと、ちょっと情けない、頼りない感じ)
(3)超超大容量のHDDや、メモリーカードの時代(2TB以上が普通になるはず)
(4)「音楽、動画、写真などの超超大容量型集中データベース」型から、ハイビジョンテレビ、3D立体視テレビ、iPodなどで見れるようにしなければいけない。
辺りを、技術的に乗り越えていかなければいけません。
「データベース」を扱える技術の肝の部分は、2つで、
・世界中の各外国語の文字を、全部扱えるか?(ユニコードは、必須!)
・超超大容量のHDDや、メモリーカードの時代(2TB以上が普通)
最近、こうした「音楽、動画、写真、ユニコードテキスト」を含めたような、「総合データベース」検索のシステム構築として、技術的に難しいなぁと感じた所は、
(1)写真の中の部分に、説明用のタグが入っている写真がある(人物が並んでいる写真で、その個々をデジタルな枠で指し示して、内容がタグで入っているような物)
(2)音楽に「歌詞」情報(外国語も含む)が入っている
(3)動画に、「多言語混在字幕」が含まれている
(4)普通のテキストも、ユニコードで、世界中の古今東西の言語が表示できるように「外国語」環境が増強されている(もしかすると、考古学文字も入っていそう。)
といった事が全部できる、「総合データベース」検索のシステム構築をしていかないといけないわけです!
技術的には、現在のパソコンで個々の技術は、すでに動いているわけですが、問題なのは、ユニコード検索システムは、マシンパワーがいる。という事で、動かないわけではないのですが、「重くなる」などになってしまうので、たぶん、今後のパソコンや、家電では、このユニコード多言語外国語処理用の専用チップが入るような感じになる気がします。
(そうしないと、例えば、重めになる「ハイビジョンビデオ再生」+「ユニコード超多言語字幕」処理が重なると、マシンパワーを、ダブルで食ってしまうので、ちょうど、ハイビジョン再生用のチップが入っていたり、「3DCG用グラフィックチップ」が入っているのと同様に、「ユニコード超多言語処理」チップも、開発されて入ってくる事でしょう!
そうなってくると、現在のDVDや、ブルーレイの映画なども、ほぼ「どの国の外国語でも字幕表示ができる」とか、携帯電話も、そのユニコード文字処理チップが入れば、海外向け市場が大幅に拡大するからです。
(「数値」をタグ情報で扱う難しさ)(「数値タグ」は、「数値」の内容を判断しながらの「数値検索」が必要になってくる)
こういったような、「音楽、動画、写真、ユニコードテキスト」を含めたような、「総合データベース」検索のシステムの中で、「数値」タグは、特別な検索処理が別に必要な事がわかってきました。
「タグ」に含まれる「数字」は、実際の所、「数値」の意味合いが入っていない事が問題のようです。
例えば、「1900年代」の歌、という物を検索しようとしても、似た数字の入った部分も、ピックアップしたりしてしまうわけで、「その”数値”が何を意味しているのか?」という「数値タグ」という別の処理が必要なわけです。
「数値」には、含まれるいろいろな意味合いによって、処理が別になってきます。
大体は、「数値」タグは、「度量衡」といったりする「長さ、容積、重さ」や、「年代、日時」など、数値の意味合いによって、「検索処理に、数値処理も含めなければいけなくなってきます。」
「写真」の中に含まれる「数値タグ」で、「高さ、〜mの彫像」とあれば、「数値検索」では、「20m以上の彫像」を検索で探す処理は、単純に、「文字検索」と違って、「同一になった文字列」だけでなくて、「数値の大小」などを判断しながらも、その数値に含まれる意味合いの含まれたタグ(数値タグ)によって、「1900年制作」という文字列が、「20m以上」の方にひっかかっては困るわけです。
方法は、いくつかありますが、1番確実なのは、「タグ」を付ける時に、「数値タグ」という処理を通してから、「日時、年代」とか「長さ」とか「重さ」と書かれた項目などによって、詳細に「数値の意味合いを入れながら、数値タグを付ける」という方法です。
「長さ」や「重さ」には、単位が違う物があるので、これの詳細な区別をしていかないと、あるいは、「数値検索処理」の内部処理で、「数字の意味合いを見ながら、オートで、単位変換をする(ヤードを、メートルに直して、「〜m以上」という共通の範囲で数値検索をする。など)事が必要です。
さらに、最近のデジカメの写真には、「GPSデータ」の「数値タグ」が入っていて、こういった場合には、世界地図との連携をしたりしなければいけない処理が入って、「数値」「タグ検索」システムの構築といっても、一概にいえなくて、処理が、けっこう広範囲になっているので、けっこう大変なわけです。
今までのように、「文字列が一致したから、検索が完了した」ではなくて、
(1)「数値」なら、大小判断検索や、「数値タグの詳細区分け(重さ、長さ、日時など)」が必要
(2)「年代、日時」ならば、「1920年〜1950年に作られた物」などの「範囲数値検索」が必要。
とか、「5m〜20mまでの彫像」の「範囲数値検索」とか。
(3)「GPSデータ」の「数値タグ」ならば、世界地図上に出るようにするような、複雑な検索システム
など、「音楽、動画、写真、ユニコードテキスト」をひっくるめた「検索システム」の構築は、けっこう、いろいろな技術が必要になってくるわけです。
しかし、これが完成すれば、「1900年制作の歌」で検索した瞬間に、それが作られた国や地域の世界地図で位置が出たりというようになってきて、「ユニコードテキスト」の外国語処理が完成すれば、ある程度、オートでも、外国語の歌の歌詞が翻訳されたりといった、今までにはなかった、かなり「賢いオーディオ、動画、写真システム」になりそうです。
今現在でも、個々の技術は、すでに動いているので、この「音楽、動画、写真、ユニコードテキスト」をひっくるめた「検索システム」の構築は、2〜3年後には、たぶん、動いているはずです。
メーカーの技術者や、共通フォーマットの取り決めなどができれば、すぐに実現しそうです。
評価:
--- 寺島情報企画 --- (2007-12-26) |