(MMDで、初音ミクとおしゃべりできるソフト「音声インタラクション構築ツールキット:MMDAgent」)(「名古屋工業大学」の開発による)
(前回の(↑ コレ)の「人工知能」について)
今回は、前回に書いた「名古屋工業大学」の開発による「MMDAgent」というのが面白そうなので、「人工知能」について書きたいと思います。
21世紀になったらできると言われていた技術の中で、後は、「人工知能」位なので、これが完成すれば、「初音ミク」ちゃんにも、「人工知能」が搭載できる(かも?)というわけで、かなり期待の高い物です。
まずは、自分は、「名古屋工業大学」の人間ではない上に、まだ、「MMDAgent」自体が、たぶん公開されていないので、何とも言えないのですが、前回に書いたように、「人工知能」への道のりは、一筋縄ではいかない位、難関なのです!
そこで、自分が、この「人工知能」プロジェクトのプランを設計するならば、という仮定のもとで書いていくので、これに限らず、「人工知能」への道のりに挑戦してみたい人は、頑張ってやってみましょう!
((注意!)以下は、自分が「人工知能」を設計するなら。という仮定のもとの物なので、この「MMDAgent」の挙動やシステムとは、まったく無関係なので、注意して下さい!「人工知能」を作ってみたい人向け、の物です。あるいは、今回の参考資料です。)
(人工知能の歴史)
(昔の方のXBOX版だった時の、「人工知能」N.U.D.E.(Natural Ultimate Digital Experiment)の3DCGコミュニケーションドール「P.A.S.S.」)
http://www.xbox.com/ja-JP/games/n/nude/details.page/
たぶん、こんな感じだろうという「人工知能」応答型コミュニケーションでは、昔の方のXBOX版だった時の、「人工知能」N.U.D.E.(Natural Ultimate Digital Experiment)の3DCGコミュニケーションドール「P.A.S.S.」というのがありました。
詳細は、XBOXのホームページの動画を見ればわかる通りな感じです。
「人工知能」を作ってみよう!という歴史は、けっこう古い時代からあって、そもそも「パソコン」というコンピューターが、この世に登場した時期から、「これで!人工知能が作れるかも?」と、ずっと言われ続けていたので、「パソコン」や「コンピューター」そのものの歴史です。
日本のパソコン向けに、これが出たのは、大昔のパソコン時代の「EMMY」や、「EMMY2」といったソフト辺りが有名ですが、このソフトは、女の子を口説くシミュレーターだった気がします。
しかし!「人工知能」(当時は、「AI」と呼ばれていた)が、そもそも、8ビットや、16ビットの時代に動く為には、前回に書いたように、「言語辞書数」の語彙が、少なすぎて容量的に無理があったので、滅茶苦茶な応答をする。という、女の子を口説くシミュレーターとしては、「かなり、シュールな物でした!」
根本的な設計構想は、大体似た感じですが、現在においては、先程の「XBOX版N.U.D.E.@のP.A.S.S.」のようにして、コンピューターの高速化、大容量化、複合的なアルゴリズムを処理できるようなコンピューターのシステム設計などが、現在では、進んでいて、どうも、もうそろそろ「人工知能」が、本格的に作れる時代に現在が、すでになっているわけです。
「XBOX版N.U.D.E.@のP.A.S.S.」なんかは、けっこう、賢くて、いろいろ物知りだった気がします。
(現在に、「人工知能」を作るプロジェクトのプランニング)
実は、「人工知能」は、技術的には、すでに作れる位に、コンピューターが高度になっていますが、なぜ?実現しないのか?というと、それは!「”人工知能”を作るプロジェクトのプランニング」にあるのです!
前回に書いたように、「人工知能」の1番のネックは!「150万語以上の語彙数の辞書が必要!」という事で、気が遠くなりそうですが、普通に考えればわかる通り、「人間の寿命や、人類史の時間には限りがある」わけで、ここを理解しないと、いわゆる「時間の論理的に不可能」なわけです。
そこで、不可能な事がわかっている事をやっても、技術者は意味がないので、これを解決する方法を、「”人工知能”を作るプロジェクトのプランニング」として、組む必要があるのです!
つまりは、今から、基本辞書の単語の語彙数で、「150万語以上の電子辞書」ですが、実は、「会話文」などの別辞書が必要になるので、おそらくこの、100倍とかの語彙数になります!が、これを集めるのに、今から、「250年後に完成した!」では、今生きている私達は、面白く無いわけです!
それで、結局は、今生きている私達が扱えるには、「”人工知能”を作るプロジェクトのプランニング」を組むしかないわけです。
そのやり方の1つとしては、「コーパス収集システム」を、例えば、今回のように、「名古屋工業大学」の「MMDAgent」などや、「N.U.D.E.@のP.A.S.S.」などが備えているか?にかかっているわけです。
「コーパス」というのは、言語学の分野で、言葉の構造、文章の構造を解析する為のシステムの事ですが、簡単に言えば、超超!大量の文章例(単語だけでなくて、例文の事)を集積して、解析するシステムの事です!
といっても、難しくはなくて、基本は、例えば、「明日、買い物に行くんだけど、天気は?」とかの文章を集めるだけです。
このコーパス収集システムがないと、「人工知能」は、「頭が進化しない!」ので、必須機能なのです!
例えば、これが無いと、「明日に、買い物へ行きますが、天気は、何ですか?」というような、通常、会話する日本語とは似ても似つかない「コンピューターにわかりやすい文章」のみ!しか、返答してくれないのです!
「コーパス収集システム」では、例えば、ユーザーに協力をお願いして、このソフトウェアを使う場合に、「コーパス収集をして、言語学に生かしてもいいですか?」という前書きが必要で、ユーザーは、ソフトを扱う中で、例えば、「初音ミク」ちゃんと、もっと「おしゃべり」の語彙数を増やしたいなぁと感じた場合に、入力したりして増強したりした際のデータを送って、集中管理するシステムの事です。
まず、1人の力では、「初音ミク」ちゃんに「おしゃべり」させたいなぁと思って、入力できる単語や文章数は、たかだか知れていて、一生かかっても、「数万語(3〜5万語もいけば、相当、頑張った人でしょう!)」が限界で、”絶対不可能!”なわけです!
「絶対不可能!」とわかった理論数値が出た場合には、技術者は、わざわざ、その方法を選ばない事が賢明な判断です。
しかし、「”人工知能”を作るプロジェクトのプランニング」の1つのメカニズムとして、「コーパス収集システム」を組み込めば、実は!「150万語」なんて、アッという間!(3〜5年もあればできるはず)なのです!
しかも!さらに!様々な外国語を話せる!ようにもなります!
こういったように、言語学や、人工知能では、「学問」や「技術」だけではなくて!「プロジェクトのプランニング」が、とても重要で大切なわけです!
自分が思うには、「N.U.D.E.@のP.A.S.S.」にしても、「初音ミク、おしゃべりソフト」にしても、ゲームなどの分野が、これまで、「学術分野」などに貢献してこなかったなぁと思うわけですが、「コーパス収集システム」付きの「人工知能」ゲームを作れば、言語学に貢献でき、人類の文明の進化に貢献できます!
しかし、「コーパス収集システム」は、セキュリティー設計が難しくて、例えば、「初音ミク、おしゃべりソフト」のミクちゃんに、「明日、9時から会議だから、手帳に記録しといて」とかを話して、それをやらせるようなシステムも作れるわけですが、「けっこう!日常会話になるので、セキュリティー調整のメカニズムが大変になります!」
基本的には、自分で、入力したデータで「コーパス収集に協力できる場合のみに送る」というのが普通です。
また、言語学の基本的なスタンスでは、文章構造の解析にあるので「コーパス収集には制限をかけない(方言、口語、俗語、18禁など)」という事が重要な1つですが、なぜか?というと、制限をかけてしまうと、その言語の持つ特徴が把握できなくなったり、偏ったりするからです。
どういう事なのか?というと、データに、あらかじめ「ふるい」をもうけてしまうと、例えば、「日本語」として集めたはずのデータが、実は、「漁師言葉」に偏っていたなどが起きるわけで、その中で、解析された言葉は、特殊な特徴を持つからです。
といっても、「方言」などに制限をもうけないのは、例えば、「初音ミク、おしゃべりソフト」などでは、ミクちゃんに話しかける人は、(ココが、人工知能の賢さである、柔軟さ、なのですが)
・「ワンコロは、散歩へ連れて行ったか?」と、お父さんが話す。
・「ワンワンがいたよ」と、小さな子供が話す。
・「ワンちゃん、いたねー」
・「犬を連れて散歩へ行きました。」
などのようにして、「人工知能」に話しかける人は、それぞれの話し方で話します。
これが、判断できなけらば、「人工知能」ソフトとは言えないわけです!
こういった文章の多彩な表現を解析できる方法が、先程書いた、言語学手法の「コーパス」なわけですが、日本語ならば、いいのですが、外国語も同様な現象が起きているわけで、これが進めば、「機械翻訳ソフトの精度が上がる!」など、私達の生活全体が、とても便利になるわけです。
(「人工知能」や「機械翻訳ソフト」の壁)(「言葉の揺れ」を、どう処理するか?)
先程の例で、「犬」の事を、「ワンコロ」「ワンワン」「ワンちゃん」などとたくさんの呼び方で、それぞれの人が話しかけましたが、こういったように、1つの単語に対して、複数の「表記方法」「発音」などがある場合の事を、言語学では、「言葉の揺れ」などと言います。
しかし、言語学では、「口語体」の解析は、ほとんど進んでいない状況なので、それで、「機械翻訳ソフト」などの精度が、いまひとつなわけです。
「言葉の揺れ」という概念自体も、とてもアバウトな範疇に入ってしまう物で、「同意語」「類義語」などとも、少し違うし、あるいは、これも含めたり、「方言」も含めたり、「方言」は別として処理したりと、けっこうバラバラです!
というのも、「口語」で話している、こうした「言葉の揺れ」が発生するメカニズムが、「方言」や、「古語」的な物が入り混じって、このように幅ができるからです。
こうした事を、「言葉の揺れ」の「揺れ幅が吸収できる機械翻訳システム(あるいは、人工知能)か?」という事で、問題にされます。
「人工知能」用の電子辞書が、基本語彙数「150万語以上」が、おそらく数100倍に跳ね上がってしまう原因が、ここにあるわけです。
通常は、そういうわけで、「コーパス収集システム」を使わなければ、「人工知能」が完成するのは、200年先とかになってしまうわけです!
しかし、私達は、それこそ、世界中に、「何億人もいる!」ので、「コーパス収集システム」に協力できるユーザーが増えれば、「人工知能」は、「何ヶ国語でも話せたりする!」という夢のソフトになる!(はず!)です!
昔は、子供は、そんなにゲームばっかりして!とか言われていたわけですが、そうではなくて、子供は、遊びの中からも、古代の昔から学ぶのが、本来の姿勢です。
例えば、「Nintendo3DS」などには、「3D立体視デジカメ」が付いていますが、子供は、外を歩き回ったり、いろいろな場所へ行って、この「3D立体視デジカメ」で、「ヘラクレスカブトムシ」の写真を撮ってきたとします!(ありえな〜い!)
今は、実は、「デジカメの写真」などの中の部分を示して、「説明文字タグ」を付けられるのですが、これも、これからの「人工知能」設計には、重要です!
それで、「Nintendo3DS」の方は、「WiFi」に対応していたりするので、「お気に入り写真アップロード」をする時に、例えば、「公開疑問3D写真?」とかとして、この「3D立体視デジカメ」で撮った「ヘラクレスカブトムシ」の写真をアップロードすると、誰か、それに詳しい人が、「それは、ミヤマクワガタだよ!」と教えてくれるように、新しいゲームのコミュニティーができたりするわけです。
(「人工知能」や、これからの「電子辞書」「機械翻訳ソフト」は、デジカメの写真の「説明文字タグ」を読めないと意味が無い)
つまり、例えば、「人工知能」のミクちゃんに、デジカメの写真を見せた時に、「文字タグ」を読んでくれるように設計すれば、子供が、
「この写真の動物は何?」
と「人工知能」に聞けば、
(人工知能):「それは、”動物”ではなくて、アルパカのぬいぐるみです。」
と教えてくれるわけです。
つまり、「デジカメの写真タグ」も工夫しなければいけなくて、「人工知能」の設計の肝はここですが、(大分類)(小分類)(分野)(詳細種別)など、とても、複雑な階層構造を持たせます。
(これは、機械翻訳ソフトの単語登録構造も、このようにすれば、より精度の高い、今の文章の内容を、コンピューターが理解した、優先翻訳例が出やすい設計になります!)
例えば、デジカメの写真の「文字タグ」や、電子辞書の単語が、「ワイン」であれば、それは(お酒)分類にしておけば、より精度の高い翻訳文を選んでくれます!
あるいは、(大分類:「飲み物」)(中分類:「お酒」)(小分類:「ワイン」)のように階層構造を持たせておけば、「飲み物に関する、より良い翻訳例」にも「お酒に関する文章の翻訳例」にも、「ワインの、注ぎ方のより良い翻訳例」にも、どんどんと、「幅の広い、人工知能の回答、返答例がもたせられます!」
例えば、
(子供):「このワインは、どのグラスで飲むのが、おいしいですか?」
(人工知能):「お酒は、大人になってからね。」
という感じの、人工知能的な「直接の質問返答」以外の柔軟な返答が返ってくるシステム設計になります。
「コーパス収集の文章例」としては、
・「これ、何?」
・「これは、何ですか?」
・「ねえ、これは?」
などのように、言語学で、「文法」から考えると、「人工知能」が意味を取れない質問文も、出てくるわけですが、この「文章の表現の揺れ幅を吸収して、全部処理できる」必要があります。
普通は、「方言」も入るはずなので、
・「何、言う(ゆう)とります?」
とかも、処理できなければいけないわけですが、「全ての世界中の人々の、全ての文章で同時に起こる!」ので、「コーパス収集解析システム」がなければ、到底、「人工知能」が賢くなったりするのには、私達が生きている程度の時間では無理なわけです!
(ただし、「”人工知能”を作るプロジェクトのプランニング」をきちんと組めば、たぶん、3〜5年もあれば、比較的、簡単に完成してしまいます!)
また、このように集めた「コーパス収集システム」のデータは、当然、皆が協力して作り上げていく物ですから、それを扱ったユーザー全体の共有資産とするのが普通で、言語学などの学術分野の貢献ができるわけです。
今回のようにして、「名古屋工業大学」などのように、「大学」だと、このように「純粋学問分野」として研究できるので(「言語学などの学術分野の貢献の為」という部分)、本来は、学術の発展という物は、このようにしてできあがっていく物です!
企業などになってしまうと、企業は、1企業の利益の為に行動するわけであって、かえって、学問分野が停滞してしまうのは、そういった理由もあるのです。(そうすると、当たり前だが、多数のユーザーの協力を得る事ができなくなるので。)
どういう事なのか?というと、こういった所が、「言語学プロジェクト」独特なわけですが、例えば、一生懸命ユーザーが、「初音ミク、おしゃべりソフト」に教えていくと、実は、MikuMikuDanceの他のキャラクターの時でも賢くなっているなどや、「同様な言語学プロジェクト全体に参加している、他の人工知能も賢くなる!」ので、ユーザーは、一生懸命やる、やりがいがあるので、プロジェクトが進むのは、「共有財産」だからです。(「人工知能」プロジェクトは、この仕組みが無いと無理!)
ただ、今回、面白そうなのは、「MMDAgent」は、「総合システム」な事で、ちょうど、MikuMikuDanceや、「VOCALOID 初音ミク」が発展していくメカニズムと、そっくりですが、参加したい得意分野の人が、MikuMikuDanceモーション担当であれば、この「初音ミク、おしゃべりシステム」の「リアクション」を増やしたり、モデル、アクセサリが作れる人は、他のモデルで、話せたり、好きなアクセサリを装着させたり、あるいは、「外国語」や「言語学」サポートができる人は、「電子辞書」や「コーパス文章例」を、どんどん増設していって、増やしていったりと、「みんなで参加して、1つの巨大プロジェクトを作れば、1人では、数万年後に完成するシステムが、3〜5年とかで完成したり、どんどん使い込む内に、精度があがったり、リアクションが増えたり!といった事が可能になるはずです!」
個人的には、例えば、「人工知能:初音ミク」ちゃんなどに、デジカメの写真を見せると、「文字タグ」から、関連情報を、電子辞書から探してきて、読み上げてくれるような、「秘書」機能的になったら、凄いなぁと思います。
例えば、「ツタンカーメン」の写真を見せて、
「この写真の人物は、何世紀の、どこの人?」
とかを聞くと、
「紀元前1300年頃の、古代エジプト第18王朝のファラオです。」
とかと、関連情報を読み上げてくれて、そうすると、では「ファラオって何?」などのように、つなげられるので、「人工知能」でも、会話が成り立ちそうなわけです。
定型文の説明文を用意して固定しておけば、「博物館」「美術館」などの質問応答用に使えそうです。
思うには、「N.U.D.E.@」を、XBOX360版で再始動して、今回は、「初音ミク」人気もあるので、「初音ミク」なども選べるようにすれば、かなり人気が出ていい気がします。
けっこう、「ミク」ちゃんの「人工知能」と、「おしゃべり」してみたいなぁというユーザーは、多いと思います。
さらに!「3D立体視テレビ」も出ているので、XBOX360は対応状況が未定で、よくわかりませんが、「3D立体視テレビ」対応にすれば、かなりバーチャルな感じです。
評価:
--- マイクロソフト --- (2003-04-24) |
評価:
--- エンターブレイン --- (2003-06) |
(MMDで、初音ミクとおしゃべりできるソフト「音声インタラクション構築ツールキット:MMDAgent」)
(これは、「名古屋工業大学」の開発による、サイエンスの分野の紹介動画です。)
最近は、MikuMikuDance関連の技術開発まわりが、恐ろしい事になっていて、MMEの3DCGエフェクトも凄いですが、こちらは、本場のサイエンティストの方なのです!
もともと、「VOCALOID 初音ミク」もそうですが、「初音ミク」自体が、音声技術の最先端なわけで、そもそもが、バリバリのサイエンスの分野なのです!
なので、自分もそうですが、けっこう、技術ばたの人の心をつかんでしまうので、割と、「初音ミク」関連まわりには、サイエンティストが、かなりいるはずです。
という事で、この「音声合成などの人工知能的な会話能力の開発」の方の動画の説明を書きます。
この動画では、音声認識、音声合成技術と、3Dキャラクターのアクションとを合わせたり、言語プロセッサによって、「人工知能」的な初音ミクちゃん(など、何でも)と会話できる!という恐ろしい技術のたまものです!(クリプトンや、ヤマハの技術陣がからんでくれば、VOCALOIDが、「人工知能」的になって「話す!(発音する。ではなくて、”おしゃべりする!”という会話能力の方です!)」のは時間の問題で、けっこう早いはずです。そういえば、21世紀になったらできると言われていた技術に「3D立体視テレビ」がありましたが、これは、実現したのですが、もう1つ残っているのは「人工知能」技術です!)
ついに!バーチャルアイドルが、3D立体視テレビだけでなくて、「人工知能」的に、会話できるようです!
大昔にも、似た考え方がありましたが、現代では、言語プロセッサ用の辞書量が膨大なので(作って増設して、増やしていけば、精度が、どんどん上がったり、また、かなりの外国語でも対応できるようです!)、かなり判断して話せるようです!
完全に、サイエンス分野の物なので、かなり扱いが難しくなる気がしますが、サイエンステクノロジーの優秀な物は、やっている事は、複雑で高度であっても、扱う人の方は、意識せずに簡単である。というのが、サイエンスの最終目標なので、技術が拡大していけば、だんだん、簡単で手軽に扱えるようになると思われます。
自分も、こうした言語プロセッサなど用の電子辞書などは、ちょっとかじった事がありますが、実は、「人工知能」として扱える程の量の電子辞書量としては、「150万語以上」が絶対に、必要になってきます!
問題なのは、その位の量の語彙を素早くさばける電子辞書は、けっこう作るのが難しいわけです。
自分が知っている中では、その位の能力を持つ電子辞書は、「英辞郎」という電子辞書しか知りません。
「英辞郎」自体は、現在、第5版ですが、「170万語」以上でも、まだまだ、さばける語彙数の数パーセントという、恐ろしい数の語彙数が扱える上に、ユニコード対応なので、世界中の古今東西の、ほとんど全ての言語に対応しています。
この「名古屋工業大学」などの、「人工知能」的な言語プロジェクトで、しかも、世界中の全ての言語に対応した言語システムを構築したい場合には、この「英辞郎」に入っている機能の「ユーザー辞書作成」機能を使えば、自分で、世界中の、どの国の言語でも、電子辞書数を増やす事が可能なので、言語プロジェクトチームには、うってつけの技術でしょう。
「人工知能」用に必要な電子辞書の語彙数の目安を書くと、
・2000語(必須日常単語の最低限を集めると、これ以下では無理。犬、猫、赤、青、黄色、大きい、小さい、スプーン、フォークなど、基本単語を書き出しただけで、この数になる)
・10000語〜15000語(普通の必須日常会話の簡単な物まで)
・35000語〜50000語(高校入試、大学入試程度まで)
・7万語〜10万度(一般社会人程度まで)
・25万語〜50万語(一昔前の、電子辞書の程度で、けっこう、調べたい単語に限って出てこない、微妙な感じの程度)
・100万語〜150万語(とりあえず、外国語の新聞などや、各技術、産業分野などの多岐な専門用語まで、翻訳したり、把握できる程度。なので、「人工知能」では、ここが最低ラインとなります。)
さらに!この「150万語」越えをしてくると、博物館などでの「考古学の古代語」も話したり、説明できるようになってきます。(けっこう、秘書系や、ツンデレ系に自分は弱い)
「英辞郎」の電子辞書や、ユニコードでは、かなりの「古代語」電子辞書でも扱えます。
ここで、わかってくる事は、技術は、知識よりも「気合い!が大事!」という事で、この分量をこなせるのは、知識だけではなくて、主に!「気合い!」の方が重要なので、気合い!で頑張ってみましょう!
評価:
かんなP,ラジP,極北P,ポンポコP 翔泳社 ¥ 2,079 (2010-05-11) |
評価:
かこみき ビー・エヌ・エヌ新社 ¥ 2,730 (2010-08-26) |
今年に入ってから、ようやく21世紀っぽい「3D立体視テレビ」が、たくさん発売されたり、「3Dテレビ放送」や「3D映画」「3Dテレビゲーム」など、たくさん出だしましたが、ようやく、プレイステーション3などのテレビゲーム機の本格的な3D立体視タイトル販売が始まるようです。
まずは、ソニーなので、「グランツーリスモ5」が、やはり本格的な3Dスタートをきるタイトルのようです。
また、最近のテレビゲーム機向けのタイトルは、大体、開発に「2〜3年」かかるので、とりあえず、「3D立体視テレビゲーム」といっても、タイトル数を揃えなければいけないわけですが、どうも、ナムコは、昔出した、「リッジレーサー7」を、ダウンロードコンテンツで、「3D立体視対応」にするようです。(500円の予定)
「リッジレーサー7」は、ベスト版で、今は、「2500円」位になっているので、お手軽に、かなり遊べます。
当分は、過去のタイトルのゲームが、このような感じで、「3D立体視対応」のダウンロードコンテンツとして出てくるはずです。
面白そうなのは、「2Dゲーム」などでも、「文字レイヤー」とか「コマンド欄」にも、「3D立体視の位置」が持たせられるので、「ときめきメモリアル」とか「アマガミ」のような恋愛シミュレーションゲームで、キャラクターの3D立体視の位置が、文字レイヤーや、コマンドアイコンよりも、前に出てきたり、いろいろな演出もできそうです。
しかし、「3D立体視テレビ」の方は、「2D」→「3D」変換機能が付いているので、普通のテレビ番組でも、過去のビデオでも、ゲームでも、簡易な「3D立体視」にはなるようです。
が、仕組みは、「床面」などの水平線のような機械的に「3D」の位置が解析できる場所だけなので、形的には、この「2D」→「3D」変換機能を使うと、床面に、平面版が置いてある感じに見えます。
しかし、今の所では、最後に発売される予定の東芝の「3D立体視テレビ」では、デジカメなどの「顔認識」の技術を使って、おおよその人物の位置を割り出して、そこに、仮想の「3D立体人物像を、3DCGのようにして置いて計算する」という技術を導入して、若干、人物の「ふくらみ」が出るようです。
これで、ようやく、オート変換でも、平面的な人物の3Dではなくて、「ふくらみ」が出る人物に見えるようです。
まだ、「3D立体視テレビ」は、出たばかりなので、今後の技術革新に期待しましょう!
ソニーなんかは、プレイステーション3のように、「3DCG技術」を持っているので、こういった解析は得意なはずなので、今後は、かなり期待できそうです。
もう、「初音ミク」ちゃんの「3D立体視バーチャルステージ」が秒読みな感じがしてきたので、とてもいい感じです。
ようやく、21世紀っぽい、ホログラフィーではないけど、「3D立体視バーチャルステージ」の歌姫が見れるわけで、技術革新とは、凄いなぁと思います。
これで、「ミンメイアタック」もできる事でしょう!(ウソ)
というか、バンダイナムコになっているから、ウソではなくて、「3D立体視ミンメイアタック」のできるマクロスとか出そうな感じです。
ナムコは、エースコンバットが作れるから、けっこう出せるかもしれません。
最近、「トップをねらえ!」の「タカヤノリコ」も復活したので、初代、「ミンメイアタック」も出るかもしれません。
というよりも、思ったのは、「ブルーレイ3D立体視対応版」で、昔の映画の「超時空要塞マクロス」の「3D立体視ミンメイアタック」を作れば良さそうな感じです。
けっこう、日本の昔の映画は、未来を先取りしていたなぁと思いますが、ようやく、今の21世紀になって、現実にできるようになっているわけですから、技術の進歩は凄いなぁと思います。
評価:
--- ソニー・コンピュータエンタテインメント --- (2010-11-03) |
評価:
--- バンダイビジュアル ¥ 5,836 (2007-12-21) |
(これからのオーディオ・動画・写真は、「超超大容量型集中データベース」型(2TB以上)になりそう?)
いわゆる、最近はやりの「ホームネットワークオーディオ」という物との関連なわけですが、仕組みは、「iPod」などの携帯向けオーディオ機器を家で聞くなどの場合や、ハイビジョンテレビで見たりといった場合には、「超超大容量HDD、メモリーカードなど(2TB以上とか)」を「サーバ」的に使って、そこに、「音楽、動画、写真」などを入れておけば、ハイビジョンテレビでも、「iPod」でも、どこでも、聞ける!見れる!という仕組みです。
どうも、この関連で、これからの「HDD」や「SDメモリーカード」などの、メモリーカードなどが、一気に!超超大容量化(2TB以上とか)!の方が、市場や流通、生産などで、主流になりそうな気配です。
注目のキーワードとしては、「音楽、動画、写真などの超超大容量型集中データベース」型という中の、「データベース」という所にあるわけです。
なぜか?というと、実は、オーディオ業界、テレビなどの家電業界などでは、「技術的に、今までなかった”データベース”」という部分が、これから必須になるからなのです!
なぜ?最近では、「ホームネットワークオーディオ」などのように、「音楽、動画、写真などの超超大容量型集中データベース」型になっているのか?というと、「iPod」が、世の中に出てから、デジタルオーディオ機器の考え方が、全般的に、かなり変わりましたが、その第2波(?いくつ目か?)の時期に入っているわけですが、それは、「iPod」などのデジタルオーディオ機器が出てから「時間が、けっこうたった事」による、ユーザーの「超大量データを、扱いこなせないとか、どうさばくのか?」という、「データベース機能」が必須になったからなのです!
例えば、あるユーザーが、「〜という”感じ”の曲、動画、写真などは、”どこにあったっけな?”」という悩みが増えて、結局、「大量過ぎるデータ量が、”データベース的に”さばけないと、ユーザーは、使い勝手が悪いと思ったり、あきてしまって使えなくなってきたからなのです!」
問題なのは、大量のデータだと、この場合の「〜という”感じ”の」という部分が、やっかいであって、ユーザーは、けっこう「うろ覚えだが、けっこう、いい曲だったので、聴きたくなった!けど、探せなかったので、不便に感じる」というのが、多くなってくるわけです!
これを、どう「データベース」的に、処理するのか?というのが、これからの「メーカー」の技術者の腕の見せ所なわけですが、1つには、「iTunes」などのようにして、「タグ」などから、「全部の、音楽、動画、写真などから、一瞬で検索できるようにする」という仕組みですが、基本的に、「オーディオ」メーカーなどは、このように、「音楽」ではない部分の技術開発は、簡単な事でも苦手で、「音楽、動画、写真などのタグなどに付いた、大量の文字をさばいて、検索するシステム」は、未知の領域である場合が多いのです。
(「音楽、動画、写真などの超超大容量型集中データベース」型で、何ができそうか?)
しかし、どうも、この「音楽、動画、写真などの超超大容量型集中データベース」型ができると、「ただ検索するだけ」ではなくて、「複合的に、面白そうな事ができそうな、新しい時代に入ったシステム」になりそうなのです!
これは、まったく未知の「音楽、動画、写真」などの楽しみ方の時代で、昔でも、若干あったわけですが、例えば、検索を「音楽、動画、写真」などの全部にかけると、関連の「音楽、動画、写真」などが、パッと出てきて、「写真や、動画」をバックにしながら、関連音楽を、BGVのように楽しむとかが、「ランダム」でもできるとか、そんな感じですが、「データベース」になると、「未知の情報発見」や、まったく新しい未知の「音楽、動画、写真」制作などの文化の時代に突入しそうなわけです。
例えば、データベースと検索の仕組みだと、「音楽の歌詞」にも検索が引っかかってきますが、そうすると、「未知の音楽文明の時代」に入って、例えば、人類史は、数千年になりますが、ジャズや、ポップスなどの歌詞の中で、「海」が含まれた曲とか、海外の曲で「wind」が含まれた曲が、パッと出てくるとかすると、「何か?新しい発見などの、未知の音楽文明の創造」の時代に突入しつつあるようです!
つまり、「人類史、全体のデータをさばける人」が、新しい文化を作っていく時代です。
このように「データベース」ができると、いろいろな事が複合的にできるようになってくるわけですが、恩恵がありそうなのが、
・「歌詞の中で、よくわからなかった単語を、「音楽(音声)、動画、写真」などから、「辞書のように検索して調べられる」事ができるので、例えば、「windstorm」「thunderstorm」という歌詞が出てきたけど、「実際には、どのような感じの物か?知らない」場合でも、「windstorm」「thunderstorm」の動画、写真などと共に、曲を流したりもできる事で、「今まで、把握できなかった出来事」まで知った上での、深い文化の理解からの、創作活動などができる。とか、普通は、音楽などだと、「イメージ力、とか、インパクト」になったりするわけですが、「人類史、全体のデータをさばける人」が、新しい文化を作っていく時代に突入し出しているわけです!
ここで、「データベース」や、世界中の曲の歌詞で問題になるのは、「外国語の文字の曲の歌詞」まで、文字種として、データベース的に扱える技術開発が、絶対!必要になってくる事!なのですが、パソコンだと「ユニコード」だと、何語でも、世界中の、かなりマイナーな文字でも、「古今東西、人類が生み出した全ての文字」が表示できます!
実は、このシステム用の技術開発を、もうしていかなければいけない時期にきているのですが、世界中の文字が扱えるには、「けっこう、専用の処理パワーが要ります!」
しかし、もう「21世紀になっているのに、英語のアルファベットと、日本語のみが、ずらずらと並んでいる歌詞などの文字部分というのは、少し技術的に情けないというか、頼りない状態なわけです。」
これが完成すれば、「フランス語」だろうが、「ギリシャ語」だろうが、「ロシア語」だろうが、かなりのマイナーな文字の歌詞でも表示できたり、データベースとして、検索したりできます!
文字システムとしては、データベースとして扱えるには、「独自仕様だと、全く意味がない」ので、パソコンなどで、編集したりするデータも扱える中では、「ユニコード」対応が必須になってきます!
これで、フランス語でも、ヘブライ語でも、曲の歌詞が出るようになります!
よく子供の語学学習では、「勉強」よりも、「普通の音楽などから、慣れた方が速い」と言いますが、これが技術的に完成すると、けっこう、賢い子供が増える、新しい時代に突入する気がします。
まあ、普通の使い方だと、「ジャケット写真」が出て「歌詞」が曲に合わせて、画面の中を流れて、カラオケ機能になったり、「好きな動画、写真をバックにして、ランダムで曲を再生したりする」といった使い方や、「うろ覚えだった曲が探しやすくなる」などの使い方になると思います。
(「音楽、動画、写真などの超超大容量型集中データベース」型を作るのに必要な技術項目)
(1)「音楽、動画、写真」などの、「タグ」から全体を複合的に検索できるか?
(2)世界中の各外国語の文字の歌詞や、検索が扱えるだけの文字種か?(ユニコードは、必須!)(21世紀になっているのに、英語だけだと、ちょっと情けない、頼りない感じ)
(3)超超大容量のHDDや、メモリーカードの時代(2TB以上が普通になるはず)
(4)「音楽、動画、写真などの超超大容量型集中データベース」型から、ハイビジョンテレビ、3D立体視テレビ、iPodなどで見れるようにしなければいけない。
辺りを、技術的に乗り越えていかなければいけません。
「データベース」を扱える技術の肝の部分は、2つで、
・世界中の各外国語の文字を、全部扱えるか?(ユニコードは、必須!)
・超超大容量のHDDや、メモリーカードの時代(2TB以上が普通)
最近、こうした「音楽、動画、写真、ユニコードテキスト」を含めたような、「総合データベース」検索のシステム構築として、技術的に難しいなぁと感じた所は、
(1)写真の中の部分に、説明用のタグが入っている写真がある(人物が並んでいる写真で、その個々をデジタルな枠で指し示して、内容がタグで入っているような物)
(2)音楽に「歌詞」情報(外国語も含む)が入っている
(3)動画に、「多言語混在字幕」が含まれている
(4)普通のテキストも、ユニコードで、世界中の古今東西の言語が表示できるように「外国語」環境が増強されている(もしかすると、考古学文字も入っていそう。)
といった事が全部できる、「総合データベース」検索のシステム構築をしていかないといけないわけです!
技術的には、現在のパソコンで個々の技術は、すでに動いているわけですが、問題なのは、ユニコード検索システムは、マシンパワーがいる。という事で、動かないわけではないのですが、「重くなる」などになってしまうので、たぶん、今後のパソコンや、家電では、このユニコード多言語外国語処理用の専用チップが入るような感じになる気がします。
(そうしないと、例えば、重めになる「ハイビジョンビデオ再生」+「ユニコード超多言語字幕」処理が重なると、マシンパワーを、ダブルで食ってしまうので、ちょうど、ハイビジョン再生用のチップが入っていたり、「3DCG用グラフィックチップ」が入っているのと同様に、「ユニコード超多言語処理」チップも、開発されて入ってくる事でしょう!
そうなってくると、現在のDVDや、ブルーレイの映画なども、ほぼ「どの国の外国語でも字幕表示ができる」とか、携帯電話も、そのユニコード文字処理チップが入れば、海外向け市場が大幅に拡大するからです。
(「数値」をタグ情報で扱う難しさ)(「数値タグ」は、「数値」の内容を判断しながらの「数値検索」が必要になってくる)
こういったような、「音楽、動画、写真、ユニコードテキスト」を含めたような、「総合データベース」検索のシステムの中で、「数値」タグは、特別な検索処理が別に必要な事がわかってきました。
「タグ」に含まれる「数字」は、実際の所、「数値」の意味合いが入っていない事が問題のようです。
例えば、「1900年代」の歌、という物を検索しようとしても、似た数字の入った部分も、ピックアップしたりしてしまうわけで、「その”数値”が何を意味しているのか?」という「数値タグ」という別の処理が必要なわけです。
「数値」には、含まれるいろいろな意味合いによって、処理が別になってきます。
大体は、「数値」タグは、「度量衡」といったりする「長さ、容積、重さ」や、「年代、日時」など、数値の意味合いによって、「検索処理に、数値処理も含めなければいけなくなってきます。」
「写真」の中に含まれる「数値タグ」で、「高さ、〜mの彫像」とあれば、「数値検索」では、「20m以上の彫像」を検索で探す処理は、単純に、「文字検索」と違って、「同一になった文字列」だけでなくて、「数値の大小」などを判断しながらも、その数値に含まれる意味合いの含まれたタグ(数値タグ)によって、「1900年制作」という文字列が、「20m以上」の方にひっかかっては困るわけです。
方法は、いくつかありますが、1番確実なのは、「タグ」を付ける時に、「数値タグ」という処理を通してから、「日時、年代」とか「長さ」とか「重さ」と書かれた項目などによって、詳細に「数値の意味合いを入れながら、数値タグを付ける」という方法です。
「長さ」や「重さ」には、単位が違う物があるので、これの詳細な区別をしていかないと、あるいは、「数値検索処理」の内部処理で、「数字の意味合いを見ながら、オートで、単位変換をする(ヤードを、メートルに直して、「〜m以上」という共通の範囲で数値検索をする。など)事が必要です。
さらに、最近のデジカメの写真には、「GPSデータ」の「数値タグ」が入っていて、こういった場合には、世界地図との連携をしたりしなければいけない処理が入って、「数値」「タグ検索」システムの構築といっても、一概にいえなくて、処理が、けっこう広範囲になっているので、けっこう大変なわけです。
今までのように、「文字列が一致したから、検索が完了した」ではなくて、
(1)「数値」なら、大小判断検索や、「数値タグの詳細区分け(重さ、長さ、日時など)」が必要
(2)「年代、日時」ならば、「1920年〜1950年に作られた物」などの「範囲数値検索」が必要。
とか、「5m〜20mまでの彫像」の「範囲数値検索」とか。
(3)「GPSデータ」の「数値タグ」ならば、世界地図上に出るようにするような、複雑な検索システム
など、「音楽、動画、写真、ユニコードテキスト」をひっくるめた「検索システム」の構築は、けっこう、いろいろな技術が必要になってくるわけです。
しかし、これが完成すれば、「1900年制作の歌」で検索した瞬間に、それが作られた国や地域の世界地図で位置が出たりというようになってきて、「ユニコードテキスト」の外国語処理が完成すれば、ある程度、オートでも、外国語の歌の歌詞が翻訳されたりといった、今までにはなかった、かなり「賢いオーディオ、動画、写真システム」になりそうです。
今現在でも、個々の技術は、すでに動いているので、この「音楽、動画、写真、ユニコードテキスト」をひっくるめた「検索システム」の構築は、2〜3年後には、たぶん、動いているはずです。
メーカーの技術者や、共通フォーマットの取り決めなどができれば、すぐに実現しそうです。
「3D立体視テレビ」向けの3DCG技術(表示色域(?)の大幅な次元拡大!宝石の厚みのある透明色、真珠色、玉虫色のように、見る方向で色が変わる3DCG表示ができそう)
最近は、「3D立体視テレビ」が発売されたわけですが、プレイステーション3(3D立体視対応)や、Nintendo3DSなどのように、最近の3D立体視テレビゲームや、3D立体視向けの3DCG技術について書きます。
といっても、これらは、まだ発売されたばかりや、発売前の状態ですが、「3D立体視テレビ」自体は、もう、電気屋さんのデモディスクが流れているので、どうなりそうか?の部分で、気が付いた事があったわけです。
それは、「3D立体視テレビ」のデモディスク映像の中で、「どうも、宝石や、透明な物体は、”厚みがあるように見える”」という事に気が付いたのですが、普通の人は、見逃しますが、MikuMikuDanceをやっていたりすると、どうしても、「3DCG的には、何に使えそうなのか?」という感じの方向に考えていたわけです。
例えば、今までは、普通のパソコンのプリンターでの「印刷色」や、テレビ、ディスプレイなどの「色範囲」のように、「表示、印刷できる色の範囲」は、フルカラーや、色域の拡大などで、もう最大までいったのか?と思いますが、実際の所は、プリンター、テレビ共に、自然界の中で、この色は、出るの?という領域が、まだ残っているわけです。
例えば、
<微妙な色域範囲>
「コバルトブルー」
「エメラルドグリーン」
「黄昏色」
<見る方向で、色が変化する色>
「パール(真珠)色」
「金、銀などの金属光沢」
「オーロラ、玉虫色、などのように、”動く色”」
など、思ったよりも、印刷や、テレビの色域では出ない色があります。
この中で!どうも!後の方の<見る方向で、色が変化する色>のような物が、「3D立体視テレビは、色域という次元を超えた範囲の表示ができそう!」という事に、自分は、気が付いたわけです!
つまり!今までのテレビでは表現できなかった色である<見る方向で、色が変化する色>の表示ができるようです!
「パール(真珠)色」、「金、銀などの金属光沢」、「オーロラ、玉虫色、などのように、”動く色”」の3つを表示したい場合には、「3D立体視テレビ」で、<見る方向で、色を変化させれば、3DCGでも、そういった表示色が可能です!>
また、「宝石」などは、「透明な厚みを持った色域(?)」というか、見え方の領域を持たせられます!
この「宝石などの厚みを持った透明色」は、どうも、3DCG業界では、面白そうな表現ができそうで、「サイバーな感じの、アンドロイド少女の透明な瞳」などを、この方法で、3DCG表現で表示すると、「相当に、リアリティーと、厚みのある透明感を持った瞳の色が表現できそう!」です!
(「色とは何なのか?」(赤や、青(X)、色とは、光線や波長の事))
そもそも、「色とは何なのか?」と考えた場合に、赤や、青じゃないの?ではなくて、「サイエンス的」に考えれば、この現象がわかります。
テレビや、プリンターといった物は、実は、「色を表示する為に技術設計されているわけではない」ので、正確に言えば、「赤、青などが表示できるように設計されています。」(似ているようで、技術設計的や、サイエンスでは、設計構想、概念が、完全に違います。)
どこが違うのか?というと、サイエンス的では、「色とは、物体の吸収光、反射、屈折、回折といった波長の結果」が、できるように技術設計を、本来は、しなくてはいけないのです!
ここで、「パール(真珠)色」「玉虫色、シャボン玉の虹色」「オーロラ」のような物が、どうして、そのような「見る方向で色が変わる色合い」を持っているのか?が、「色とは、物体の吸収光、反射、屈折、回折といった波長の結果」の考え方で、ようやくわかるわけです!
つまりは、「光線の具合を設計する!」という考え方です。
これで、「光線の波長現象で起こる物は、何色でも表示できるようになるわけです。」(本来は、この設計をするのが、色を表示するという事)
テレビや、プリンターでは、赤や、青が表示できるように設計しているので、「真珠色」「玉虫色」などは、「光線の波長の色合いの表示ではなくて、赤や、青に擬似的に置き換えられた色(つまり、赤や、青という事)に変わってしまっているわけです!」
評価:
--- パナソニック ¥ 278,900 (2010-04-23) |
評価:
--- ソニー ¥ 208,800 () |
評価:
--- パナソニック ¥ 69,980 (2010-04-23) |
評価:
--- パナソニック ¥ 89,800 (2010-08-31) |
評価:
--- パナソニック ¥ 29,800 (2010-08-31) |
「3D立体視映像」が撮れる「3Dハイビジョンデジタルビデオカメラ」が発売された!
今年に入ってから、「3D立体視テレビ」が、ついに!たくさん発売されて、ゲーム機の方も「Nintendo3DS」で「3D立体視対応ゲーム機」が発売されるようで、ようやく!「初音ミク」ちゃんも、「21世紀はじめの電子の歌姫として、3D立体空間での、バーチャルステージ!」が実現できる技術が揃ってきました!
そして!どうも、パナソニックが、「3D立体視ハイビジョンデジタルビデオカメラ」を発売しました!
これで、普通の一般の人も、「3D立体視テレビ」で「撮って!見る!」の両方ができるようになったようです!
ソニーの方は、まだ本腰を入れていませんが、この「3D立体視映像の動画が撮れる!」「3D立体視ハイビジョンデジタルビデオカメラ」は、その内発売する事でしょう!
パナソニックの方は、「3D立体動画」の映像記録の仕組みとして、「サイドバイサイド」方式を採用しています。
撮る仕組みは、普通の「ハイビジョンデジタルビデオカメラ」の前に、「3D立体視専用レンズ(3Dコンバージョンレンズ)」を取り付ける仕組みで、「サイドバイサイド」方式という物は、「ハイビジョン画面の左右に半分ずつ記録しておいて、3D対応テレビなどの方で、分ける方式」です!
なので、「3Dコンバージョンレンズ」というのを外せば、普通の「ハイビジョン」で撮れます!
これは、互換性が非常に高く、3D立体視テレビ放送でも、現行のハイビジョン放送の仕組みと、あまり変えなくても放送できるので、それが使われています。
また、ただ「画面の左右に分けているだけ」なので、通常の「ブルーレイディスクレコーダー」でも、録画したりできるような「互換性」が、とても高いわけです!
しかし、その反面、横の画素数が、半分になってしまう為に、「フルハイビジョン」のような綺麗な画質では再生できないのが、難点です。
しかし、この「3D立体視テレビ」関連は、まだ今年にはじまったばかりなので、今後は、普通の綺麗なハイビジョン画質でも「3D立体視動画」を自分で撮れる機種が出てくるのは、すぐでしょう!
ようやく、「21世紀」っぽい感じになってきて、いい感じですが、それにしても、「自分で、3D立体視映像を撮って、見れる!」なんて事が、できるようになった時代なのは、凄い事です!
ので、興味がある人は、やってみましょう!
なんか、最近、「3D立体視テレビ」用の「3D立体視グラビア」なる物のブルーレイムービーが出たようです。
(C)GUST CO.,LTD. 2010
「トトリのアトリエ」で「ツェツィー」が戦闘中でも使えるようになる!続報の第2弾!です!
現在は、どうも、ダウンロードコンテンツの開発中のようで、1キャラを「戦闘中でも使えるキャラ」にするには、けっこう、技とか、セリフとかを作ったりしなければいけない為に時間がかかるようです!
といっても、昔と違って、ダウンロードコンテンツのいい所は、「数年後に、新機種が出た時に、リメイク」が今までの常でしたが、そうすると、声優の声の雰囲気が違くなってしまっていたりして、結局できなかった事とかが、今までのゲーム業界ではあったわけですが、現在では、「発売した後のユーザーの反響を見ながら、若干リメイク」できるので、現役のままの雰囲気の勢いで作ってしまえる所が、昔のゲーム業界ではできなかった事です!
「ツェツィー」といえば、「御者のペーター」ですが、最近のはやりでは、グラマーな女性キャラは「馬に乗って走る(歩く)掟」があるようですが、ミニイベントで、「ペーターの馬にツェツィーが直接乗せてもらう!」とかも作ってほしい感じです!
ツェツィーの武器っぽい「はたき」も「錬金術」で調合して強化できるのか?とか思いましたが、ダウンロードコンテンツでは、どこまでできるのか?が不明です。
という事で、「ツェツィー」の戦闘シーンですが、「か弱いトトリちゃん」と違って、かつては、「メルヴィア」と冒険した(らしい)設定なので、「ツェツィーは、力技!」か?という感じですが、日用品の「はたき」などを使って攻撃できる模様です!
(「ツェツィーの攻撃技(はたきブーメラン)」の連続画像(?))
(そもそも、「はたき」は、ブーメランなのか?)
(と思ったが、たぶん、メルヴィアと同じ、斧の飛び方モーションを使っているのか?)
(なぜか?敵キャラと走るツェツィー!たぶん、”かわいい動物”が好きという設定で、味方にして攻撃できるのか?)
(ロロナも、モデル鑑賞モード。アクションもできるらしい)
(ツェツィーの「おうえん」!)
(トトリと、ツェツィーの、スペシャル姉妹アタックか?)
評価:
--- ガスト ¥ 9,300 (2010-06-24) |
評価:
ゲーム・ミュージック,山本美禰子,mao SMD ¥ 2,980 (2010-06-23) |
評価:
電撃プレイステーション編集部 アスキー・メディアワークス ¥ 1,890 (2010-07-24) |
評価:
--- Max Factory ¥ 2,080 (2010-08-25) |
評価:
--- グッドスマイルカンパニー ¥ 5,913 (2010-12-25) |