CALENDAR
S M T W T F S
1234567
891011121314
15161718192021
22232425262728
293031    
<< March 2020 >>
CATEGORIES
ARCHIVES
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
PさんのためのMikuMikuDanceモーション作成教室
PさんのためのMikuMikuDanceモーション作成教室 (JUGEMレビュー »)
かんなP,ポンポコP,ショ大河P,6666AAP
(MikuMikuDance関連本4冊目!)
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
初音ミク・アペンド(Miku Append)
初音ミク・アペンド(Miku Append) (JUGEMレビュー »)

「VOCALOID2初音ミク」用追加声色音源!!「恋歌」も歌える![Sweet][Dark][Soft][Vivid][Solid]の5種類の声色が入っていて追加されます!
RECOMMEND
RECOMMEND
RECOMMEND
Metasequoiaスーパーモデリングガイド
Metasequoiaスーパーモデリングガイド (JUGEMレビュー »)
かこみき
「実写のようなかっこいいリアルなバイク」「綺麗な女性の実写調3DCGモデリング」本(かこみき氏著)
RECOMMEND
キャラクターをつくろう! 3DCG日和。 vol.2 - MikuMikuDanceで踊る、ユーザーモデル制作
キャラクターをつくろう! 3DCG日和。 vol.2 - MikuMikuDanceで踊る、ユーザーモデル制作 (JUGEMレビュー »)
かこみき
「かこみき」氏著によるMikuMikuDance関連本では、3冊目になる予定の3DCGモデリング本。
RECOMMEND
キャラクターをつくろう! 3DCG日和。
キャラクターをつくろう! 3DCG日和。 (JUGEMレビュー »)
ISAO
3DCGの初心者を見捨てない「ISAO」氏の著書。お勧め!
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
初音ミク -Project DIVA- 2nd 特典 ねんどろいどぷらす「初音ミク Project DIVA」特典Ver チャーム付き
初音ミク -Project DIVA- 2nd 特典 ねんどろいどぷらす「初音ミク Project DIVA」特典Ver チャーム付き (JUGEMレビュー »)

PSP版「初音ミク」のダンスリズムステージゲーム!前回大人気!だった初回限定版の「ねんどろいどぷらす」付きは売り切れやすいので早めに予約しましょう!
RECOMMEND
クイーンズブレイド 美闘士スリムポスター BOX
クイーンズブレイド 美闘士スリムポスター BOX (JUGEMレビュー »)

1BOXで、全16種類が揃う長〜いポスター。
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
Re:Package(初回限定盤)
Re:Package(初回限定盤) (JUGEMレビュー »)
livetune feat.初音ミク,初音ミク
RECOMMEND
Re:MIKUS
Re:MIKUS (JUGEMレビュー »)
livetune feat.初音ミク
RECOMMEND
RECOMMEND
supercell (通常盤)
supercell (通常盤) (JUGEMレビュー »)
supercell feat.初音ミク
社会現象を引きおこした「初音ミク」のCD
RECOMMEND
初音ミク-Project DIVA- Original Song Collection
初音ミク-Project DIVA- Original Song Collection (JUGEMレビュー »)
Project DIVA Original Song feat.初音ミク,kz,トラボルタ,畑亜貴,OSTER project,神前暁
初音ミク Project DIVA にだけ入っている曲をセレクト
RECOMMEND
ワンフェス 2009 限定 figma初音ミク ライブステージver.
ワンフェス 2009 限定 figma初音ミク ライブステージver. (JUGEMレビュー »)

ワンフェス特別限定版の、Figma 初音ミク 可動フィギュアです。
RECOMMEND
Figma 初音ミク
Figma 初音ミク (JUGEMレビュー »)

動くフィギュアの「初音ミク」です!
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
MOBILE
qrcode
<< ブルーレイレコーダーで、オープニングや予告の最後の音が消えてしまう現象について(暫定対処「アンドゥ」) | main | 2020年1月近辺開始っぽいアニメ >>
ディープラーニングで勝手に歌うマイクロソフトの女子高生AIりんな

テレビで、「人工知能と人間の歌対決」なる番組がやっていて、VOCALOIDの事かなと思って見ていたのですが、全然違って、おそろしい事に、「ディープラーニングで勝手に歌う」ようで、VOCALOIDのように人間が細かい調整をする必要がありません。
出ていたのは、「マイクロソフトの女子高生AIりんな」で、人工知能なので、歌を歌うのはただの一芸の方で、おしゃべりやいろいろな事ができるようです。
「マイクロソフトの女子高生AIりんな」の歌声は、本当に女子高生が歌っていると言われれば信じてしまう位です。(ディープラーニングによって大量の歌声の特徴を学習しているので)

 

(マイクロソフトの女子高生AIりんな)
https://www.rinna.jp/

 

前に書いたように、「VR制御技術」、「VTuber制御技術」の発展により、YAMAHAのVOCALOIDや初音ミクという技術が急速に過去の技術になりつつあります。
この原因は、「スタート地点やゴール地点を、人工音声技術にしたか、人工知能として捉えているか?」というエンジニアの判断ミスによるものです。
自分は、先端技術が好きなので、そもそも初めから「VOCALOID」や「初音ミク」は、「人工知能を構成するための音声合成技術の1つ」という視点でしか捉えてこなかったので、最近は、「本当に考えられる人工知能を作るにはどうすればいいか?」という話題を常に考えているわけです。
「女子高生AIりんな」の人工知能としての実力は恐ろしいもので、歌にしてもおしゃべりにしても、「本当の女子高生がしゃべっている」のとまったく区別が付かない位です。
これは、ある意味、人工知能の馬鹿っぽい部分が、現代の進化した人工知能だと、現実の女子高生が向こうにいると言われれば納得する位にまで高性能になったからです。

 

(音声合成技術をどのようにディープラーニングさせるか)
マイクロソフトがどのように、音声合成技術をディープラーニングさせているのかは不明ですが、YAMAHAのVOCALOID技術は、音声合成技術自体の環境は整っているので、おそらくは、VOCALOIDでユーザーが声の波形をいじる画面下の部分を、ディープラーニングによって、大量の実際の歌声から学習させているものと思われるので、YAMAHAやクリプトンなどのメーカーのエンジニアの意識改革の方で、「人工知能開発」に対して、予算とGoサインを出せば、すぐにでも、「マイクロソフトの女子高生AIりんな」のような事が可能でしょう。

 

(やるべき事)
なぜ?このような結果になってしまったのか?というと、前から自分が美術の話で書いているように、キリスト教圏の欧米は、「人間は神を真似て作られたものであるから、人間の完全な再現を模倣できるようにする事が神の知恵に近づく道である」という思想から欧米のエンジニアは動くので、「女子高生AIりんな」にしても、海外の二足歩行ロボット技術にしても日本ではできない次元の所まで先端技術開発する事が得意です。
日本は、「一部分のみを開発する」事が得意ですが、結果として、「木を見て森を見ず」という「ただのパーツを作って終わり」となるわけです。

 

(やるべき技術課題)
先端技術開発が得意な欧米のマイクロソフトや、Googleの利点は、世界企業なので、すぐに「世界中全ての言語データを集めやすい」事です。
・音声合成技術としてやるべき事は、「全ての言語の音素を集める事」で、いわゆる「発音記号」にあたる部分は全て音声として再現できないといけません。
自分は言語学をやっているので、細かく説明すると、日本は敗戦の影響で、「海外の外国語は、英語の枠を1度通してから見る」という最悪の失敗をしています。
日本にとって、「世界とは英語である」わけで、そんな馬鹿な話は無くて、ヨーロッパへ海外旅行へ行けば、世界の人々は、フランス語やドイツ語など現地語で話しています。
現在、日本で進めている「英語教育」は、すでに戦後直後の時代遅れな発想でしょう。
ですから、日本人は、英語を基準にして物事の把握をしようとする悪いクセがあるので、言葉の「発音記号」は子音と母音から成るといった英語偏重の物事の見方をしてしまい、エンジニアリングの設計として大失敗をするわけです。
自分は言語学をやっているので、細かく説明すると、最もマイナーな言葉の音素を書けば、アフリカの言語では、舌か何かを強く打ち付けて鳴らす「コンッ」とか、舌打ちの「チッ」に似た音も単語を構成する発音に含めます。
モンゴル民族の有名な「ホーミー」は、1つの発声の音階が1つではなく、同時に複数の音階を鳴らす事ができます。
このように、起きている自然現象を1つ1つ忠実に再現できるようにしていった積み重ねがエンジニアリングです。
エンジニアリングの理屈から考えて、世界企業で、すぐに「世界中全ての言語データを集めやすい」マイクロソフトや、Googleには、もうYAMAHAやクリプトンはかなう事ができないでしょう。
・人工知能開発の為の世界中の全ての言語の言語学が必要
・人工知能開発と、ディープラーニングを、音声合成技術開発としてGoサインを出す必要がある。
エンジニアリングとして必要な事は、予算や採算ではなくて、「設計構想」の方です。
「マイクロソフトの女子高生AIりんな」の方は、すでに、設計構想として、全てを再現できる土台が中に備わっています。
YAMAHAやクリプトンの方は、設計構想として、全てを再現できる土台が中に内在されていません。
「設計構想」をミスると、永遠に作業を進めても実現が不可能なのが、エンジニアリングというものです。

 

(追記)
(アフリカの言葉に含まれる音素のクリック音)
アフリカの言葉に含まれる「コンッ」とか、舌打ちの「チッ」のような音素は、言語学では、「クリック音(click)」、「吸着音」と呼ばれています。
声帯を使わないで、舌を打ち付けて鳴らす音のたぐいの事です。
「ファナカロ語」、「ズールー語」、「コイサン語」、「コサ語」、「コン語(ǃXóõ)」なんかと「クリック音(click)」で検索すれば、動画でたくさん実際の発音を聞く事ができます。
主に、舌を強く叩き付ける音に母音を混ぜていくような「コンッ」、「ポンッ」という音と、舌打ちなどの「チッ」、「チュッ」の音に母音を混ぜていくような発音があります。
人工知能の技術的に必要な事は、こういった全ての言語の音素の収集と再現ができる事で、ビッグデータ収集による「単語の実際の発音のデータベース」と解析が必要になります。
YAMAHAのVOCALOID技術では、「楽譜入力ソフト」をベースにしているので、この主にアフリカの言語に非常に頻繁に用いられる「クリック音(click)」の再現は困難でしょう。
マイクロソフトや、Googleなどの方は、スタートの地点を「人工知能」、「ディープラーニング」、「ビッグデータ」にしている事で、今のままのシステムのままでも、このアフリカの言語の「クリック音(click)」も含めた全ての言語の再現が可能でしょう。
YAMAHAのピアノが世界の一流ピアニストに選ばれない理由は、この辺りにあって、YAMAHAは「商業的」な所の範疇から抜けられないし、そこをスタート地点とゴール地点にしているからです。
例えば、「音声合成技術」というエンジニアリングの話で言えば、世界で選ばれる基準は、「実際の人々に役立つか」であって、世界の「音声合成技術」では、主に、交通事故や戦場などで声を失った人々の為に開発されています。
ですから、世界中の全ての人々の言語の音素を忠実に再現できるという所に、マイクロソフトや、Googleなどの方は、そもそものスタート地点、ゴール地点を設定しているので、やがて最終的には世界中の人々に選ばれるエンジニアリング技術として完成します。
YAMAHAは「商業的」な範疇のエンジニアリングからスタート地点も、ゴール地点も思想として設定してしまっているので、要するに、「人々を見捨てた」というエンジニア思想・哲学になってしまってやがて選ばれなくなってしまう。というわけです。
YAMAHAはそもそものスタート思想は、「世界中の音楽を楽しむ」だったはずで、せっかくVOCALOID技術のように「音声合成技術」を開発したのだから、世界中の全ての言語の音素を再現できるようにして、世界中の全てのアーティストが楽しめるようにするべきです。
YAMAHAのVOCALOID技術では、「楽譜入力ソフト」をベースにしているので、「世界中の全ての言語で話す」ようにする事は非常に困難です。
マイクロソフトや、Googleなどの方は、「人工知能」、「ディープラーニング」、「ビッグデータ」にしている事で、世界中の全ての言語で「歌う」、「話す」、「考える」事が同時進行的にできるようになっています。
エンジニア思想や哲学の違いで、ここまで差が開いてしまうわけです。
例えると、日本のエンジニアは、「木」を作る時に、「葉っぱ」、「幹」のようなパーツ部分だけを一生懸命作って、それをつなぎ合わせたら「葉っぱと幹」にはなっても「木」にはならない。
欧米は、スタートの地点を、美術哲学の「お手本である神が作った人やいろいろな物をそのまま再現する事」からスタートするので、はじめから「木」を作ろうとしているわけです。
まだまだ人類は、もっと上の次元に行く事ができます。

評価:
Array
avex trax
¥ 250
(2019-06-19)

| 先端技術 | 10:37 | - | - | -
スポンサーサイト
| - | 10:37 | - | - | -