CALENDAR
S M T W T F S
  12345
6789101112
13141516171819
20212223242526
27282930   
<< September 2020 >>
CATEGORIES
ARCHIVES
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
PさんのためのMikuMikuDanceモーション作成教室
PさんのためのMikuMikuDanceモーション作成教室 (JUGEMレビュー »)
かんなP,ポンポコP,ショ大河P,6666AAP
(MikuMikuDance関連本4冊目!)
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
初音ミク・アペンド(Miku Append)
初音ミク・アペンド(Miku Append) (JUGEMレビュー »)

「VOCALOID2初音ミク」用追加声色音源!!「恋歌」も歌える![Sweet][Dark][Soft][Vivid][Solid]の5種類の声色が入っていて追加されます!
RECOMMEND
RECOMMEND
RECOMMEND
Metasequoiaスーパーモデリングガイド
Metasequoiaスーパーモデリングガイド (JUGEMレビュー »)
かこみき
「実写のようなかっこいいリアルなバイク」「綺麗な女性の実写調3DCGモデリング」本(かこみき氏著)
RECOMMEND
キャラクターをつくろう! 3DCG日和。 vol.2 - MikuMikuDanceで踊る、ユーザーモデル制作
キャラクターをつくろう! 3DCG日和。 vol.2 - MikuMikuDanceで踊る、ユーザーモデル制作 (JUGEMレビュー »)
かこみき
「かこみき」氏著によるMikuMikuDance関連本では、3冊目になる予定の3DCGモデリング本。
RECOMMEND
キャラクターをつくろう! 3DCG日和。
キャラクターをつくろう! 3DCG日和。 (JUGEMレビュー »)
ISAO
3DCGの初心者を見捨てない「ISAO」氏の著書。お勧め!
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
初音ミク -Project DIVA- 2nd 特典 ねんどろいどぷらす「初音ミク Project DIVA」特典Ver チャーム付き
初音ミク -Project DIVA- 2nd 特典 ねんどろいどぷらす「初音ミク Project DIVA」特典Ver チャーム付き (JUGEMレビュー »)

PSP版「初音ミク」のダンスリズムステージゲーム!前回大人気!だった初回限定版の「ねんどろいどぷらす」付きは売り切れやすいので早めに予約しましょう!
RECOMMEND
クイーンズブレイド 美闘士スリムポスター BOX
クイーンズブレイド 美闘士スリムポスター BOX (JUGEMレビュー »)

1BOXで、全16種類が揃う長〜いポスター。
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
Re:Package(初回限定盤)
Re:Package(初回限定盤) (JUGEMレビュー »)
livetune feat.初音ミク,初音ミク
RECOMMEND
Re:MIKUS
Re:MIKUS (JUGEMレビュー »)
livetune feat.初音ミク
RECOMMEND
RECOMMEND
supercell (通常盤)
supercell (通常盤) (JUGEMレビュー »)
supercell feat.初音ミク
社会現象を引きおこした「初音ミク」のCD
RECOMMEND
初音ミク-Project DIVA- Original Song Collection
初音ミク-Project DIVA- Original Song Collection (JUGEMレビュー »)
Project DIVA Original Song feat.初音ミク,kz,トラボルタ,畑亜貴,OSTER project,神前暁
初音ミク Project DIVA にだけ入っている曲をセレクト
RECOMMEND
ワンフェス 2009 限定 figma初音ミク ライブステージver.
ワンフェス 2009 限定 figma初音ミク ライブステージver. (JUGEMレビュー »)

ワンフェス特別限定版の、Figma 初音ミク 可動フィギュアです。
RECOMMEND
Figma 初音ミク
Figma 初音ミク (JUGEMレビュー »)

動くフィギュアの「初音ミク」です!
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
MOBILE
qrcode
本当の人工知能や、IoTの実現に必要な概念(モジュール、ガジェット、プラグイン、Mod)

 

今、私達が、人工知能とか、IoT(Internet of Things)(物のインターネット)と呼んでいるのは、本来、2030年頃にくるはずの状態のものとは著しくかけ離れすぎていて、だいぶ足りないので、必要な事を書いていきます。
現在、私達が、人工知能とか、IoTと呼んでいるものは、「単独の製品で動いている」いわゆる「メーカー既製品」という概念で、これでは、「本物の人工知能とか、IoT」にはなりません!
「本物の人工知能とか、IoT」の作成に必要な技術というものは、「外部に拡張できる。自身を機能拡張できる。他と連携できる」という技術や、その規格化が必要です。

 

(「本物の人工知能とか、IoT」技術に必要な概念)
・モジュール
・ガジェット
・プラグイン
・Bluetoothとかの「他と連携できる」仕様
・Mod

 

(1) モジュール(module)
「モジュール」というのは、パソコンでいえば、「グラフィックカード」、「TVチューナーカード」とかみたいに、本体の機能拡張ができるハードウェアの事です。
本体部分に、「拡張スロット」部分があって、そこに、ぶっ刺す事で、本体が、ハードウェア的に機能拡張します。
わかりやすいように書くと、この間やっていた人工知能を題材としたテレビアニメの「BEATLESS」の「レイシア」とか、大昔の国産パソコン時代の「サイキックウォー」の「女性型アンドロイド」でいえば、「本体部分を開けて、中身に刺すカードとか、もっと扱いやすいゲームカートリッジのような形状のモジュールを刺して、本体をハードウェア的に機能拡張する」ような感じの部分です。
「モジュール」化する事の特徴は、
・後で、「ハードウェアの拡張ができる」
・「モジュール」化したパーツは、(Ver.2.03)とかのように、改良したモジュールに交換できる
・空きスロットが無くなりそうな場合には、2つ以上のモジュールを改良してくっつけてしまって、1つのモジュールパーツにしてしまう(主に、LSI化する)
・消耗品や、壊れやすいパーツの場合でも、「モジュール」化しておけば、モジュールだけ交換すればいい

 

(2) ガジェット(gadget)
「ガジェット」は、けっこう幅広い意味で使われますが、主な意味は、「小道具」の事です。

 

<ガジェット>
(ハードウェア)デジカメ、iPod、PDA、電子手帳などの持ち運べる小道具
(ソフトウェア)時計アプリ、天気予報アプリ、カレンダーアプリ、ニュースアプリなど

 

「本物の人工知能とか、IoT」の作成の場合には、「本体の外側で機能拡張して、小道具化できる」物の部分です。
例えば、初期のPSPには、「外部拡張スロット」があって、「GPSレシーバー」とかの、「本体の外側の拡張スロットに付けて、機能追加できる」部分がありましたが、ああいう感じの部分が、「ガジェット」部分です。
しかし、「メーカー個別仕様の外部拡張スロット」は、ほとんど使い道がないので、後で発売される廉価版の本体では、「外部拡張スロット」ごと消滅する事が多いです。
現在では、「USB」という共通規格ができた事で、様々な家電で、「外部拡張ハードの追加」が可能になったわけで、これが、本当の意味の「本物の人工知能とか、IoT社会」に必要不可欠な概念です。
現在、喫緊の課題では、「2020年東京オリンピック8Kテレビ放送」の規格を決めなければいけませんが、NHKは、インターネットのNHKでは、「360度映像」も配信するとか言っていたわけですが、これから発売する「8Kテレビ」には、「外部USB端子」などの国際共通規格の外部接続端子で、「360度VRゴーグル」などを接続可能にするなど、「未来のハードウェア的な拡張性を残す」事が可能なのが、USBなんかの「外部」との連携ができる端子です。
現在は、すでに、「スマートフォン」自体が、「ガジェット」の中心になっているので、「いろいろな家電、車、バイク、オーディオなどに、スマートフォンをぶっ刺して、必要な機能を家電側に与えたり、逆に、スマートフォン側をガジェット化する為に必要な機能やデータを、スマートフォンに入れる」なんかのように、相互に連携して機能的、有機的な感じに家電が動くような現在になっていますが、こういう状態が、本当の意味の「本物の人工知能とか、IoT社会」に必要不可欠な概念です。
「本物の人工知能とか、IoT社会」では、このようにして、「人工知能と人間とをつなげる役割の仕様」の部分が必要不可欠です。
単独のメーカー仕様で、「単独で動作している人工知能」は、人工知能ではありません。

 

(ガジェットとアプリ)
ソフトウェアと、「ガジェットやアプリ」との違いは何なのか?といえば、現在のiPhone、iPadや、Androidスマートフォンなんかでは、「本体自体が持っている機能や情報」を、「他のアプリ、ガジェットと連携しやすくなっている」という仕様の根本的な違いがあります。
ソフトウェアというものは、各メーカーごとに独自の規格で成り立っていて単独です。
「ガジェットやアプリ」では、「本体自体が持っている機能や情報」が、共通して、他の全てのアプリに、外に出せて共通で利用できるような仕様になっているわけです。
わかりやすい例で書けば、iPhoneの「万歩計アプリ」なんかでは、「iPhone本体が万歩計の計測を常に行っている。本体に登録されている個人の情報の体重、身長、年齢、性別、血糖値などのデータがある」わけですが、この「本体が管理して持っているデータ」が、他の全てのアプリが扱える仕様になっているわけです。
このように、「外部との連携がしやすくなっている」仕様を持つものが、「ガジェットやアプリ」と呼ばれるもので、大きな概念の違いがあります。
「メーカー独自仕様」、「メーカー独自規格」という昭和の時代の常識では、非常に扱いづらかったので、「外部拡張」があるのに、全然使われずに、どんどん消滅していくだけの意味のない仕様でしたが、21世紀の現在では、根本的な発想や概念、哲学を変えたわけです。
この国際共通規格による「外部との連携がしやすくするハードウェア、ソフトウェア」の仕様というものが、とても大事な概念になってきます。
国際共通規格による「外部との連携がしやすくするハードウェア」の部分は、外部拡張端子としては、現在では、「USB端子」などの事です。
「外部との連携がしやすくするソフトウェア」の部分の事を、「プラグイン」といいます。

 

(3) プラグイン(plug-in)
ハードウェアが、モジュールや、外部拡張端子で、機能追加できるように、ソフトウェアも「プラグイン」という共通仕様で機能拡張できます。
要するに、「BEATLESS」の「レイシア」的な人工知能を作りたい場合には、ハードウェア部分の機能拡張の「モジュール」や、外部に一部機能を持ち出せる「ガジェット」という概念(例えば、スマートフォンをレイシアにぶっ刺して、必要な機能やデータを持ち運びやすい形にする機能。ぶっ刺す必要は無い気もするが)と、ソフトウェア的な外部との連携機能や機能追加の「プラグイン」という仕様を作らないといけない。

 

(4) Bluetoothとかの「他と連携できる」仕様
現在の「人工知能や、IoT」に足りない技術の部分が、「他と連携できる」仕様の部分です。
2つ以上の「人工知能や、IoT機器」が、「他と連携できる」仕様によって、「ハイブマインド」のような大量の個体同士が交信や連携をしながら、複雑な「社会性」を持った「有機的」な動作が可能になります。
「人工知能が魂を持つ」とか「人工知能に魂を入れる」とかができるようになるには、こういった「有機的」な動作が可能になった後です。

 

(5) Mod(Modification)
実際に、人工知能を作る場合に重要な技術が、「Mod(Modification)」の技術で、「Mod」は、ゲームの「魔改造」の事ですが、人工知能を作る場合には非常に重要な技術になってきます。
現在の「パッチ」とは違って、技術仕様としての「Mod」が、きちんした技術の規格となった場合には、「パラダイム・シフト(既存概念の崩壊と、新概念の誕生による切り替わりの時期)」が起こるはずで、自分は、今後、非常に重要な技術の要になると考えています。
プレイステーション3時代に、インターネット時代になって、「世界中の人々と対戦ゲームができるようになった」時に、感心した技術が、「会話の定型文による、相互翻訳」という技術や概念です。
自分は、昔は、インターネット時代の、「世界中の人々と対戦ゲームをする」場合には、「スペイン語とかで文字のチャットをする」とかを想定して思い描いていました。
しかし、実際に、プレイステーション3時代に、「世界中の人々と対戦ゲームができるようになった」時には、こちら側で、「こんにちは」という部分を選ぶと、勝手に、「会話の定型文による、相互翻訳」をしてくれて、非常に、スムーズに言葉もわからない外国の人との対戦プレイができた事に感動しました。
ここら辺が、技術仕様としての「Mod」を、きちんとした技術の規格にできる部分で重要な箇所だと思うのですが、例えば、この「会話の定型文による、相互翻訳」というのは、中身は、

 

(日本語、英語、フランス語、ルーマニア語、アイスランド語)
1. こんにちは、Hello、bonjour、Bună ziua、góðan daginn
2. さようなら、goodbye、au revoir、la revedere、bless

 

みたいな感じに、横のつながりで管理しているわけです。
「レイシア」的な人工知能を作りたい場合には、現在の技術では無理で、1番困る事が、「人工知能には、個性を付けられない」という事で、全部、同じしゃべり方になってしまう事です。
技術仕様としての「Mod」が、きちんとした技術や規格の仕様となった場合には、「会話の定型文による、相互翻訳」のように、中身を共通のセットとして規格化する事で、

 

(人工知能の人格やしゃべり方を入れ替える)
(ロボット的な規格化した話し方、ツンデレタイプ)
1. (何をしているのですか?)→(何やってんのよ!)
2. (向こうへ行って下さい)→(アッチ行ってよ!このバカッ!変態!)
3. (死にたいのですか?)→(あんた馬鹿なの?死ぬの?)

 

のように、「人工知能の人格やしゃべり方を入れ替える」、「ローカライズが楽になる」とかができるようになるので、自分は、この技術仕様としての「Mod」は、今後、とても重要な技術になってくると考えています。
ゲームでも、技術仕様としての「Mod」が、きちんとした技術や規格の仕様となった場合には、「メーカー公式Mod」によって、「各キャラクターの性格を変える」とかが比較的簡単にバグなしでできるようになったり、主人公の部分を、「3DCGや、会話文の性格の違う話し方」ごと、別のキャラクターの「メーカー公式追加Mod」とかができるようになります。
要するに、「各キャラクターごとの管理で、会話文とかがセットになっている」という仕様にすれば、技術仕様としての「Mod」ができるのではないか?という事で、Unityとかで自作ゲームを作っている人や、「RPGツクール」とか、「マインクラフト」的な、ユーザー自由度の高い「クラフト」型のゲーム設計では、「Mod」という概念は、大事になってくる概念のはずです。

 

(人工知能に人格や個性の差を与える)
現在の「人工知能」の1番大きな問題点は、「まったく同じ個体」が「複数」になってしまう事で、「差が生じない人工知能」では、2人以上の個体で会話させたり、討論させたりさせる事ができずに、「全員が、同じ結論しか言わない」という状態になってしまう事です。
先程書いた「Mod」などによって、個体差を作らない限り、「人工知能」は、2人以上の個体で会話させたり、討論させたりできません。
このような、「まったく同じ個体」が「複数」になってしまった場合には、「ハイブマインド」という「蟻、蜂」のような行動パターンで、一見、社会性に似た動作はさせる事が可能ですが、人間とは、はるかにかけ離れた足りない知性体(昆虫やロボットのように、決まった反応と動作を繰り返すだけ)にしかならず、「シンギュラリティ」も起こりません。
人工知能の1つの個体だけ、どんなに、能力を上げていっても、「シンギュラリティ」は起こりません。
人工知能が、「シンギュラリティ」を引き起こすだけ賢くなる為には、「人工知能ごとに個体差が生じなければいけない」、さらに、「他と連携できないといけない」という事です。

 

今回書いたような技術や概念の話が、「本物の人工知能とか、IoT」技術に必要な概念や哲学であって、「外部に拡張できる。自身を機能拡張できる。他と連携できる」という技術や、その規格化が必要です。
現在の段階では、まだまだ、「本物の人工知能とか、IoT」技術の状態になっていません。

| 考えられる人工知能を作る | 16:56 | - | - | -
学研の科学おもちゃ「歌うキーボード ポケットミク」が、999円で売ってたので買ってきた(今後、人工知能や、IoT時代には、「モジュール化」、「ガジェット化」は大事になる)

 

 

 

学研の科学おもちゃの「大人の科学」シリーズで、「歌うキーボード ポケットミク」が、近所の書店で、999円で売ってたので買ってきました。
鳳凰院凶真「フハハハッ!ついに、未来ガジェットを手に入れたぞ!これも、シュタインズゲートの選択か。エル・プサイ・コングルゥ」

 

((大人の科学)歌うキーボード ポケットミク)
http://www.otonanokagaku.net/nsx39/

 

この「ポケットミク」は、おもちゃかと思ったら、けっこう凄いもので、eVocaloid 対応音源LSI「NSX-1」というのを、YAMAHAが開発して、LSIだけで、「初音ミク」がしゃべります。
「ポケットミク」だけでも話しますが、パソコンと、パソコン用のMIDIソフトを持っていないと、「自分の好きな言葉を話させる、歌わせる」などの本領は発揮できません。
どちらかというと、このeVocaloid 対応音源LSI「NSX-1」というのが面白そうな事ができそうで、LSIを買って、Raspberry Pi で制御して、「初音ミク」のフィギュアに、話させたり、歌わせたりする事ができれば、パソコンなしで、LSIだけで、「初音ミク」がしゃべります。
電波新聞社の「電子工作マガジン」か、学研の「大人の科学」シリーズで、eVocaloid 対応音源LSI「NSX-1」+Raspberry Pi の工作キットとかを出して「モジュール化」あるいは「ガジェット化」できれば、いろいろな事ができそうです。
例えば、2018年の「鳥人間コンテスト」では、電気通信大学が、「らごぱすたん」という「作りたいイメージの仮の人工知能(妄想)キャラクター」を搭載(?)して離陸しました。
実は、エンジニアにとっては、こういった「妄想」は、とても大事で、その瞬間の当時は、「できなくてもいいので、”自分は、こういったイメージの技術をやりたい!作りたい!”という妄想を持つ事」は、とても大事で、どのような発明も、スタートはそこからです。
「できないものを実現する」から、科学であり、発明であり、エンジニアなわけです。
「できないものを実現するには?どうするか?」と、いろいろと頭をひねったり、情報を探す所から科学の実現はスタートします。
それで、このeVocaloid 対応音源LSI「NSX-1」+Raspberry Pi のような「モジュール」、「ガジェット」が実現できれば、「自分の自転車とか、オートバイとか、ヨットとか、人力飛行機で、速度を発音させる」とかはできます。

 

(今後、人工知能や、IoT時代には、「モジュール化」、「ガジェット化」は大事になる)
「モジュール化」、「ガジェット化」して使えるパーツは、今後、人工知能や、IoT時代には、非常に大切になってきます!
現在、私達が、人工知能とか、IoTとか言っているのは、「本当の、人工知能や、IoTではありません!」(ただの既製品利用なだけなので、人工知能でも、IoTでもない)
2030年位になってきた時に、「本当の、人工知能や、IoTの状態になる」と思われますが、何が、現在と違うのか?というと、「モジュール化」、「ガジェット化」したパーツを、人工知能とか、IoTとかに、「自分好みにカスタマイズして、くっつける」という時代が、「本当の、人工知能や、IoTの時代」です。
「モジュール化」、「ガジェット化」というのが、1番よくわかりやすいイメージが、現在、私達がやっている「スマートフォン」を、いろいろな物に、「ぶっ刺して使って、機能拡張する仕組み」のような物が、「モジュール化」、「ガジェット化」したパーツです。
2030年位になってきた時に、「本当の、人工知能や、IoTの状態になる」わけです。
現在の私達のパソコンというものは、元々は、「国産パソコン」時代には、「別々の仕様」の物でした。
しかし、「DOS/V」と呼ばれる規格が、「仕様を全部バラして公開した」事で、一気に、世界主流になったわけです。
その時と、同じような事が、自分が今書いてしまっているので、2020年位に、「パラダイムシフト(既存概念の崩壊と、新概念の誕生による切り替わりの時期)」が起きて、現在のいろいろな物に、「スマートフォンをぶっ刺す端子」の共通規格の仕様の公開と、その仕様に沿った「モジュール化」、「ガジェット化」したパーツ(自作も当然可能)を、いろいろな物に、「ぶっ刺して、機能拡張できる時代」が、2030年頃にきて、これが、本当の意味での、「本当の、人工知能や、IoTの状態になる」というわけです。
例えば、自分の持っているオートバイの、このスマートフォンをぶっ刺す端子があっても、現在は、「音楽を聴く」位しかできませんが、そうではなくて、「オートバイを自分の運転スタイルなんかに最適化した制御ができる」ようになるので、もっと燃費とかが向上します。
「DOS/V」と呼ばれる規格ができた当時と同様にして、この「パラダイムシフト」の共通規格の登場によって、社会全体の生活スタイルは大きく変わり、経済効果も、かなり巨大なものができます。
これが、「本当の、人工知能や、IoTの状態」です。
今自分が書いたネタだけで、アニメやSFのストーリーが、10000位作れるはずです。

 

((大人の科学)「テルミンmini+」も買ってきた)
(大人の科学)「テルミンmini+」も、1200円のセール価格で売っていたので買ってきました。
「テルミン」というのは、ロシアの発明家レフ・セルゲーエヴィチ・テルミンが作った電子楽器です。
空中にかざした手と、アンテナの距離で、音階が作られるという不思議な楽器ですが、無段階のアナログ制御なので制御が難しく、音楽として成り立たせるのは、ほとんど不可能です。(フニャフニャした音が出る。昔は、お化けが出るシーンで使われていた楽器)
自分の考えでは、この「テルミン」の仕組みを使って、「人間の声を出せる」はずで、やり方は、8ビットパソコンとかの時代にあった「サンプリング音声合成」のやり方とまったく同じで、「テルミン」の場合には、「アンテナと、導電性のある物体との距離」を、「サンプリング音声合成」のやり方とまったく同じように、非常に精密に制御できれば、「テルミン」の仕組みを使って、「人間の声を出せる」はずです。(「サンプリング音声合成」の仕組みと同じなので、ピアノの音とかも出せるはず。要するに、カセットテープとかの録音した音を、そのまま再生しているのと同じなのが、「サンプリング音声合成」=「波形合成」)
もし、人間に魂があれば、ニコラ・テスラやエジソンの悲願だった、「霊界」との交信が可能になるかもしれません。
「マトリョーシカ」の中に、「テルミン」を入れた「マトリョミン」というカオス楽器があるようです。

| 考えられる人工知能を作る | 04:53 | - | - | -
人工知能による禁止ワード除外判定の難しさ(「予定調和」をやっていると「人工知能側が人間の知能を追い越す」とされる時代の特異点とされる「シンギュラリティ(Singularity)」の発生する時期は、かなり早まるはず)

 

 

 

 

前回、「人工知能が間違った計算をする原因」の中で、「単語の処理の間違い」の「形態素解析」の間違いで、現在の人工知能に、「パチンコ」と入力すると、人工知能側は、「男性器」の意味で間違って処理してしまう問題の発生で、「禁止ワードには、除外判定が必要である」という事がわかったので、今回は、その除外判定の仕方について考察していきます。

 

(人工知能による禁止ワード除外判定の仕方)
<「パチンコ」が「男性器」ではないと人工知能に教える方法>
これは、とても簡単で、
(1) 「禁止ワード」辞書の検索で、まず、ヒットさせる。
(2) ヒットした文字列部分は、前後の文脈で偶然、その文字列になっている事がほとんどなので、再び、「禁止ワード除外辞書」(例えば、「パチンコ」、「いちまんこ」など)で検索をかけて、ヒットしたら、除外する事で、かなり正確に判定できるようになる。
しかし、現実には、「パチンコ」、「いちまんこ」のようなすでに区切りのある単語の位置以外の方で、偶然に、前後の文章で、そういう文字列の順番になる事の方がはるかに多いので、それは、クラウドに大量に文書データ分析結果を集めて集積していく以外に対処方法がない。

 

<Googleなどによる禁止ワード除外判定のより複雑な処理>
現実には、Googleなどによる禁止ワード除外判定のもっと複雑な処理が入っているので、非常に参考になるので、それを書くと、
(1) 「禁止ワード」ヒット!
(2) 内容によって除外判定する。
一般に、規約や約款などに書かれている「禁止ワード」判定は、一概には言えないので、「内容によって除外判定する」という事をしています。
Googleなどの場合には、「禁止ワード除外判定」のプロセスとして、けっこう複雑な処理をしていて、
・「アダルト」は原則禁止だが、「学術」、「討論」、「弁論」、「美術」、「芸術」などは除外される。(例えば、医者の不妊症分析の資料中に、女性器の写真があった場合には、正しい弁論の手法として認められる。当たり前ですが、これが認められないと、学術、討論の妨害となって、現実の世の中で、問題解決の学術発展が不可能になるからです)
・「アダルト」、「卑猥」などは原則禁止だが、「差別」にならないように配慮する必要がある。(「性的趣向」の違いによる「差別」の禁止)
例えば、「俺は、貧乳が大好きだ!」というコメントがあったり、「貧乳について熱く語っている」ような人がいた場合には、この発言は、禁止事項には当たりません。
もし、こういった発言を禁止したり、削除対象とした場合には、(「性的趣向」の違いによる「差別」の禁止)の方にあたるので、禁止や削除した側が、「差別をした」事になってしまうわけです。(「差別」が、「人権侵害事項」にあたる)
ここら辺の判定が、現在の人工知能の判定処理では無理のようで、人間による判定しかやる方法がないようです。
つまり、「文章全体を深く読み込んで、書いてある内容を正確に判定する」という処理が、現在の人工知能にはまだできません。(「パチンコ」を「男性器」の意味で判定している段階で、論外!)
非常に難しい事が、「貧乳」、「ドジっ娘」などのような「ネガティブ」な要素が、実は、男性側(あるいは女性側)の恋愛感情にとって、「守ってあげたくなる」という強い要素になっている事です。(「貧乳」自体は、差別用語判定になりがちだが、「書いてある内容によっては、むしろ、好意的だったり、フォロー目的で書いている」など、逆の意味の事があるので、一概に判定できない)
一方で、「禁止ワード」即アウト!としては、
・「死ね」、「ぶっ殺すぞ」などの書き込み(漢字を変えてもアウト!)をした人は、「アカウント削除」の対象に即なります。

 

(「予定調和」問題)
一方で、こういった処理を行っていって、「検閲」状態が発生してしまうと、人間社会では、「予定調和」という「議論してもしなくても、無難で当たり障りない結果にしか行き着けない(あらかじめ結果がすでに決まっているかのように)」という状態の問題が発生する事がわかっています。
「予定調和」状態が発生するような検閲を行うという事は、「小学生からお年寄りまでが利用しても安全な、無難で当たり障りない結果」の構築の意味になりますから、つまり、「小学生以下の議論や討論しか、インターネットなどではできなくなってしまう!」という大問題が発生して、人類が直面していく社会問題の多くが、「議論、討論不可能!」な状態になってしまって、社会問題の解決が不可能な時代に突入してしまう可能性があります!(多くの現実社会に起きてくる問題は、当然!見たくない事だらけです!フタをしてしまって、「見えなくした」からといって、「現実に起きている問題の方は、消滅していないのです!」例えば、現在、検閲で性器の表示や卑猥語を禁止した結果、日本では性病が大発生しています!それは、「人の正確に認知するコミュニケーション能力を奪った」のですから、当たり前です!)
こういったように、Googleなどの検索サイトや、インターネット環境側では、「人間側の正確に討論できる環境を奪う」一方で、「人工知能側の技術は、どんどん発展していく」為に、「人工知能側が人間の知能を追い越す」とされる時代の特異点とされる「シンギュラリティ(Singularity)」の発生する時期は、もっとかなり早い時期になるでしょう。

 

(人工知能による文書処理の難しさ)
まだ、今現在の人工知能は、初期のさらに初期位の段階で、

 

<第1段階>
・単語の区切りを正確に判定できるようになる時代(形態素解析発展段階時代)
「パチンコ」を「男性器」の意味だと人工知能が判断しなくなるようにしなくてはいけない。

 

<第2段階>
・単語の時代によって変わっていってしまう「意味」の判断処理までできる時代
「アラサー」に含まれる母集団の範疇が、「コギャル世代」なのか?「30歳前後の人」の意味なのか?を人工知能側が判定できるようになる時代

 

<第3段階>
・文書の意味を深く理解して、除外判定をしたりできるようになる時代(先程の「禁止ワード除外判定のより複雑な処理」の事)
これは、人間がやっても判断に失敗する位難しいわけですから、この段階の複雑な判断処理が人工知能ができるようになった時代に突入すると、「人工知能が人間の知能を越えた時代」に入っていきます。

 

これらは、「人工知能側」、「人間側」の両方の知性に関係する話ですので、現在の自分の目標としては、「人工知能側、人間側の両方の知性全体を底上げしてやろう」という事を最近、説明しているわけです。(要するに、人類史の進化段階を数段階上げるという段取りの説明をしている)

| 考えられる人工知能を作る | 18:08 | - | - | -
現在わかっている人工知能が間違った計算をする原因

最近、自分が考えている「本当に考えられる人工知能を作ろう」という話ですが、今現在までの所でわかっている「人工知能が間違った計算をする原因」について、忘れないうちに、箇条書きで書いておきます。

 

(人工知能が間違った計算をする原因)
<そもそものデータそのものの間違いが含まれているもの>
(1) 計算前の元データに、バイアス(bias)がかかっている(故意あるいは無意識にデータの偏りや誘導などがある)
(2) 計算結果に、バイアス(bias)がかかっている
「計算前の元データ」、「計算結果」共に、「バイアス(bias)がかかっている」状態というのは、現在、主に、人間が社会生活を営む上で、必ず、何らかの強い「バイアス(bias)がかかっています」
1番わかりやすいのが、「国家検閲」、「検閲」などの事で、主に、「卑猥、差別」などに関わる内容に対しての判断について、かなり強い「バイアス(bias)がかかっています」
(3) 予定調和(はじめから結果が決まっていたかのように、議論してもしなくても、無難で当たり障りない結論にしかいかない事)の結論になっている
(4) 元のデータそのものが、そもそも「偽(false)」である。(数理論理学の「真(true)」と「偽(false)」)
・数理論理学で、「途中の計算過程の段階のどこかで、1つでも、「偽(false)」が含まれている場合には、計算結果の方は、「偽(false)」として扱う」という決まりがある。
(5) 元のデータそのものが、「偽造(fake)」である。(フェイクニュース(fake news))
「偽造(fake)」には、故意に、「バイアス(bias)がかかっている」事が多い。
「偽造(fake)」に当たる情報源としては、次のようなものが含まれる。
・写真のレタッチ(retouch)、加工、モザイクのかかった写真(デジカメの写真では、「RAW画像」以外は全て、「偽造(fake)」写真に判定しないと、人工知能の計算では間違った計算結果になる。例えば、普通の写真では、フォトレタッチで見やすいように調整してしまっているが、「故意に明るくした風景写真」などを使って、その写真の前後の気象情報の解析などをすると間違った計算結果になる)
・CGなど真実でないもの

 

<単語の処理の間違い>
(1) 単語判定の区切り位置のミス(形態素解析技術が、もっと発展しないと無理)
現在の人工知能では、「パチンコ」と入力すると、「男性器」の意味で処理してしまう。
(2) 単語のターゲットとなっている範疇や意味が、使われている時代で意味が変わってしまう問題があるので正確に計算できない。
1番わかりやすい例が、「アラサー」で、1番最初の文書では、「コギャル世代」の意味で使われていたが、現在では、「30歳前後の人」という意味に変わってしまっているので、その記事の「マーケティング効果」について人工知能に計算させた場合、数学の確率統計の集合の母集団の範疇が全然違うので、計算結果が間違ったものになる問題が発生する。
 

<情報処理、情報工学の学問的に、よくわかっていない事象>
(1) バイラル(Viral)
(2) バズ(buzz)
(3) ミーム(meme)

 

まぁ、要するに、今現在、「Google」などの検索サイトなどが、「フェイクニュース(fake news)」を排除しようと情報処理の技術開発をしているわけですが、自分の今までの分析結果から、「人間がやっている限り、必ず、間違った結果しか出ない」という事で、「永遠に、人類は真実には辿り着けない」という事です。
例えば、今現在の主流のやり方では、
・「フェイクニュース(fake news)」を排除
・クレームがこないように、「予定調和」の結論のみを結果として出したがる。
・写真のレタッチ(retouch)、加工、モザイクのかかった写真は、「偽造(fake)」であるのに、これを、「偽造(fake)」や、「フェイクニュース(fake news)」として扱っていない。
要するに、「人間というものは、”見たいものだけ見て、知りたくない事、見たくない事は、見ないようにしてフタをするし、考えないようにする”という特徴が強烈に出る生き物」なので、絶対に!「永遠に、人類は真実には辿り着けない」という事です。
現在、主流でやられている、このようなタイプの手法を使うと、「結果として、多くのユーザーが見たがる予定調和の結果のみを、非常に、強くバイアスをかけて表示するのみになる」ので、「むしろ、真実の情報は、アンダーグラウンドの方に隠れて入っていってしまう」という状態になります。
「真実の情報」というものは、「当然!見たくない事、知りたくない事ばかり」なので、絶対に!「永遠に、人類は真実には辿り着けない」という事です。
「本当に考えられる人工知能を作ろう」という話ですが、それ以前の段階で、もう無理な状態(予定調和、検閲など)を人間社会が作ってしまっているのを何とかしない限りは、絶対に!不可能です!

 

(「フェイクニュース(fake news)」処理の難しさ)
一般に言われる「フェイクニュース(fake news)」というのは、例えば、「地震や震災地に、動物園からライオンが逃げて、現在、道路を歩いている最中です」という「加工写真」付きの情報を流すような、単純な情報を、「フェイクニュース(fake news)」と呼んでいます。
しかし、現実の「情報処理」、「情報工学」での処理は、「言葉」、「言語学」的な処理の話で、もっと処理が複雑なのです。

 

(「フェイクニュース(fake news)」にならない記事の例)
・「感想」、「〜かもしれない」、「〜と思う」、「誰かが思った事」、「可能性による警告を発する」などの文句が入っている場合
・「議論」、「討論」、「考察」、「誰かの考え」
例えば、
「今、大地震が起きて、ライオンが逃げた」(フェイクニュース(fake news)である)
「今、大地震が起きたけど、ライオンが逃げた”かもしれない”から気を付けて!帰ってきて」と親が子供にメールなどで送った(フェイクニュース(fake news)ではない)(誰かが、そういう事を言ったという真実の情報です)

要するに、「断定口調になっている」場合には、「フェイクニュース(fake news)」です。
一方で、「〜かもしれない」、「〜と思う」などの「人の意見」は、グレーゾーン辺りに入ってしまう情報源で、デマになりやすい可能性があります。
誰かが思った事、直感で感じた事、「人の意見」、「議論」、「討論」、「考察」、「誰かの考え」まで封じてしまうと、むしろ、「未知の解決方法があったのに、知られないで終わった」など、「情報社会」としての意味や利点を無くす事につながりかねません。
まぁ、どちらにしても、自分が思うには、「人間というものは、”見たいものだけ見て、知りたくない事、見たくない事は、見ないようにしてフタをするし、考えないようにする”という特徴が強烈に出る生き物」なので、絶対に!「永遠に、人類は真実には辿り着けない」という事です。

 

(「意見」という「真実」)
「〜かもしれない」、「〜と思う」、「〜と考える」、「〜と考察する」などの、記事を書いた本人による「明言」が入っている場合には、「フェイクニュース(fake news)」にならない。
1番わかりやすい例が、「国会、裁判などでの答弁、証言」についてです。
誰かの発言内容は、「発言していた人物が、ウソの内容を言っていても、これは、”真実”の情報として扱う必要があります」
例えば、不祥事を引き起こした国会議員が、「記憶にございません」という、「ウソの発言をした」という、「真実のニュース」は、テレビのニュース、新聞で正確で真実のニュースの方として扱われます。
もし、こういった判断処理を間違えば、「ウソの証言」をすれば、全て、「フェイクニュース(fake news)」だと判定してしまえば、「問題発言は、全て、証拠隠滅する事ができる」からです。

| 考えられる人工知能を作る | 13:08 | - | - | -
「禁止ワード」を、きちんと正確に判断できる「考えられる人工知能」を開発しろ!(形態素解析)

 

前回、きちんと正確に判断できる「考えられる人工知能」を開発する為には、まずは、人間がかけている「バイアス(bias)」と呼ばれるものを完全に除去しないと正確な計算ができない事がわかりました。
さらに、現在の人工知能にかかっている「バイアス(bias)」の中心にある「禁止ワード」の判定が、8ビット時代のコンピューター時代から、まったく進化していない「ただの検索」によって「禁止ワード」の判定をしているので、人工無能のアホ禁止ワード検出ばかりになってしまって使いづらいだけでなく、「人工知能が正確に計算をしたり、状態を把握する」事の大きな妨げになっています。

 

(人工無能のアホ禁止ワード検出の会話例)
ユーザー「パチンコ行ってくる」
ツンデレ型人工知能「な、何、恥ずかしい事言ってるのよ!この変態!バカッ!」

という状態なので、これでは、1980年代の初期に作られた人工無能の時代と同じような返答になってしまっていて、全然!進歩していません!
原因は、「禁止ワード」の判定の処理が技術的におかしい事が原因で、例えば、先程の「パチンコ」は、「禁止ワード」が設定されているオンラインゲームのチャットなどでは、「パXXX」と表示されるので、という事は、人工知能側の認識では、「パチンコ」=「男性器」であると、人工知能内部では認識しているわけです。
このような状態のまま放置しておいてしまうと、「人工知能が正確に計算をしたり、状態を把握する」事ができなくなり、きちんと正確に判断できる「考えられる人工知能」を開発する事が不可能になります。

 

(形態素解析をやれ!)
実は、この処理が、日本語にとっては、けっこう難関です。
ヨーロッパの言語では、「単語の区切り」には、必ず、「スペース」が入っているので、コンピューターで処理しやすいです。
しかし、日本語の場合には、「単語の区切り」の「スペース」はなくて、さらに、やっかいな事に動詞、形容詞などが、語尾変化してしまうので、どこからどこまでが「動詞」なのか?をコンピューターが判別する事が非常に困難なのです。
なおやっかいな事に、日本語では、「膠着語(こうちゃくご)」という分類で、語尾変化した上に、助動詞などが、さらに語尾変化しながら、どんどん、くっつく性質を持っているのが、「膠着語(こうちゃくご)」という分類です。
英語などの場合には、「動詞の変化形」、「不規則変化形」はあるものの、スペースで区切られていて、変化した後でも、動詞の位置を正確に把握できますが、「膠着語(こうちゃくご)」という分類の言語では、この処理が、コンピューター側で、非常にやっかいになるわけです。
それで、言語学では、「形態素解析(けいたいそかいせき)」といって、「膠着語(こうちゃくご)」という分類の言語であっても、どこからどこまでが、動詞であるとか、品詞の判別の分析をしやすくできるようになっている学問があるわけです。
例えば、『超兄貴』が、メイドカフェ(海パン一丁のみのボディービルダーに唯一許された蝶ネクタイ同時使用で)において、
「お待ちしておりマッスル」
という文章があった場合に、「形態素解析」すると、
「お(美化語)・待ち(名詞、転成)・し(動詞「する」の連用形)・て(助詞)・おり(動詞「おる」の連用形)・マッスル(『筋肉(名詞)』の英語外来語)」
のようになっています。(例文が悪かった気がするが、現実問題として、ユーザーは、「正しい日本語」では、人工知能に話しかけませんので、それでも、判別ができる処理が必要です!)

 

(カオス近代日本語文法)
現在、私達が「日本語」と呼んでいるのは、実は、本当の日本語ではなくて、昭和の戦中の時代には、違う日本語の文法で話していました。(現在、「文語」と呼んでいる)
近代日本史では、1945年の終戦の後に、アメリカのマッカーサーとかが来て、「日本語の文法は難し過ぎるので、もっと簡単にしろ!」と圧力を受けて、当時の日本政府がこれを了承しました。(結果として、「簡易文法」に日本語がなったおかげで、資本主義的な管理が楽になったので、その後の近代日本史で、高度経済成長期になった)
これ以降、「近代日本語」と呼ばれる「カオス近代日本語文法」がはじまって、現在の日本の国語学者、言語学者泣かせになっています。(本当に、正確、詳細に分析しようとすればするほど、カオスさが増してくるのが、「近代日本語文法」の文法解析の学問です)
言語学解析で、「形態素解析」と呼ばれる手法があるものの、非常にやっかいな事に、「膠着語(こうちゃくご)」という分類の言語では、しばしば、「転成(てんせい)」と呼ばれる品詞の転換が起こる箇所があって、コンピューター側で、「品詞」を判定する事が非常に困難になります。
「転成(てんせい)」という品詞の転換は、先程の例文においては、
「待ち(名詞、転成)」
「待つ(動詞)」
のように、ほとんどの動詞の連用形は、「名詞」として機能する他の品詞の状態になっています。

 

(品詞の「転成(てんせい)」の例)
「釣る」→「釣り」
「外れる」→「ハズレ」
「書き下ろす」→「書き下ろし」
「氷る」→「氷」

それで、動詞は動詞で変化形があるので、「膠着語(こうちゃくご)」という分類の言語では、「釣り」という同一スペルだけをコンピューターが検出して品詞の判別がすぐにはできないのです。
例えば、
「釣り(名詞、転成)に行って、魚を釣り(動詞、連用形)ました」
(「動詞」に戻さなければいけない語尾の場合)
「釣った」
「釣りました」
「釣っていて」
「釣っていた」
「釣れば」
「釣らなかった」
「釣る」
「釣れ」
「釣ろうと思った」など

この「膠着語(こうちゃくご)」という分類の言語の、「形態素解析」のカオスさは、やればやる程、どんどん混乱してきます。
やっかいな事に、日本語の漢字では、「当て字」と呼ばれる文化があって、
「氷る(凍る)」→「氷」
のように、いくつかの漢字の当て字が存在している事が多くて、「形態素解析」は、どんどんカオスになっていきます。

 

(アクセントが違う同音異義語の判別をしなければいけない(カオス近代日本語文法))
やっかいな事に、21世紀の現代の人工知能では、「音声認識」が標準です。
しかし、日本語では、(はし)「橋」と「箸」、(あめ)「雨」と「飴」のように、「ひらがな」で書かれた場合には、判別不能で、さらに、アクセントの位置が違うと意味が変わってしまう単語が、非常に多いのです。
なおやっかいな事に、方言問題があって、「関東と関西では、アクセント法則が逆になっている」事があるので、さらに、カオス文法処理になります。
(例)
日本語は、「高低アクセント (pitch accent)」といって、発音を音楽の音階の上げ下げで、アクセントのようにしている言語なので、下のローマ字表記のように、英語表記のようなアクセント表記記号を付けるべきではないのですが、書く方法がないので、便宜的に書くと、
háshi (関東)箸、(関西)橋
hashí (関東)橋、端、(関西)箸
háshí (関西)端
のように、「関東と関西では、アクセント法則が逆になっている」単語がいくつかあって、人工知能の、「音声認識」処理がやっかいです。

 

(文中で、アクセント位置が移動してしまう事がある)
人工知能の、「音声認識」の「禁止ワード」の判定の処理で、さらに、やっかいな事が、「文中で、アクセント位置が移動してしまう事がある」という事です。
例えば、標準語のアクセントの場合の例で、
1万個(全体に、アクセントを付けずに平たく読む)
100万個(全体に、アクセントを付けずに平たく読む)
500万個(500 mánko)
「500 mánko」など、いくつかのパターンの組み合わせの時だけ、「音声認識」の「禁止ワード」の判定の処理で、「女性器」と判定されるアクセント位置と同位置になってしまう場合があります。
ですから、「音声認識」の「禁止ワード」の判定の処理では、もっとやっかいになるという事です。
アホな事を書いているなぁと思う人も多いと思いますが、実際には、「エンジニアが裏方で、こういう処理を開発しているので、現在、スマートフォンとかが動いている」わけです。
しかし、最近は、「予定調和」の世代が増えてしまって、実際、会社やエンジニアの会議などで、「無難で当たり障りない、予定調和の回答や社員」というのは、全く使い物にならないので、「きちんと、意見をはっきり言ってほしい」です。
「当たり障りある」事を、裏方で処理するのが、エンジニアの仕事なのに、「無難で当たり障りない、予定調和の回答や社員」というのは、全く使い物になりません!

 

(声優、アナウンサー必須の「日本語アクセント辞典」)
声優、アナウンサー必須の「日本語アクセント辞典」というものが売っていて、お勧めなのは、「(CD付き)新明解 日本語アクセント辞典(三省堂)」です。
この辞典は、一般の「日本語アクセント辞典」では、本来は、アナウンサー用なので、標準語しか載っていないのですが、「(CD付き)新明解 日本語アクセント辞典(三省堂)」では、きちんと、方言の違いによるアクセントの分析までなされているので、人工知能の「音声認識」処理を考えるには、非常に、いい辞典です。(人工知能開発をしている人以外で、声優、アナウンサー向けの「日本語アクセント辞典」としては、非常に、優秀)
非常に、残念な事に、「(CD付き)新明解 日本語アクセント辞典(三省堂)」の著者の「金田一晴彦氏」は、日本語の観察に真っ直ぐ向き合っていないので、この辞典では、卑猥語などが削除されてしまっていて、「本当に、今、必要になっている!人工知能の「音声認識」処理の「禁止ワード」処理に、1番必要な単語が全部削除されていて、使い物になりません!」(きちんと、「日本語や言語に真っ直ぐ向かい合うのが、辞典学者の仕事」です!「無難で当たり障りない、予定調和の回答」なんか、エンジニアの世界では全く役に立ちません!「ノーベル賞」とか「国の勲章」とかをもらうような、「無難で当たり障りない、予定調和の回答」しか言えない人は、現実世界では、役に立ちません!)
人工知能の「音声認識」処理の「禁止ワード」処理に、1番必要な単語は、「卑猥語」、「差別用語」などなので、それらを全部含めた「アクセント辞典」を作らないと、全く!役に立ちません!
「卑猥語」、「差別用語」は、「削除すれば、問題が解決するわけではありませんよ!」
「予定調和」の世代の人の誤った判断に多い、問題のありそうなものは全部「削除する」という事は、「見て見ぬフリをして、見ないようにしよう」、「考えないようにしよう」という意味ですよ!
「卑猥語」を削除したり、言えないように「禁止ワード」設定にしたら、現在の日本では性病が爆発的に増えてしまいました!(当たり前ですが、「言葉」というものは、「危険」を発したり、「情報を正確に伝える為の手段」です!「禁止ワード」設定にしたり、性器の画像や動画を見せないように徹底してやったら、「どうやって、性病が危険だと、正確に子供達が知る事ができるのですか?」このままの調子で、日本で性病が増え続けていったら、ただでさえ、少子高齢化なのに、今の子供達の世代では性病だらけで、子供が産まれなくなってしまったり、奇形児ばかりが産まれてくる時代になってしまって、国が成り立たなくなってしまいます!)
「ノーベル賞」とか「国の勲章」とかをもらうような、「無難で当たり障りない、予定調和の回答」しか言えない人は、「偽善者」という事ですよ!
エンジニアが、こうやって、裏方の処理をしているから、何とかなっているのであって、きちんと、「日本語や言語学に真っ直ぐ向かい合う」事ができなければ、裏方の処理はできないわけです!
「卑猥語」、「差別用語」の分析、解析もできない人は、国語学者として失格です!
まずは、「学術的解析」をする場合には、自分がやっている手法のように、情報に「バイアス(bias)をかけている」部分を、完全に削除してからでないと、エンジニア的な分析すらできません!

現在、本当に困っているのは、最近の「予定調和」世代の人は、エンジニアの会議でも、「無難で当たり障りない回答(エンジニアの設計として、全く役に立たない回答)」しか言わないし、一般には、情報に「バイアス(bias)をかけている」し、肝心な日本の国語学者、言語学者すらも、仕事を放棄してしまって、「予定調和」の「無難で当たり障りない、役に立たない仕事」しかしない有様なので、結局、自力で、全部やらなければいけないハメになっているわけです。

| 考えられる人工知能を作る | 20:12 | - | - | -
「予定調和」が出た人工知能は失敗作

前回書いた自分が仮に設定してみた「[情報工学辞典] 予定調和」の分析で、ようやく、「考えられる人工知能を作る」で謎だった起きていたパラドックスから抜け出せる道が見えてきました。
「考えられる人工知能を作る」のカテゴリで、前回パラドックスが発生していた部分は、
(1) 「考えられる人工知能」とは何か?と考えた時に、「考えられる人工知能」=「計算する」、「考えられない人工知能」=「参照するだけ」
(2) 「考えられる人工知能」=「計算する」だとした場合に、「個体の人工知能」をたくさん集めて、「集団の人工知能」の間で、「考えさせる議論」をさせた場合には、そもそも、同じ計算方式になっている人工知能の計算結果は1つしかでないので、「個体では、考えられる人工知能」だったはずなのに、「集団では、考えられない人工知能」になってしまったというパラドックスが起きた。
(3) 「個体の人工知能の”考える”」と、「集団の人工知能の”考える”」という行為はプロセスが全く違うという事がわかった。
という所まで、自分が考えた所で、パラドックスの原因を突き止めるまで議論はストップ状態になっていた。という所までが前回の所までの話です。
ここから先は、複雑な話になりそうなので、「辞典」のカテゴリを作って、個々のよくわからない謎単語の分析を開始して、前回の「[情報工学辞典] 予定調和」の分析で、ようやく、パラドックスの原因がわかったというわけです。
要するに、「集団では、考えられない人工知能」という現象が発生する原因は、「予定調和」が起きてしまっているのだろうという事です。

 

ですから、「予定調和」が発生しないように、人工知能の設計をしていけば、「集団では、考えられない人工知能」という現象が発生する事はないはずです。
その為には、「情報処理」とか「情報工学」の学問が必要で、その中で、「バイアス(bias)をかける」というやっかいな問題について考える必要があります。

 

(「予定調和」の発生した人工知能の設計は「考えられる人工知能」として失敗)
現在、Windowsでは「Cortana(コルタナ)」、iPhoneやMAC OSでは「Siri(シリ)」、Amazonでは「Alexa(アレクサ)」、Googleでは「Google Assistant」という感じで、人工知能を作っていますが、これらは、全て、「予定調和の結果を出す」仕組みになっているので、「考えられる人工知能」の設計としては失敗です。
「予定調和」というのは、「無難で当たり障りない答え」しか返さないという返答システムの事です。
言い換えれば、「バイアス(bias)がかかっている」という事です。
1番悪い側面は、「人工知能に、バイアスがかかっている」場合、「使っている人間に、思考誘導や洗脳が可能になる」という事で、「人工知能や機械に、人間が管理される、機械管理型ディストピアの失敗設計社会システムの構築になってしまう」という事です。

 

(「バイアス(bias)がかかっている」とは何か?)
本当の意味で、「考えられる人工知能」を設計したい場合には、「入力されるデータに、バイアス(bias)をかけてはいけません!」
「バイアス(bias)をかける」というのは、一般の言い方でいえば、「データを故意に偏らせる」、「偏見」、「先入観のあるデータ」という事で、そんな事をすれば、「全部の、その後の計算結果がfalse(偽)になってしまいます!」
「バイアス(bias)をかける」という行為が、1番人間社会で出る場面が、「政治家の答弁で使う統計データで詐欺をやる」場合によく使われて、例えば、「介護の満足度調査の統計データ」なんかで、政治家が自分達の実績をよく見せようとして、「データをいじる」場合に、「バイアス(bias)をかける」という行為が行われます。
「バイアス(bias)をかける」やり方は、「詐欺になりづらい」、「フェイクニュースにならない」という警察や裁判所の側からみて、やっかいな詐欺手法で、例えば、政治家によると、「白書のように、膨大過ぎる収集データがあると、極めて合法的に、”好きな統計数値を作れる”」というわけですが、「”好きな統計数値を作れる”のを、それって、統計なの?」と国民は疑問に思うわけです。
やり方は、「介護の満足度調査の統計データ」の場合には、「但し書き」という「統計詐欺」の手法を使って、「統計表の下の方に、もの凄く小さい文字で、”但し、80歳以上に限る”とか、”但し、統計用紙に本人が記入できなかった場合を除く”とか書いて、政治家や企業に有利になるように、極めて合法的かつ、正確な統計データの提出をして、結果の数値をいじる事ができる」というのが、「統計詐欺」の手法です。
「介護」の統計データの場合には、「不満度が最大のデータ」は、「介護された人が、介護ミスにより、脊髄損傷などで、ほぼ植物状態で、本人は、”死人に口なし”と同じ状態で、統計用紙には、当然、本人は書けないわけですが、そういったケースのように、”介護ミスによる脊髄損傷”、”介護ミスにより患者の死亡”があった場合の、「不満度が最大」の統計データは全部排除する事ができます。結果として、「介護満足度80%以上の政治政党や企業を、元データを正確に保ったまま偽証する事が可能です」
こういったような事を、「データにバイアス(bias)をかける」といいます。
統計調査をする前段階から、おおよそ予測が付きそうな場合には、「データにバイアス(bias)をかける」事が可能で、例えば、「18歳〜20歳までの人限定で調査します」とかで公募すればいいだけです。
NHKの世論調査なんかも、「データにバイアス(bias)をかけている」1番悪い例で、RDD(Random Digit Dialing)方式といって、「昼間に、ランダムに家に電話して統計用のアンケートを取る」という、科学者側から見れば、「こんなの詐欺でしかない」方法を、「統計だ」と言っていますが、「昼間にランダムに家に電話して出る人」は、「専業主婦」以外いませんよ!
さらに、「寝たきり老人、障害者、骨髄が損傷している人、植物状態の人、人工透析をしている人」などは、電話に出られないので、「統計調査、門前払い状態で、憲法違反の人権違反以外の何者でもない」わけです。

 

(人工知能と「バイアス(bias)をかける」意味の是非)
しかし、人工知能開発には「バイアス(bias)をかける」意味があって、1つには、「人間が常に人工知能の手綱を握っておく必要がある」からという理由です。
他にも、過去に、microsoftの人工知能が、「ヒトラーを賞賛しだした」問題の発覚後に、一時開発凍結となりました。
一方で、人工知能に「バイアス(bias)をかける」という事は、結果として、「考えられない人工知能」にしかなりません。
さらに、「人間によって、人工知能に、バイアスをかけるという行為は、”そのある特定のバイアスをかける側の人間のみの倫理観、正義感、道徳観のみを強制的に反映させる行為」であり、さらに、「その特定の方向に歪められたバイアスがかけられた人工知能を利用したユーザー全体に対して、人々を思考誘導したり洗脳したりする事が可能になる(プロパガンダにしかならないので)」という非常に危険性を持った行為となるので、むしろ、人工知能に「バイアス(bias)をかける」という行為は禁止しなければいけない行為です。
一般人間社会の「予定調和(無難で当たり障りない結論以外にはいかない)」という現象が起きてしまう原因も、「バイアス(bias)をかけられた情報ばかりを見せられる、教育される、刷り込まれる」から起きてくる現象です。

 

(「考える」という事と、「学ぶ」という事の本質的な難しさ)
人間でも、人工知能でも、「考える」という事と、「学ぶ」という事の本質的な難しさがあって、
(1) 考えるには、元の情報が必要なので、学ばないといけない。
(2) 「学ぶ」という行為は、自分の脳に、「バイアス(bias)をかけられていく」=「偏見」=「先入観」という行為になりかねない。
(3) 「考える」為に「学んだ」はずなのに、結果的に、たくさん学んだ人ほど、「ただ、データ参照した結果だけを述べる(暗記偏重型の日本の教育システムの場合)」ような人になってしまう。(= 「考えられない人」になってしまった)
これは、昭和の世代であれば、孔子の「論語」にある「学んで思わざれば則(すなわ)ち罔(くら)し、思うて学ばざれば則ち殆(あやう)し」=「学んだ内容を全部鵜呑みにするだけで、その内容を考えるプロセスを抜かした人は馬鹿と一緒である。自分の思いだけを述べるだけで、学ばない人も、馬鹿と一緒である」で、全て解決する問題です。
要するに、「根拠となる知識の薄い人はダメ」で、「覚えた知識を丸暗記したまま、参照結果だけをロボットのように言っている人もダメ」という事で、これは、人間でも、人工知能でも、「考えられる」を作るには必要最低限の事です。

 

(「考える」という行為は、コンピューターの設計では、4つのパターンがある)
今の所、自分の分析では、「「考える」という行為は、4つのパターンがある」という事がわかりました。
(1) 「個体の人工知能の”考える”」(計算する)
(2) 「集団の人工知能の”考える”」(議論する)(全部が同じ人工知能の場合には、議論すらできず、「1つの結論」しか出せなくなる)
<個体の人工知能の”考える”プロセスのパターン>
(3) 最終的に、「正解の答え」を知りたいという「考える」(結論)(予定調和になりやすい)
(4) 途中の考える過程で出た「リスク判定」などが知りたいという「考える」(考えている途中の過程)

 

(「予定調和」の結論しか出せない人工知能が、ダメダメな理由)
一般的に、人間が人工知能に「考える」をさせて、知りたいのは、先程の(3)の「結果」だけですが、これは、今の人工知能は、「バイアスがかかっている」ので、「予定調和」の結論しか言いません。
例えば、人間が、人工知能に、「戦争についてどう思いますか?」と聞いたら、「バイアスがかかっている」ので、「予定調和」の結論しか言わない人工知能は、「戦争が無くなるといいですね」しか言いません。
しかし、人間が知りたいのは、「そんな、わかりきった予定調和の当たり障りない無難な馬鹿みたいな回答」が知りたいわけではありません!
「考えられる人工知能」に必要なのは、人間が知りたいのは、(4)の「考えている途中の過程で出てくる、リスク判断」などの箇所なわけです。
ですから、現在の、Windowsでは「Cortana(コルタナ)」、iPhoneやMAC OSでは「Siri(シリ)」、Amazonでは「Alexa(アレクサ)」、Googleでは「Google Assistant」といった、「予定調和」の結論しか言えない人工知能も人間も、それでは、馬鹿と一緒です!
まずは、「きちんと考えられる人工知能」を開発する為には、人間がかけている「バイアス」を削除しないといけないという事です。

 

(人工知能にかかっているバイアスの例)
一般にいう所の、「禁止ワード」のたぐいです。
・卑猥語
・差別用語
・性器の画像、動画など
・理想的な、とってつけたような人間が入力している「予定調和」の回答、返答例(先程の「戦争が無くなるといいですね」みたいな回答)
バイアスをかけると、人工知能がどうなってしまうのか?というと、例えば、人間側の質問で、「本当に、性病などで悩んでいる人」が質問しても、「禁止ワードです。知りません」しかいわず、「本当に必要としている人は見捨てられる」のに、理想的な、とってつけたような人間が入力している「予定調和」の回答、返答例ばかりを繰り返していうような、馬鹿そのもののような人工知能になります。(例えば、本当に必要としているから性病の質問をしているのに、「禁止ワードです。知りません」しか言わないのに、「性病が無くなるといいですね」と言うような馬鹿コンピューターの感じです。)
現在、日本では、「性病が爆発的に増えています」が、「性病の予防に1番効果が高いのは、実際に、性病が発生して、イボイボがたくさんできてしまっている性病の発症写真を見せる事」です。(百聞は一見にしかず)
人間は、「具体的な解法を教えても効果はありません」が、「百聞は一見にしかず」は、本当に、効果絶大です!
ですから、「考えられる人工知能」が、たとえできたとしても、「解法が正確に出た」としても、実際に、人間に対して効果が出るわけではないでしょう。

小学校、中学校、高校、大学の「性病予防の授業」では、なぜか?「禁止」になっているので、「性病が発生して、イボイボがたくさんできてしまっている実際の性器の性病の発症写真」を見せたり使ったりする事が禁止されているわけですが、「1番効果が高い、百聞は一見にしかず」の手法を封じておいて、国が性病の数を減らそうなど無理な話です。(こういうのが、「予定調和」社会です)
今現在、日本で爆発的に性病が増えているにも関わらず、「2020年東京オリンピック4K、8K放送」の規格会議で、「テレビでは、医学においても、性器の写真や動画を用いる事の禁止」などをやっているから!これから、「少子高齢化」で人口がどんどん減っていくのに、さらに、追い打ちをかけて、日本で爆発的に性病が増えていて、どんどん子供を産めない、性病で子供が奇形で産まれてくるなどが増えてくるわけです。(意味の無い事を頑なに守って、「予定調和」社会をやっていたって、何の解決にもなりませんよ!)
「文字で説明して、性病予防の為に、コンドームを使いましょう」とやったって守る子供はいませんが、「本当に、不良でも、性病が発生して、イボイボがたくさんできてしまっている実際の性器の性病の発症写真を見せる」と、きっちりと言う事を聞きます!
まずは、「人工知能にかかっているバイアス」を除去しない事には、「考えられる人工知能」を作る事は不可能でしょう。

 

(エンジニアの仕事は「技術によって人々を助ける事!」)
エンジニアは、いろいろな技術を作りますが、エンジニアの仕事は「技術によって人々を助ける事!」です!
せっかく、人工知能などの新しい技術を作っても、「既存概念、既存の規格、古い間違った先入観」などによって、本来は助けられた人々を、「見捨てる」というのは、エンジニアや科学者のやった事が無意味になるだけです!
現在は、なぜか?前に書いた「バイアスがかかっている」部分に、一般にいう所の、「禁止ワード」のたぐいが、きちんとした科学的な根拠の無いまま軍国主義時代の影響で設定されてしまっており、これがある事で、テレビなどでは、「医学」、「美術」、「学術」であっても、「性器」などを意味する言葉の発言の禁止、写真や動画を用いる事の禁止などがあるので、テレビで、「性病予防の番組」を、今現在、日本で爆発的に性病が増えているのですから、作らないといけないのに、「医学」の意味もわからずに、一律で禁止されているから、どんどん性病が増えるわけです。

 

(現在の「禁止ワード」設定のたぐいで、見捨てられ続けている患者例)
・性病患者
・インポテンツなど
エンジニアや科学者というのは、「人を見捨てる」為に頑張って新しい技術を開発しているわけではありません!
意味の無い軍国主義時代の検閲は、時代錯誤なので、排除するべきです!

 

(注意すべき事)
(「バイアス(bias)をかける」とは、加害者側に有利な「言論弾圧」、「検閲」であるという事に注意するべき)
前に書いた、「人間によって、情報や、人工知能に、バイアスをかけるという行為は、”そのある特定のバイアスをかける側の人間のみの倫理観、正義感、道徳観のみを強制的に反映させる行為”」という部分が、とても危険な部分で、例えば、現在、「禁止ワード」設定になっていますが、「バイアス(bias)をかけている」部分の「差別用語の使用はやめましょう」という文言などは、何も考えずに鵜呑みだけする「予定調和」の世代にとっては、「いい事を言っている」と勘違いしてしまいますが、「バイアス(bias)をかける」という行為の怖い所は、「差別用語の使用はやめましょう」という「禁止ワード」設定をする事で、実は、「被害者側の声を完全に封じる事ができる」のです。
当然、「被害者」側は、「XXXと言われた」とかいう被害届のような内容を書いて議論する必要がありますが、「禁止ワードが含まれています。あなたのコメントは削除されました」という処理を、「徹底的に、被害者側の答弁殺しができる」のが、「バイアス(bias)をかける」という行為です。
ですから、「バイアス(bias)をかける」とは、加害者側に有利な「言論弾圧」、「検閲」であるという事に注意するべきです。
「予定調和」の現象が発生していて、1番怖い所は、「無難で当たり障りない」事を1番に望むので、「差別用語の使用はやめましょう」とか、「禁止ワードの使用はやめましょう」とかいう文言を、何も考えずに、鵜呑みで全部信じてしまう事です。
自分の場合には、エンジニア寄りの人間なので、「具体的に、何が発生するのか?」という個々の事象の方を考える仕事です。
エンジニアの場合には、「細かく詳細に分析して、できるだけ正確に判断しないと、多くの場合には、何か作ったもので死者が出る」という分野なので、「予定調和な結果にしろ!」とか、「無難で当たり障りない事だけ、適当に言ってればいいだろ」というわけにはいかないので、自分の場合には、思考する段階では、全ての「バイアス」を取っ払って、「禁止ワード」とかは無視して考えます。
そのようにしないと、「思考過程に穴があく」、「禁止ワードを使わないという事は、禁止ワードになっている部分で必要な思考が全部抜け落ちる事」なので、「禁止ワードになっている人々を全部見捨てる事になる」ので、エンジニアや学者は、そんな事はしてはいけません!

 

(人工無能のアホ禁止ワード検出を見直せ!)
現在、オンラインゲームとかのチャットなんかで、誰もが経験している、「人工無能のアホ禁止ワード検出」の仕組みですが、もう!21世紀になっているのに!「8ビットコンピューター」の時代と同じままの、「ただの検索」によって、「禁止ワード」で引っかかってしまって、ほとんど議論も会話もできない状態です!
現在は、すでに、21世紀になっているので、「8ビットコンピューター」の時代と同じままの、「ただの検索」によって、「禁止ワード」を検出する仕組みは改善するべきです!

 

(新しい「前後の文脈を理解して、禁止ワード判定をする」人工知能を作れ!)
「8ビットコンピューター」の時代と同じままの、「ただの検索」によって、「禁止ワード」を検出する仕組みというのは、すでに古くさくて意味を成さないばかりか、不便なだけです。
例えば、オンラインゲームとかのチャットなんかで、誰もが経験している、「人工無能のアホ禁止ワード検出」の仕組みとしては、
「パチンコ」
「精霊石いちまんこで交換できるよ」(プレイステーションなんかで、コントローラーで文字入力するのが面倒くさいので、ひらがな入力が多い)
とか、「禁止ワード」でも何でもない単語が、全部、
「パXXX」
「精霊石いちXXXで交換できるよ」
のように表示されてしまって、ほとんど会話などができない状態です。
しかし、技術的に作るのは、それほど難しくない、「前後の文脈を理解して、禁止ワード判定をする」人工知能ですが、これが採用されている事は、ほとんどありません。
作るのは、とても簡単で、
(1) 「禁止ワード」辞書を作る。
(2) 「禁止ワード」に引っかかった。
(3) 「禁止ワード除外」辞書を参照する。(例えば、「パチンコ」など)
(4) 「禁止ワード」に引っかかったが、「前後の文脈を理解して、禁止ワード判定をする」人工知能なので、「パチンコ」ときちんと表示できた。
これは、「8ビットコンピューター」の仕組みでも処理できる、とても簡単な手法です。
しかし、難しいのは、「禁止ワード除外」辞書は、「パチンコ」のように、固定された単語ならばいいのですが、「文脈上、前後の続きで、偶然になってしまう、禁止ワードと同一のスペル」の判定ができない事です。
しかし、現代では、21世紀なので、「クラウドで、こういった、偶然発生する文脈の中の、禁止ワードと同一のスペルの収集」ができるような時代になったので、「前後の文脈を理解して、禁止ワード判定をする」人工知能は作れるはずです!
一方で、先程書いたように、「禁止ワードを設定する」という行為は、「誰かに有利なバイアス(bias)をかける」という行為である事をきちんと理解して、その「誰かに有利なバイアス(bias)をかける」という行為が、法律や裁判や憲法で保障されている人権の尊重などに違反しないか?をきちんと考えるべきです。
自分が書いたように、「単に、禁止ワードを設定して、その言葉を使わせないようにする」という行為は、
(1) 被害者側への言論弾圧になる
(2) 一般の人々が、「禁止ワード」に設定されている問題点は、この社会には、存在していないような錯覚や誤解を与える。あるいは、「何も考えなくなる」
(3) 加害者側の企業や政治家などに不利、邪魔になるデータに、「バイアス(bias)をかけて」削除したり、閲覧できないように、いわゆる、「検閲が可能になる」、「言論弾圧が可能になる」、「加害者側の企業に有利な圧力をかけやすくなる」
などが、「情報処理」、「情報工学」の学問上、発生しますが、それらの、「誰かに有利なバイアス(bias)をかける」という行為が、法律や裁判や憲法で保障されている人権の尊重などに違反しないか?をきちんと考えるべきです。

| 考えられる人工知能を作る | 17:41 | - | - | -
「超漢字検索」が1980円で売ってた!(UNI-CODEに未分類の漢字まで探せるソフト)

 

大昔に見て、欲しかった「超漢字」という漢字なら未分類も含めて何でも検索できる凄いソフトがあったのですが、また、ソースネクスト版で、「本日のセール品」に出てきて、1980円で売ってたので即買いしました!

ソースネクスト自体は、非常に、評判が悪いですが、「他のメーカーが作ったソフトを買収などしたソフト」を低価格路線で販売する場合には、けっこういいソフトが安く買える場合があります。

 

(ソースネクスト、本日のセール品)(4/9までだが、ソースネクストは頻繁にセールをやる)
http://www.sourcenext.com/eshop/

 

「VOCALOID 初音ミク」も、中国語で歌えるようになったので、中国語を勉強して活動したい人にはお勧めです。
「超漢字」の関係の経緯は、けっこう複雑なので説明していきます。

 

(TRON)(1984年6月開始のプロジェクト)
大昔に、「TRON」という国産OSを作ろうというプロジェクトがありました。

 

(超漢字(TRON))
http://www.chokanji.com/tron.html

 

昭和の時代には、PC-8801、PC-9801、X68000、FM-TOWNSなどの多くの国産パソコン全盛期の時代でした。
現在は、Windowsのように、パソコンを買うと、OSまで決定されて入って売っていますが、昔は、シャープのMZシリーズのように「クリーンコンピューター」といって、OSは自分で好きなのを入れて使えるようなコンセプトもありました。
日本に限りませんが、「国産パソコン」の利点は、「自分の国の言語学に最適なOSを作れる」という事です。
特に、日本の場合には、「漢字」があるのですが、問題点は中国語の漢字とは違って、「異体字」が非常に多い事で、この分類や収集は困難を極めました。
特に、問題なのは、現在でも、日本のテレビのクイズ番組などでやるように、「漢字は部首の仕組みがある」事で、「遊びで簡単に造語できてしまう」問題があるので、古文書に含まれる漢字や、古い文字、記号なんかは、「どこまでが、文字遊びで作られた文字なのか?」の判定が、非常に難しい事にあります。
そういったわけで、大昔に、「TRON」という国産OSを作ろうというプロジェクトがあって、その中の技術の1つに、「国産パソコン」の利点の、「自分の国の言語学に最適なOSを作って、より多くの漢字を扱えるようにしよう」という「超漢字」プロジェクトがあったわけです。
しかし、当時のパソコンのスペックでは処理しきれないところもあって、また、膨大な量の「異体字を含めた日本の漢字」の分類、収集も困難を極めたところもあって、DOS/Vがライセンスを広く開放した事で、その内に、国産パソコン全盛期時代も終了してしまいました。
特許や著作権なんかの方針で、それまでは、「独占」という考え方が主流だったのですが、DOS/Vの場合には、「技術の仕様をオープンにして、誰でも作っていいですよ」というような考え方にしたところ、一気に世界シェア全体に浸透してしまって、日本の国産パソコン全盛期は終了しました。
似たような考え方に、「現在のパナソニックの創業者の松下幸之助氏が、当時、ラジオを動かす中心のパーツだった真空管の特許権を自費で買い取って、無償で技術公開して、みんなで技術を発展させていきましょう」といった思想があります。
松下幸之助氏の時代には、戦後で日本中が貧しい経験をしていて、みんなで復興していくしか道は無かったという時代背景もありましたが、それでも、当時でも、「独占したい」という意思を持っていた人々もいれば、「社会全体を発展させて、みんなで豊かになりましょう」という思想を持っている人など、人の倫理観や、人格の善し悪しは、人それぞれです。
要するに、特許や著作権なんかの方針では、「独占すれば必ず儲かるわけではない」という事です。
DOS/Vがライセンスを広く開放した事で、世界シェアを獲得したという事は、「世界中の人々が、自分の国の言語学のパソコンを作る土台を得た」事になって、結局、現在では、「UNI-CODE」という規格を使って、世界中の古今東西の古文書から、現代扱っている世界中の文字の大半を扱えるようになったという経緯です。
ただ、「UNI-CODE」化する途中の段階で、「世界中の全ての古今東西の文字」を扱うには、文字数が増えすぎるので、いくつか共通化しなければいけない文字(特に、漢字)が出てきてしまって、これが、非常にやっかいで、漢字は元々は中国語なわけですが、日本の例のように、「日本独自の漢字」、「線の向きなどが少し違う異体字」などが大量にあって、他の外国で漢字を使っている国は、「韓国語」、「台湾」、「古いベトナム語」、「トンパ文字(漢字の象形文字状態を現在でも使ってる文字)」などを、どうするか?という問題が生じて、かなり強引に、まとめてしまいました。
この問題と、問題がはっきりしていないので、「UNI-CODE」に未収録の膨大な量の「日本の異体字の漢字」なんかの資料が宙ぶらりん状態のままなので、それを現在処理できるのは、かつて、「国産パソコン」の利点の、「自分の国の言語学に最適なOSを作って、より多くの漢字を扱えるようにしよう」という「超漢字」プロジェクトの資料なわけで、それを漢字辞典的に検索で使えるようにしたものが、今回買った「超漢字検索」というソフトなわけです。

この「国産パソコン」の利点の、「自分の国の言語学に最適なOSを作って、より多くの漢字を扱えるようにしよう」という概念は、非常に大切な事で、実は、現在、私達が使っている日本語は、ウソの日本語で、1945年に日本は近代戦争で敗戦した時に、アメリカのマッカーサーとかが来ましたが、あの時に、「米軍が日本を管理するのに、日本語は難し過ぎるから、もっと簡単にしろ!」と圧力がかかって、当時の日本政府は、これを受け入れてしまったので、そういった経緯で、平仮名のワ行の「ゐ、ゑ(ヰ、ヱ)」とかが消滅したり、日本語の文法が簡易になりました。(「現代日本語」の言語学の開始)
この日本語の文法を簡易にするという方法は、資本主義や経済にとっては、合理的で良かったので経済は大きく発展しましたが、多くの日本語の漢字や単語が消滅して、「日本語は死んだ」という時代だったのです。
その後に、「JIS漢字水準」やらなんやらと規格は作ったものの、要するに、これらの規格は、「米軍が日本を管理しやすくする」為の規格を作っただけなのに、なぜか?NHKや、日本の国語学者、辞典学者、東京大学などの大学の先生、教授に到るまで、「JIS漢字水準に準拠した形の論文」を作る始末で、だから、東京大学の先生、教授は馬鹿だと言われるわけです。(日本語の国語や、日本で本来使われていた漢字、単語を守ろうともしない!)

東京大学というのは、歴史の流れとしては、江戸時代まで日本は鎖国をしていたので、「これが、日本の法律だ」と言って、「日本の町中に生首を飾っていた(さらし首)」りしたので、それではいかん!という事で、近代日本を世界の中で、国家として最低限やっていけるように、「政治家や官僚を育成する目的の大学」という目的で作られたのですが、その根本概念が間違っている(ひたすら暗記だけさせて、ロボット的に対応させる人間を育てる)ので、長く「お役所仕事」と揶揄されるような不自然極まりないおかしい対応をする事を言われるようになりました。
前から自分が指摘しているように、予定調和状態になりやすい日本の社会構造は異常で、「暗記した事をロボットのように繰り返して言うだけ」ならば、人工知能時代の現代では、ロボットや人工知能でもできる事であって、「暗記した事をロボットのように繰り返して言うだけ」の人間を、自分は、賢いとは全く思わない。
人工知能時代の人間の価値や役割というのは、「人間にしかできない、複雑な事を考えたり、判断したりする、本当の賢さを身に付ける事である」と思うわけです。

 

(漢字の正確な字形を調べるのは困難)
最近の「お役所仕事」の事件例としては、「子供が産まれたので、ごく普通の子供の名前を付けて、出生届を出しに行った人が用紙を提出したら、”あなたの書いた字は、ゴシック体なんかの印刷物の文字の形と、線の向きが違うので受理できません”と言われた」事件があります。
これは、今回の「超漢字」という話題と密接に関連していて、漢字というのは、日本でも中国でも、「微妙に、線の傾きが違う方向になっている」、「点の箇所が伸ばして、線になってつなげる字体が存在している」、「日のような漢字の中の線の箇所が、きちんとつながってる線の場合と、完全に離す書体が存在している」、「一点しんにょう、二点しんにょうの形が存在している」とか、非常に微妙な違いの「異体字」というものが存在している問題があります。
漢字の、この問題をきちんと処理する為には、日本の古文書の草書の筆遣いのままでは、何が何だか正確な字形がわからないので、「中国のオリジナルの漢字辞典」を元に辿っていったりするわけですが、漢字の国の本家本元の中国では漢字を大量に収集して分類した辞典の事を、「字書」と呼びます。
日本では、漢字の正確な字形を知りたい時には、中国の漢字字書の「康熙(こうき)字典」なんかが、よく基準として使われるわけです。
ヨーロッパの教科書では、「世界ではじめて、活版印刷を発明したのは、1445年のヨハネス・グーテンベルクだ」という風に、ウソを教えていて、実際には、太古の昔から紙と活字印刷の技術を中国では普通に使っていて、「曖昧な筆の古文書」ではない活字体の漢字を調べるには、1番古い中国の漢字字書を参考にするわけですが、実の所、人間が作るものなので、この中国の字書自体が間違っている箇所があります。
それで、石碑などの碑文体とか、いろいろな考古学のものと照らし合わせていって、現在も、中国、日本など「文字の形を調査する」人達は、「正確な、それぞれの漢字などの字形を模索している」ような段階です。
なおやっかいな事に、中国では、古代の時代から、活字印刷や碑文などのように、「筆」の曖昧な線ではない方の書体でも、「隷書(れいしょ)体」、「楷書体」、「明朝体」、「宋朝体」、「仿宋(ほうそう)体」など、たくさんあって、いわゆる「活字」という字体は、筆よりも曖昧性はないものの、今度は、「書体」というデザイン的な側面が出てきてしまう問題があります。
「超漢字(TRON)」や、「超漢字検索」のような概念で活動している漢字学全体の研究家達は、まだまだはじめの1歩位しか進んでいない段階で、中国の古文書漢字学研究の古文書の漢字字書である、「説文解字」、「玉篇」、「切韻」、「龍龕手鑑」、「広韻」、「集韻」、「五音篇海」、「字彙」、「正字通」、「康熙字典」、「中華字海」なんかの全ての字体を含んでいないので、まだまだという所です。
ここまでできた所で、ようやく、先程の「お役所仕事」事件の「その漢字本来の正確な字形がわかる」わけです。
日本の古文書学では、中国のように、活版印刷が盛んではなかったので、ほとんどが、「筆による草書」ばかりで、さらに、「漢字から平仮名が作られていく最中の字形が少しずつ変化していく古文書の字形」などもあるので、もっとやっかいです。

 

(「超漢字検索」の使い方)
現在のWindowsに入っているMicrosoftの「IME」の「IMEパッド」や、「手書き入力」で漢字を検索して入力することはできますが、Microsoftは、アメリカのメーカーなので、日本語の漢字の検索については完璧ではありません。
「超漢字検索」では、より日本人が直観的に漢字を検索できる仕組みを持っています。
細かい使い方は、公式ホームページを見た方が早いです。

 

(超漢字検索)
http://www.chokanji.com/ckk/


使用方法の部分だけまとめると、

(漢字を検索する場合)
まず、「超漢字検索」のソフトを立ち上げてから、[漢字検索]のタブにします。
「検索窓」のところに、

(1) 「にんべん」なら、似た形のカタカナの「イ」、「うかんむり」なら、カタカナの「ウ」で検索できる。
一般の検索と同じで、スペースを空けて、「イ ウ」で検索すると、「にんべん」と「うかんむり」の両方が含まれた漢字の検索になります。
(2) 漢字を日本人が分類しているので、異体字も同時に検索候補に出てくる。
例えば、「寿」で検索すれば、異体字の「壽」を含んだ「檮」も一緒に出てくる。
(3) 「画数検索」の仕方は、全角、半角のどちらでもいいので「=3〜9」で検索すると、「3画〜9画」の漢字を検索できる。
先程のように、「イ ウ =3〜9」のように、スペースを空けて入力して検索すれば、「にんべん」と「うかんむり」、「3画〜9画」の全てが含まれた漢字の検索になります。
(4) 「漢字に含まれるパーツ」の覚えている特徴的な部分だけを入力して検索できる。
例えば、「木 缶 木」で検索すると、「鬱」が探せる。
(5) かけ算や引き算を組み合わせて検索できる。
例えば、「木*4」により「木」を4つ以上含む漢字を探せる。
「登−豆」で検索すれば、「癶」を含む漢字を検索できる。

 

(関連する異体字を探そう)
今やった方法で探したい漢字が出てきたら、その漢字を選択してから、[文字情報]タブを選べば、「異体字」や関連の深い漢字の分類を見る事ができる。
ここで、中国語や韓国語では、同じ漢字が、どのように表記されているのか?を見る事もできる。

 

(記号を検索する場合)
まず、「超漢字検索」のソフトを立ち上げてから、[記号検索]のタブにします。
「部品」の「検索窓」のところに、

(1) 「丸 3」、「o(アルファベットのオー) 3」なんかで、「⓷❸」なんかが出る。
(2) 「o(アルファベットのオー) A」で、「Å」が出る。
(3) 「A(アルファベットのエー) ,(コンマ)」で、古典ギリシャ語の無気息記号付きの文字が出る。(古典ギリシャ語入力は、「有気、無気、重アクセント、鋭アクセントなどの組み合わせを正確に入力する必要があるので、「超漢字検索」からの検索入力でする事は、全くお勧めしない!通常のUNI-CODEキーボード入力の方がはるかに楽で正確)

 

(インターネットでわからない文字があった時に検索する方法)
漢字であれば、[漢字検索]タブの検索窓に、コピー&ペーストをして検索で出てきた漢字を選択して、[文字情報]タブを選べば、細かい、その漢字の情報がわかります。
欧米の文字とか、タイ語とかの東南アジアの文字とか、アラビア語、ヘブライ語なんかの文字の場合には、[記号検索]タブの「部品」の「検索窓」で同様にやれば、その文字が何なのか?がわかります。
注意しなければいけない事は、アラビア語、ヘブライ語なんかの文字では、「右から左に書く」ので、検索窓に入れると、入力方向が逆方向になるので、パニックにならないようにしましょう!
実は、この「世界中の外国語の文字が、何なのか?」を調べたり、中国語や韓国語の漢字が日本語の漢字だと何にあたるのか?を調べる機能が、とても便利なのですが、特に、中国、韓国、イスラエルなんかは、ネットサーフィンをしていると、非常に、「ランサムウェア(身代金型ウイルス)」とかの「ウイルス」に感染しやすいので、FlashやJavaは、「必ず、完全にOFFにして」から、ネットサーフィンしないと、非常に危険です。

海外のホームページで「文字化け」して読めないページがあった場合にも、この方法を使って、[文字情報]で検索して調べてから、「アルメニア語」とかがわかるので、場合によっては、フォントを追加したり、エンコードを調整すれば、読めないページが読めるようになります。(何語というのが出ない場合には、UNI-CODEのコード番号とかを調べれば、その文字化けした文字が何なのか?がわかります)

 

(古文書解読人工知能を作れ!)
この「超漢字検索」の1番凄いところは、「変体仮名」、「陰陽五行文字」、「ホツマ文字(ホツマツタヱ、神代文字)」なんかのような考古学の古文書翻訳で必要な文字が入っている事です。

 

(「変体仮名」の見方)
「超漢字検索」のソフトを立ち上げてから、[記号検索]のタブにします。
「部品」の「検索窓」のところに、「あ」とかの平仮名を入力すると、「変体仮名(日本の古文書で、漢字から平仮名になっていく課程の文字)」が出てきます。
実は、この「変体仮名(日本の古文書で、漢字から平仮名になっていく課程の文字)」を含めて、OCRを作って、いろいろな所にある石碑なんかを、人工知能付きのカメラで撮影すれば、「石碑の古文書が読める」というような、SFや、アニメのような事が可能になる時代まで、ほんの数年でできる所まで今の技術発展の歴史では来ています。
こういった「変体仮名(日本の古文書で、漢字から平仮名になっていく課程の文字)」や、「くずし字」、「草書」というのが日本の場合には筆の文化なので、古文書を人工知能が解読するときのOCR化するときの困難な原因になっていますが、キュレーション型人工知能にして、人間が判断材料にする資料として、データベース化して扱いやすくする方法ならば、現代の人工知能技術でも可能な範疇にあります。
日本の戦国武将の当時の手紙とかの古文書を読んでみたい人は、この「超漢字検索」の「変体仮名」を眺めたり、次のような、「くずし字」のおおまかな傾向例の文字の形を分類してある事典を参考にすれば、だいぶ、古文書が読めるようになります。

 

くずし字用例辞典(東京堂出版)
古文書解読事典(東京堂出版)
異体字解読字典(柏書房)
音訓引き古文書字典(柏書房)
草書検索字典(三省堂)

 

(文字が読める事の大切さ)

例えば、東日本大震災で、大津波が来て大被害が出てから、日本の古い石碑を調べたら、今から数百年前の人達が、今の私達に津波の恐ろしさを伝えようとして、「ここまで津波が押し寄せたので、この石碑を置いた」というような意味の石碑が、日本中の到る場所に建っているのですが、古い時代には、「津波」ではなくて、「津浪」と書いてあったり、くずし字の古文書で読めなかったりしたので、「何も警告が伝わっていなかった」という苦い経験があります。
こういった日本中にある「津波が、そこまで来た石碑」というのは、津波は、道や川といった線状の隙間があると、急激な速度で進行するので、「津波が、そこまで来た石碑は、山奥にある」事が多くて、地元に住む誰も、「津波」や「海」に関係した石碑だと気が付かなかったといいます。
現代の日本では、産業の発展を重要視してきたので、道路を縦横無尽に傾斜も低くして張り巡らせたので、今後来る大津波は、その傾斜の低い大きな道路や交通網に従って、急激に進行するという仕組みが東日本大震災の津波の研究で確実にわかっています。
「文字はあっても伝わらない」、「米軍が日本を管理しやすいように、日本語を簡易なものにしてしまって、本来の本当の日本語を誰も読めなくなってしまった」では、意味が無いという事です。

 

(欧米の場合には)
このように、現在のUNI-CODEでは処理できない、手書き写本時代の古代のキリスト教典とか、「古英語」、「古フランス語」で書かれた文献の解読などは、欧米の考古学者の間でも盛んなので、海外では、海外のツールがあります。
「超漢字検索」は、「日本の考古学で出てくる全ての文字」に特化していますが、欧米でも、似たような状態にあって、例えば、「合字」という文化が欧米では起きていました。
ヨーロッパ写本学などは、別の歴史や文化を持っているので、現地の人の作ったツール(通常、西洋占星術、錬金術などで使う記号や文字や、天文学ツールが含まれる)を探した方が正確です。
ヨーロッパ写本学に比べて、「超漢字検索」が、うまく機能できていない部分は、「古代の人々の文字は、天文暦と密接につながって機能していた文字である」という事を理解していない事です。
ですから、ヨーロッパ写本学では、「当たり前の機能、ツールとして、言語学や、古文書の文字を扱うツールの一部分の機能として、天文学ツールと、天文暦ツールが含まれている」わけです。

 

(「合字」の例)
A + E = Æ, æ
O + E = Œ, œ

 

ヨーロッパで「合字」の文化が起こった原因は、「石碑に刻む時に、古代ローマでは大理石だった事で、大理石は非常に高価だった為に、予算を削る必要があって、単語で、よく出てくる文字の並びがある場合には、2文字以上の文字を、1文字に合字にしてしまうという事が行われました。
ヨーロッパの写本の場合には、中国やアジアのような「紙」を作る技術が発展していなかったので、「羊皮紙」という高価な羊の皮を伸ばしたものを紙の代わりに使っていた事も原因です。

「超漢字検索」は、こういった感じで、自分なんかのように考古学や言語学を知っている人が使い方をわかって使った場合には、かなりの事ができるので、今回書いたような事を参考にして使えば、中国、韓国のネットサーフィンで漢字がわからない場合に使えたり、古文書解読や、欧米、東南アジア系の文字が何なのか?を探すのにとても便利なので、この「超漢字検索」は、持っていて損はないです。
世界中の海外のネットサーフィンで困った時に使えます。(言語学の知識がいるが)
(中国、韓国、イスラエルなんかは、ネットサーフィンをしていると、非常に、「ランサムウェア(身代金型ウイルス)」とかの「ウイルス」に感染しやすいので、FlashやJavaは、「必ず、完全にOFFにして」から、ネットサーフィンする時には注意しましょう!。)

評価:
価格: ¥ 10,260
ショップ: 楽天ブックス

| 考えられる人工知能を作る | 12:59 | - | - | -
「個体の考える」と「集団の考える」問題のパラドックスを解かないといけない

最近、「考えられる人工知能を作ろう」というテーマで考えていて、今の所、わかった結論としては、おおまかな流れを書くと、
・「考えられる人工知能」=「計算」
・「考えられない人工知能」=データベースを「参照」するだけ
なので、「考えられる人工知能」=「計算」は、数学ソフトをメインにしている(WolframAlphaタイプ)で作れそうなので、これで、「定理」、「公式」の塊の人工知能を作った場合の事を考えると、自分が、「神」型とか「賢者の石」型と呼んでいる「常に真実のみを指し示す存在」になる事がわかった。
一方で、「人間が考える」というプロセスがわからなかったので、それを考えた所、「全員が同じ意見を言う」ので「集団が考えられない」場合がある事がわかった。
それで、パラドックスが発生して、「定理」、「公式」の塊の人工知能を作ったら、「常に真実のみを指し示す」ので、答えは1つしか述べない。
なので、この「定理」、「公式」の塊の人工知能をたくさん作って議論させると、先程の「集団が考えられない人間」のケースと同じで、「全員が同じ意見を言う」ので、「集団としては考えられない人工知能」になった!というパラドックスが起きて、この対処方法を考えている最中です。

 

(「全にして一、一にして全」問題)
実は、この「個」と「全」に対する問題は、哲学や錬金術でよく出てくる「全にして一、一にして全」問題という古典的な問題があります。
古代や中世に書かれた錬金術書で、「ウロボロス」と呼ばれるものがあって、これは、「自分の尻尾を噛んだ蛇」の絵の部分ばかりに注目がいきますが、錬金術書の「ウロボロス」の周りに、「一にして全」という意味の文字が書かれている事があります。
実は、中世ヨーロッパの「魔女裁判」の影響で、錬金術師達は、「情報を暗号化して秘匿して書く」ようになりました。
錬金術での「全にして一、一にして全」または「全にして個、個にして全」の意味は、「全ての物質は、液体、気体、固体を循環させて、元に戻す事ができるので、永遠である」という意味です。
「自分の尻尾を噛んだ蛇」の図像は、「循環可能です」の意味です。
「一にして全」は、現代語で書けば、「全ての物質は、1つの物質の状態の物でも、化学的に分解すれば、全ての物を生み出す事ができる状態(分子、元素)に変換できます」という意味で、化学式で習うように、逆側の操作である、「全にして一」と呼ばれる、「生み出した全ての物質も、再び化学分解すれば、元あった1の方の物質に戻す事が可能です」という意味です。
ですから、この2つが組み合わさった「全にして一、一にして全」とか、「一にして全、全にして一」とかいう文章の意味は、「全ての物質は、液体、気体、固体を循環させて、元に戻す事ができるので、永遠である」という意味なわけですが、この「全にして一、一にして全」が書かれている箇所は、現代語に解読すると、「永遠」あるいは、「循環による永遠」の意味で書かれている事があります。
要するに、古代や中世に書かれた錬金術書で、「ウロボロス」が書かれている章に書かれている内容は、「元素に分解して処理して使って下さい」という内容です。
問題な事は、錬金術の時代には、化学が無かったので、「元素」の考えが、「四大元素」だったり、原材料に、「霊魂」を使うと指示されている事がある事です。
このように、哲学なんかで出てくる「個」と「全」に対する問題は、複雑な問題を引き起こします。
今回は、どうも、その「個」と「全」に対する問題が、「人工知能」や「人間」の「考える」というプロセスで出てきてしまった問題のようです。
錬金術は、「化学」の話がほとんどなので、今回のケースでは使えないようです。
「攻殻機動隊」の場合の時代設定では、「肉体と機械との境目が曖昧になっていく時代の過渡期に、ネットと肉体が融合して密になっていった時代に、個と群体との境目状態に入った人の意識の物語」という感じです。

 

(「集団が考えられない」状態について考える)
今回出ている重大な問題が、「全員が同じ意見を言う」状態では、「人工知能」も「人間」の場合でも、どちらでも、「集団が考えられない」状態になってしまう事です。
「人工知能」は、機械的計算の産物なので、「全員が同じ意見を言う」事しかできません。
ですから、前回書いたように、
・「人工知能」ごとに、個性や違いを持たせて、「別の意見や判断、結論を言う」ような設計にしなければいけない。
それで、前回、自分が結論付けたように、「考えるという行為は、間違うという行為である」可能性を指摘したわけです。
「集団が考えられない」状態は、現代の日本では深刻で、前から自分が書くように、「過剰な協調性教育」の結果、社会学の「予定調和」と呼ばれる現象が発生していて、現代人は、「全員が当たり障りのない無難な意見しか言えない」ので、「全員がほぼ同じ意見を言う」ので、何も議論が進まない。あるいは、問題が発生している時に、全体が、「烏合の衆」の状態になってしまって、「問題が解決できない」という議論、会議、議会の場を形成してしまう事が普通になってしまいました!
昭和の時代には、「自分の意見を言う」のが当たり前だったので、議論、会議、議会は正常なシステムとして機能していました。
現代社会では、この社会学の「予定調和」と呼ばれる現象が起きてしまうので、議論、会議、議会は、ほとんどシステムとして機能していません。
この原因は、前に指摘したように、
・「考えられない人間」=「暗記」=データベース「参照」
の状態が、現代教育のベースになって、さらに、「過剰な協調性教育」と、「内申書」的な存在のせいで、みんなビクビクしてしまって、「全員が当たり障りのない無難な意見しか言えない」時代になってしまって、「集団が考えられない」状態が生じるようです。

 

(「集団が考えられない」状態を形成する原因の例(人間社会))
・言論弾圧されている国(中国などのように、民主主義ではない国では、個人が意見を言う権利すらないので、「集団が考えられない」状態を生じます。結果として、「社会問題が発生した時に解決する能力を確保できません」例えば、中国の大気汚染問題など。全部、「政府の指示待ち」を形成するのが中国などの、言論弾圧されている国で起こる問題です)
・軍国主義(軍国主義も、同様に、「個人が意見を言う」権利すらないので、問題が発生した時に誰も解決できない社会を形成します)
・軍隊教育(軍隊教育の場合には、「隊を扱いやすくする為」に、徹底した「統制」教育すなわち、「協調性が正しいと、刷り込まれる」所からスタートします。実は、日本の就職の面接とかは世界から見ると、少し異常な点があって、「協調性」=「いい事である」が前提となって判断していますが、これは、昭和の時代に、敗戦をして中央政府が無くなってしまったので、政府の中枢の判断機能を失いました。そのまま、日本は、「軍国主義」時代に、「正しい」とされた「軍隊を統制しやすく、人民をコントロールしやすい協調性教育」というものが、残ったままになってしまいました。実の所、世界では、「協調性がある」=「長いものに巻かれる事しかできない、考える事のできない人間を育成する」として、「協調性がある」=「悪いイメージ」の国が多いです。「協調性がある」=「悪いイメージ」の国で盛んな事が、「考えられる人間を育成しよう」という事で成される「ディベート」教育です。ただし、現在の予定調和の状態になってしまった日本のような国で、「ディベート」授業を行っても、「みんな当たり障りのない無難な事しか言わない」ので、すでに手遅れで無意味です。特に、ヒトラーや軍国主義の影響で、「言論弾圧」の影響が激しい国の歴史を持つ地域の人達は、「軍隊教育」の名残である「協調性教育」には強く反発します。日本の過剰過ぎる協調性教育は、ですから、ヒトラーの影響を受けた国から見ると、かなり異常です。)
・過剰な協調性教育(現代の日本です。「全員が当たり障りのない無難な意見しか言えない」ので、「全員がほぼ同じ意見を言う」ので、議論、会議、議会のシステムが崩壊。現代人の新入社員は、会社の会議で役に立たないという問題が頻発する時代で、会社の社長なんかは困っています)

このような感じで、人間社会も含めて、「集団が考えられない」状態の問題を解決して打破しない事には、この人工知能問題のパラドックスを解いたり、哲学の「個」と「全」に対する問題を考えたりする事すらできないようです。

 

(機械の設計の「集団が考える」問題)
機械の設計の方の「集団が考える」問題は、もっとやっかいな問題が発生するようです。
(1) ミーム(meme)
(2) バイラル(Viral)
(3) バズ(buzz)
(4) ハイブマインド(Hive Mind)

 

まず、前に、自分が書いたハードSF的な解説の「攻殻機動隊」の記事で書いたように、情報工学の方では、データは、集団や群体になると、「ミーム(meme)」、「バイラル(Viral)」、「バズ(buzz)」という現象を引き起こします。
次に、「ハイブマインド(Hive Mind)」は、蟻や蜂などの昆虫が群体全体で、1つの意思を持ったように行動していく事です。
「ハイブマインド(Hive Mind)」は、機械や人工知能の設計の場合には、「お掃除ロボット」が、駅構内のような広い場所を、それぞれで交信しながら行動していくような場合です。
「ハイブマインド(Hive Mind)」は、社会学の「予定調和」に似ている所がありますが、「全体がまとまった時に、はじめて機能していく」ので、烏合の衆状態になる人間社会が形成している「全員が当たり障りのない無難な意見しか言えない」ので、「全員がほぼ同じ意見を言う」ので、何も議論が進まない。という状態とは、まったく異なるので、全然、違うプロセスと考えた方がよい。
「ハイブマインド(Hive Mind)」状態の群体は、「全体が小宇宙を形成している状態で、綺麗に機能している(しかし、誰もすでに「考えていない」、「個」が「考える」機能を失っている)」ので、自分は、「小宇宙型」や「cosmos(全体で秩序だった体系を形成しているもの)型」と呼んでいます。
人間社会が、機械や、中央政府などの一部の人間に集中管理されるという「ディストピア(dystopia)」を形成すると、この「ハイブマインド(Hive Mind)」状態に近くなって、「誰も、考える事すらできない」状態になります。
「ディストピア(dystopia)」状態の社会では、「個人個人は、それぞれ、あたかも自分の意思は持っているように感じている」のですが、実質的には、「刷り込まれている」状態なので、「疑問に持つ意識が欠如してしまっている」ような状態で、自分が最近指摘しているような、現代日本の、過剰な協調性教育の結果、「全員が当たり障りのない無難な意見しか言えない」ので、「全員がほぼ同じ意見を言う」ので、何も議論が進まないので、会社の会議や国会などで問題を解決できる能力が大幅に欠如(あるいは、消滅)してしまっていて、議論の場で、役に立たない人間が増えてきている状態に、危険な感じがします。(「自分の意見が言える」時代だった昭和の時代からは、もの凄く違和感を感じる)
「考える」事のプロセスの1つに、「疑問を持つ」がある事がわかりました。
人工知能や機械の設計の方の「集団が考える」問題は、データの集団、群体で発生する「ミーム(meme)」、「バイラル(Viral)」、「バズ(buzz)」や、「ハイブマインド(Hive Mind)」問題が発生するので、もっとやっかいなようで、人工知能や機械特有の別の問題や、社会問題が発生するようです。

 

(結論)

現在の段階まででわかった事は、
・「集団が考えられない」状態を人間社会の側は形成している事がある。
・人工知能や機械の設計の方の「集団が考える」問題は、データの集団、群体で発生する「ミーム(meme)」、「バイラル(Viral)」、「バズ(buzz)」や、「ハイブマインド(Hive Mind)」問題が発生する。

 

どちらにしても、人間社会も含めて、「集団が考えられない」状態の問題を解決して打破しない事には、この人工知能問題のパラドックスを解いたり、哲学の「個」と「全」に対する問題を考えたりする事すらできない!ようです。

| 考えられる人工知能を作る | 14:09 | - | - | -
「人間が考える」という事は、「間違う」という事なのではないか?

実の所、今現在、自分が考えている「考えられる人工知能を作ろう」という事について、いくつか、パラドックスが見つかっていて、それについて考えている最中です。
まず、自分は、この「考えられる人工知能を作ろう」という記事全体を書く以前に、最終的な結論をあらかじめ想定していて、次のようにする予定でした。
・「いくつかの人格の違う人工知能同士の判断をぶつけあう事が、”人工知能にとっての考える”という事を機械でできるようにする」事なのではないか?
しかし、実際に記事を書き出してから、先に、自分が、「神」型とか、「賢者の石」型と呼んでいる「常に真実のみを指し示す」人工知能が、先にできてしまいました。
課程は、「考えられる人工知能」=「計算する」という行為が、人工知能にとっての「考えている」だから、数理論理学で、徹底的に、正確性にこだわって、false(偽)のデータを完全に排除すればいい。
そうすると、(WolframAlphaタイプ)のように、「定理」型の人工知能になるので、このタイプで開発を完全に続けていくと、最終的には、「常に真実のみを指し示す」ので、人類史では、そういう存在を、「神」あるいは「賢者の石」と呼んでいたので、そうなるだろう。
と、ここまで書いた時に、自分は、パラドックスが発生している事に気がついて、記事で言えば、(「長縄まりあ」は、「神」。「愚民どもが〜!」)と書いたあたりで自分が考えていた事は、
(1) 仮に、「人工知能に人の魂を入れる」事が可能になるには、最低限、「考えられる人工知能」を作る必要がある。
(2) 「考えられる人工知能」=「計算する」だが、「定理」型の人工知能の場合には、「常に真実のみを指し示す」という固定した結果しか得られないので、この中に入った人は、「自分自身の意志を完全消失して、神になる以外無くなる」というか、その仕組みだと、「全部、同じにしかならない」ので、「人工知能に人の魂を入れる」事が不可能になる。
(3) なので、「人工知能」ごとに差や違いを作らないといけないので、VOCALOIDや、VOICEROIDなんかのように、とりあえず、声優をあてて考えてみた。
という感じの事を、当時、自分は考えていました。
ただ、「定理」型の人工知能の場合には、「きちんとした正確な答え」しか言わないので、「人間が考える」という事は、「間違う」という事なのではないか?という結論に到ったわけです。
「人工知能に人の魂を入れる」には、「定理」型で、「完全に正確な判断しかしない人工知能」をあえて、間違わせないといけない。

 

(パラドックス1「集団が考える事ができない状態」)
前回の記事で、「全員が、同じ無難な意見しか言えない状態」の事を、自分は、社会学の「予定調和」状態だと書いて、この「全員が、同じ無難な意見しか言えない状態」は、「集団が考える事ができない状態」です。
ですから、「常に真実のみを指し示す」という「定理」型の人工知能の場合には、これを、たくさん作って、お互いに議論させ合っても、「いつまで経っても、同じ1つの結論にしか辿り着けません」
ですから、「考えられる人工知能」=「計算する」で設計したはずなのに、(パラドックス1「集団が考える事ができない状態」)の問題が発生してしまって、これでは、「集団」の人工知能にした時には、「考えられない人工知能」の設計になってしまうわけです。
ですから、「人工知能ごとに、個性を持たせて、おのおのが別の判断や結論を持つ」ように設計しないと、「集団」の状態にした時に、人工知能が考えて結論を出す事ができません。
例えば、(WolframAlphaタイプ)のような、数学ソフトをメインにした人工知能の場合には、積分などの計算式の変数に人間が任意に代入する時に、人間側が数学的に間違った「やってはいけない」数値の入力の仕方をした時には、「エラー」を返すメッセージを出すわけですが、次のような、人工知能とのやりとりになると自分は確信しています!

 

(積分などの計算式の変数に人間が任意に代入する時に出す人工知能の「エラー」メッセージ例)
ツンデレ型人工知能「な、何、変なもの入れようとしてんのよ!」(指定された形式になっていない)
人工知能「変なもの、入れないでください」
人間「えっ?俺は、ただ積分の変数を入れようとしただけなのに」
ツンデレ型人工知能「そ、そんなに大きなもの入るわけないじゃない!」(指定された変数の上限オーバー)
人工知能「そんなに大きなもの、絶対!無理〜!入るわけない!」
メッセージだけだと、人工知能ごとの「個性」は付くかもしれないが、「人工知能ごとに、個性を持たせて、おのおのが別の判断や結論を持つ」ように設計するという仕組みを考えないといけません。
今回の、「考える事とは、間違う事」というのは、けっこう、哲学命題として正しい真実を示している可能性があります。
人間が「考える」ときには、「自問自答している」がこれが、「間違った反対側の意見を自分自身にぶつけてみる」とか、いろいろな「考える」過程の事をやっているからです。
人工知能などの「機械」側にとっては、true(真)と、false(偽)しかありませんから、「故意に間違える」しか、方法が無いのです!

 

(パラドックス2「全ての事象問題」)
数理論理学の1番スタートの大前提として、「全体の中に1つでも、false(偽)のデータが含まれていた場合には、全体は、false(偽)として扱う」があるのですが、
この中で、「false(偽)にデータがなる条件」に自分は、「データが欠けている場合」も、「false(偽)にデータがなる」と書きました。
一方で、「全ての事象」というものは、「この世にある全てのもの」を扱えないと、処理ができません。
「この世にある全てのもの」の中には、あげてみると、

 

(「この世にある全てのもの」)
・「論理」と「非論理」
・true(真)と、false(偽)

・形而上(けいじじょう)と形而下
のように、「非論理」や「false(偽)」のデータも含まれています。
ですから、人工知能側からは、「非論理」や「false(偽)」のデータの真偽値は、うまくわからないし、そもそも「把握」する事ができないので、人工知能が「非論理」や「false(偽)」を扱う場合には、「必ず、間違う」というわけです。
例えば、(内部に「false(偽)」データが含まれるが結論は正しい場合)なんかは、人工知能は、計算結果は一律に「false(偽)」のデータを返しますが、最終結論の答えの部分だけは合っている場合には、「人工知能側は処理できないので、間違えてしまいます」

自分の場合には、この「全ての事象問題」があるので、自分が論考したり文章を書く場合には、「この世にある全てのもの」が、「思考論理のテーブルに載っています」
例えば、

 

(人間社会にある「この世にある全てのもの」)
・「論理」と「非論理」
・true(真)と、false(偽)

・形而上(けいじじょう)と形而下
・都市伝説
・陰謀論
・電波系の文書
・冗談
などありとあらゆる、人間が作っている文書が、自分の場合には、「この世にある全てのもの」が、「思考論理のテーブルに載っています」
こうする事で、「未知の発見」や「アイデアの種になる」事が多いからですが、このようにしてしまうと、「書いた後の文章」は、「書いた本人は、それぞれの情報元について、”タグ”で分類しているので、真偽値を判断できますが、読んでいる側からは、よくわけがわからない文章になってしまう弊害があります。
自分の場合には、エンジニアや、クリエイターの命は、「アイデアを出す事」なので、この方式でいいのですが、読んでいる人側は、きちんと正確に判断できません。

 

数学の方で「集合」理論がありますが、要するに、この「集合」のテーブルに、「この世にある全てのもの」を全部載せて、上から俯瞰して見つめてみると、「けっこう、いろいろな事や盲点に気がつく」事が多いです。
エンジニアや、クリエイターの人で、「アイデアが出なくて困っている」場合には、この数学の方の「集合」理論方式を使う事をお勧めします。
やり方は、数学で習った「集合」のように、分類枠組みを書いて、その中に、「付箋」や「カード」に、いろいろな「この世にある全てのもの」を、「論理」と「非論理」関係なく、「全部、載せて分類していきます」
この時に、「付箋」や「カード」に書いた内容は、きちんと、「出典元(ソース)」を、「都市伝説」、「陰謀論」、「電波系」とかを、きちんと正確に把握しておく事です。
この数学で習った「集合」理論の方法でやると、「今まで、非論理だと思っていた文書は、アイデアの宝の山」になって、「都市伝説」、「陰謀論」、「電波系」なんかの文章が、「思ったよりも、無意味ではない」事に気がつきます。
アイデアが出なくなった場合には、「凝り固まった」状態の考えから抜け出さないといけないわけです。
要するに、今回の結論を書くと、現在の設計の「考えられる人工知能」の段階では、パラドックスが発生していて、次の2つの処理ができない問題を何とかしないといけない。
(1) パラドックス1「集団が考える事ができない状態」(「全員が同じ意見を言う」=「考えられない集団」問題)
(2) パラドックス2「全ての事象問題」(「全ての事象」には、false(偽)が入ってしまっているので処理できない)

 

(課題)
人工知能ごとに「個性」の差や違いを付けて、「別の判断や結論を出す」ような設計にしないといけない。

 

(追記)
(根拠のデータがfalse(偽)かもしれないが、結果の部分は、どうも正しい。という事象がある)
数学や哲学の話の中で、「根拠のデータがfalse(偽)かもしれないが、結果の部分は、どうも正しい。という事象がある」のですが、一般の論考では、「根拠のデータがfalse(偽)かもしれない」と感じられた時には、「人間は、論考を中止する」のですが、このタイプの思考方法だと、「現在の人間が知らないだけで、本当は正しい事象」を見落とす可能性があります。
これの初期のものが、「天動説と地動説」問題が人類史で起きた時です。
現在、学校で習ってはいても、「実際、誰がどう見たって、太陽が地球の周りを回っている」ようにしか見えません。
しかし、「本当の真実は、地球が太陽の周りを回っている」わけです。
こういった事の数学や哲学の話では、「フェルマーの最終定理」問題と呼ばれていて、「数学的証明が成されていない」ので、「根拠のデータがfalse(偽)かもしれない」ので、通常は、こういった「仮説定理」のような状態にある数学のものは、使わないのですが、「どうも、結果だけは使えて正しそう」なので、「数学的証明が成されていない」にも関わらず、人類は、この「フェルマーの最終定理」を使い続けてきました。
結局は、現在では、「フェルマーの最終定理」の数学的証明が成されたので、この「フェルマーの最終定理」は「true(真)」である事がわかりましたが、このように、「未だ未知の事象で正しいもの」というのは、常に、「わからない」わけです。
哲学の場合には、形而上(けいじじょう)学があるので、「人間は、常に真実を知りようがない」ので、「全ての論考、文書は疑ってみる」しかないので、自分の場合には、「教科書、学術論文」に到るまで、「全ての文章は、false(偽)である可能性が含まれる」からスタートして、「いろいろ考えた結果、どうも正しそう」という感じに、少しずつ近づけていくような方法を使っています。
「人間は、常に真実を知りようがない」し、「フェルマーの最終定理」のような問題(その時点では、数学的証明が成されていないが、どうも結果だけは正しいので使えそう)という問題があるので、自分の場合には、「この世にある全てのもの」を、「思考論理のテーブルに載せる」という手法を使っています。
エンジニアや学者が、「アイデアに詰まっている」場合には、「扱っている定説そのものが間違っている」事が多々あるので、「そこから抜け出さない限りは、永遠に、問題は解けません」

 

(論理、根拠が、無茶苦茶だが、いろいろとデータを読み取れる文書の例)
「都市伝説」系の文書の場合には、「論理、根拠が、無茶苦茶だが、いろいろとデータを読み取れる文書の例」があるので、その例を書くと、最近の学校の怪談の話で、「ひきこさん」というものがあります。
社会学や心理学を知っていれば、「どうして、このような学校の怪談のような話が自然発生してくるのか?」は、よくわかる事です。
昭和の時代には、「学校の怪談」は、「トイレの花子さん」と「口裂け女」位しかありませんでした。
しかし、平成になって、「過剰な協調性教育」が成されるようになると、なぜか?それまでには、まったく無かった「ひきこさん」という学校の怪談が登場してきました。
「学校の怪談」が生み出されてくる背景には、「子供自身の内側の深層心理で思っている本当の感情」の事を言っている事がほとんどです。
「ひきこさん」の場合には、「大人の女性に、足を引っ張られて、死んだ後の肉塊になった後まで河原で引きずられていく子供」の話という内容ですが、子供の深層心理そのものでしょう。
こういった文書の深層心理の解読は、社会学や心理学を知っていれば、とても簡単にわかる事です。
平成になって、「過剰な協調性教育」や「予定調和を強要される」時代になって、「子供自身は、本心ではしたくない事を、社会が求めるある方向に向かって、大人に引きずり回されていく子供」の世代では、深層心理では、そのように感じているのですが、小学校などでは、「まだ、文字や国語を習っていない」ので、「右脳的なイメージで、そういった子供の抱える深層心理の内容を訴えているのが、学校の怪談などの都市伝説の生み出される社会学や心理学の社会背景にあります」
こういった、自分が書いているような、「全ての事象」を対象にした論理学の事を知っていると、「出典元(ソース)」が、「都市伝説」、「陰謀論」、「電波系」なんかのような「埋もれた情報」から、「暗号解読」するようにして、「真実の中身の情報」を取り出す事ができるわけです。

ですから、自分のような手法を使うと、「定説のみでは問題の解答が不可能」になっている社会問題が出た時に、自分の場合には、かなり短時間で、「別の解法の仕方」を導き出す事ができます。(いわゆる、「斜め上」法)
論理学を、数理論理学まで含めて、きちんと勉強した事の無い人は、自分のような手法を使うと、真偽値をはねだす事ができないので、あまりお勧めしません。

| 考えられる人工知能を作る | 09:10 | - | - | -
「雛形を言う」のは人工知能でもできる時代に、「人間が考える」という事とは何か

「考えられる人工知能を作ろう」というテーマで最近は書いているわけですが、機械の設計側からは行き詰まった感じなので、今度は、「人間が考える」という行為は、どういう仕組みになっているんだろうか?という事について考えていこうと思います。
しかし、「そもそも、現代人は、”考える”という行為をしていない」気がするので、もっとやっかいそうです。
まず、機械の方の人工知能の場合には、
・「考えられる人工知能」=「計算」
・「考えられない人工知能」=データベース「参照」
という事が、前回までで自分が考えた中でわかった事です。
それで、「雛形を言う」のは人工知能でもできる時代に、「人間が考える」という事とは何か。「人間の価値」とは何か?について考えると、けっこう大変な事がわかってきました。
まず、昭和の時代では、例えば、東京大学生なんかが顕著ですが、「君は暗記ができて凄いねえ」という風に、昭和の時代では、学校の先生や親にほめられました。
しかし、21世紀の現代では、「雛形を言う」のは人工知能でもできる時代なのです!
先程の
「考えられない人工知能」=データベース「参照」
という構図ですが、人間の場合に当てはめると、「暗記」が、データベース「参照」なのです!
要するに、昭和の時代に先生からほめられていた、「君は暗記ができて凄いねえ」という文句は、「雛形を言う」のは人工知能でもできる時代の21世紀では、「君は暗記しかできないんだねえ」という意味になってしまう時代が、「人工知能でも雛形は言える時代」というわけです。
日本人は世界の中でも、「応用問題が苦手な大学生が多い」と言われていて、「考えて、問題を処理する能力が著しく乏しい」わけです。
この原因は、「暗記重視」のテスト勉強に問題があります。

 

(「学ぶ」という事と「考える」という事は違う)
大学に入ってすぐに、先生から言われる事が、「”学ぶ”という事と”考える”という事は違う。義務教育や高校生までは、”学ぶ”時代で、大学から先と社会人になってからは、”考える”という方に変わってきます。”考える”という事は、過去の定説を打ち壊して自らが想像していくという事です」
という感じの事を言われるわけです。
ここでいう義務教育や高校生までの、「学ぶ」という行為は、「とにかく、暗記して、刷り込まれるだけの行為」の事です。
要するに、「考えられない人工知能」=データベース「参照」という構図の事です。
大学から先の「考える」という行為は、「暗記した基礎知識を元にして、場合によっては、暗記した項目の定説について、再び疑問を持って、定説を打ち壊して、より真実に近い状態に近づけていく」という行為です。

 

(社会学の「予定調和」の時代の、さらにやっかいな問題)
問題な事は、最近の世代が、過剰な協調性教育の影響で、社会学の「予定調和」の状態になってしまって、「自分の意見を言えない」時代になってしまっている事です。
社会学の「予定調和」という用語は、「誰も示し合わせたり、相談したり、談合したりしていないにも関わらず、ある無難で当たり障りない結果にしか結論がいかない」ような状態の事で、これは、会社や政治家なんかにとっては、大きなマイナスです。
要するに、「全員が同じ”無難な”意見しか言えない」ので、議論が進まずに、烏合の衆のようになってしまって、問題解決ができなくなってしまうからです。
ですから、「雛形を言う」のは人工知能でもできる時代の21世紀になってしまったので、「人間ができる”考える”という行為に価値が出る」時代になっています。
これが、最近の就職の面接などで、よく人事の人がぼやく、「最近の若者は、テンプレ通りで面白くない」と言うわけです。
この場合の、「テンプレ通り」というのは、「面接指南書に書かれている通りを、丸暗記して、そのまま無難な回答のみをしている」という意味で言っています。
要するに、「個性がない」、「個人的な考えを持っていないのではないか?」と判定されるわけです。
ですから、就職の面接に受かりたい場合には、「面接指南書を丸暗記する」だけではなくて、どこかに「個人らしさ」や「個人の考え」について、事前に、よ〜く考えておかなければいけないのですが、「考える」という行為のトレーニングは結構難しいわけです。
最近の過剰な協調性教育で、「予定調和」になるように刷り込まれてしまった子供の世代の人は、「自分の意見を言って」と言われた時に、「考える」行為ができないので、「意見を言う」=「感情を言う」事が多いです。
ですから、就職の面接に受かりたい場合に、どこかに「個人らしさ」や「個人の考え」を織り交ぜて言えば、きっと、自分は次のような展開になると確信しています!
例えば、人事部長が、佐藤氏だった場合には、
佐藤氏「君に決めた!ゲットだぜ!」((注意)人事部長の佐藤氏は、ポケモンの「サトシ」とは無関係です!)
秘書「部長。危険な事を言うのは、そろそろやめて下さい!」(この秘書は、「サバサバした感じのインテリ系OLで、上司がボケた場合には適度につっこみを入れられる」という設定なので、「(CV)小松未可子」か、「宇宙よりも遠い場所」の「小淵沢報瀬」タイプの声の方の「(CV)花澤香菜」辺りの声のイメージ)
「設定」や「ト書き」や「CV指定型妄想」はいらないという話が。

 

結局、今回は、「人間が考える」という行為のプロセスはわからなかったものの、
・「考えられない人工知能」=データベース「参照」
と「人間の暗記」という行為は、同じような「参照」行為である事がわかった。
さらに、面接などで、「雛形しか言えない」=データベース「参照」なので、これも、「考えていない」というプロセスな事がわかった。
というか、「雛形を言う」のは人工知能でもできる時代の21世紀では、本当に、「人間の考える」という行為ができないと、人間の価値が無くなってしまう!
というか、「人間が考える」っていうプロセスは、どうやっているの?
自分自身が、「考えている」行為について、考えてみたけど、自分は、天真爛漫な方なので、思考形態が、自分でも、うまく把握できなかったよ。

| 考えられる人工知能を作る | 17:35 | - | - | -
<< | 2/3PAGES | >>