« 石橋名店シリーズ「貞子」 | トップページ | 明晰日本語 »

2006年5月24日 (水)

ニワトリが……

ここで、以前私のところに「トリビア」のオファーがあった話を書きました。

私の同僚のO先生の所にも、3月頃、「トリビア」から電話がかかってきたそうです。

「庭には二羽、ニワトリがいる」という早口ことば(?)には、何通りか意味があるようですが……

という問いかけで、O先生には相手の趣旨がつかめず、かみ合わないやりとりがあったあと、「会議がありますので」と電話を切ったそうです。

このネタは、先週、放送されました。ご覧になった方もあるかと思いますが、「にはにはにわにわとりがいる」には96通りの解釈がある、というものです。

この問題自体は、「形態素分析」と「パージング」と呼ばれる課題に関連するもので、自然言語処理(自動翻訳や機械による音声対話など)の分野で一頃盛んに議論されたものです。つまり、人間が発する音や単語の列を、コンピュータが文として分析するときに、しばしば多義性が発生するのです。古典的な問題では、

Time flies like an arrow. (光陰矢のごとし)

をコンピュータが分析すると、何通りかの(数は忘れました)解釈が出てきて、機械ではどれが正解か決定できない、というのがあります。変な解釈の一例として、「時蠅(time flies)矢を好む」というのがありました。「ときばえ」という種類の蠅は(なぜか)矢が大好き、という訳ですね。

日本語でも、

黒い大きな目の女の子

というのがあって、「黒い」が目にかかるか、うしろにかかるか、また「女の子」を一人ととるか、「女の」と「子」に分けて二人ととるか、といった多義性が生じ、さらにその組み合わせで解釈が複雑になるわけです。機械処理では、複数生じた解釈を、文脈を見たり、あるいは蓋然性の確率等によって絞り込む、という処理でふるい分けることになります。

さて、以上の問題は既にどれが単語かという問題は解決されていて、つまり「形態素解析」は済んだ状態で、パージング(文の構造解析)だけの問題でしたが、「トリビア」では、仮名の列だけが与えられている状態で、形態素分析(単語の切り分け)からやらないといけません。そうすると、当然解釈の幅はさらに広がります。広がった方が、ネタとしては面白いですからね。

この課題に取り組んだのは、フェリス女学院大学の斎藤孝滋先生です。この方は、以前お世話になったこともある、私も個人的によく知っている方です。先生は、形態素分析をまずコンピュータで行われて、2万通り以上の組み合わせを得られました。つまりその中には、

荷、葉、二、刃、尼、輪、……

のようにまるで意味の通らない文字列も多数生じることになります。ここから、意味の取れる文字列を選ぶのに、斎藤先生は人力で挑まれたようです。大学院生5人とともに、三日間徹夜して(たぶん、夜は学生を帰して先生お一人でやったのだと思いますが……)、2万数千通りを、96通りまで絞り込まれたとのことでした。

頭が下がります。テレビに出るのも、楽ではないですね。O先生が電話を切られたのは、正解だったと思います。

なお、残された96通りの中には、

庭にハニワ、丹羽と李が射る。(庭にハニワが置いてあって、丹羽さんと李さんがいっしょに矢で射る)

というような、かなり無理っぽいのまで残されていました。たぶん、笑えるから、わざと広めに残したんだと思います。

|

« 石橋名店シリーズ「貞子」 | トップページ | 明晰日本語 »

コメント

視聴報告、ありがとうございました。
私のところに電話があったのは二月で、ちょうど卒論修論試問の最中でした(説明が面倒なので「会議」と言ったのでした)。

最初、言われたのは、

  「庭に埴輪、鶏が居る。」とも読めますがどうでしょう。

というようなことでした。「埴輪が居る」とは言えないように思ったので、「それは非文では?」と答えたのですが、自由律俳句のようなものと考えれば、まあいいか、とも思い、単語の羅列も認めるのか、認めればやたら多くなるがそれでもいいのか、と言って、やる人は大変だろうなぁという感触だけを示したのですが(まさか私に「やってくれないか」と言ってたのではないと思いますが)、情報学畑の人でなく、日本語学畑の人が、二万の例から人力で選ぶとは、驚きました。

仮字遣はどうだったのでしょう。現代仮名遣いを使ったのでしょうか。「庭にハニワ、丹羽と李が射る。」からすると、そのようですが。

また、一文に収まるもののみに絞ったのでしょうか、それとも複数の文でも可でしたか。
 「庭に!」「は?」「庭!」「庭?」「鳥が居る!」
 「庭に!」「は?」「庭に!」「わ、鳥が居る!」
のような(現代仮名遣いによる)。

投稿: 同僚O | 2006年5月24日 (水) 10時06分

同僚のOさま、フォローありがとうございます。

仮名遣いは現代仮名遣いです。文の単位は、1文に限られていたように思います。96例すべて挙げられたわけではないので、あやふやですが。

しかし、対話にすると、もっとおもしろさが増しますね!スタッフに教えてあげればよかった。

ところで、「(まさか私に「やってくれないか」と言ってたのではないと思いますが)」ということですが、食いついてきたら「ではやってください!」ということになったんだと思いますよ!

投稿: SKinsui | 2006年5月24日 (水) 11時18分

私どもとしては、96例にどんなものがあるのかを知りたいところですが、テレビ番組にそれを望んではいけないのでしょうね。
(番組ホームページとか、本になる際に、と望むのもせんないことなのでしょう)

これからも電話がかかってきたら、自分のところには回ってこないように対応しようと思っています。(とはいえ、日本語の面白さを伝えられるかもしれない、という感触を持ってしまったら、食いついてしまうかもしれませんが)

投稿: 同僚O | 2006年5月25日 (木) 16時29分

ぜひ食いついて下さい!ご活躍を期待しております。

投稿: SKinsui | 2006年5月25日 (木) 19時52分

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/145561/10216298

この記事へのトラックバック一覧です: ニワトリが……:

« 石橋名店シリーズ「貞子」 | トップページ | 明晰日本語 »