« 早稲田大学日本語学会 シンポジウムのお知らせ | トップページ | 公開講演会・シンポジウム「ことばの類型と多様性」 »

2010年12月25日 (土)

上代文献のテキスト公開

ここで紹介した、VSARPJ プロジェクトが、サイトで上代の日本語文献のコーパスを公開しています。

将来的には、品詞情報や統合構造などを埋め込む予定ですが、現在、原文表記とローマ字によるプレーンな解釈文が公開されています。

こちらからどうぞ。

« 早稲田大学日本語学会 シンポジウムのお知らせ | トップページ | 公開講演会・シンポジウム「ことばの類型と多様性」 »

コメント

 覚えてらっしゃらないかも知れませんが、大変ご無沙汰しております。数年前は大変な非礼を働き申し訳ございませんでした。

 VSARPJ プロジェクトですが、上代特殊仮名遣いのローマ字化に、なぜFrellesvig
& Whitmanの表記を採用したのでしょうか。イ乙とヰ、イ甲段とイ段、エ甲と江、エ乙段とエ段、オ甲とヲ、オ乙段とオ段が一読して区別しにくく、研究の障害になるのではないかと危惧されるのですが、やはり素人の思い違いでしょうか。

killhiguchi様、
コメントありがとうございます。
Frellesvig & Whitman の表記を採用した理由は簡単です。Frellesvig 氏がプロジェクトリーダーで、Whitman 氏もメンバーだからです。確かに、二類と一類は一見して見分けにくいですが、一応層補分布しているのでそれで利用するしかないでしょう。
上代の音韻構造について、私は必ずしも F & W の解釈とは違う考えを持っています。

 お返事ありがとうございます。
 上代音韻体系についての先生のお話を是非お伺いしたいのですが、論文化を楽しみに待たせていただきます。
 F&Wの表記は、音価推定に基づいていると思うのですが、としますと、彼らはサ行子音はsであったとしているのですね。形態素や文法の段階でも、特定の理論に基づいてタグが振られたり構造が書かれたりするのは仕方のないことでしょうが、できれば、「プレーンな」ものをと望むのは、素人だからでしょうね。
 もしよろしければ、テキストとして、岩波の日本古典文学大系のみが選ばれた理由や、上代文献の研究に必要であろうと思われる、訓詁学と申しますか、そもそも読みを研究する方がメンバーに加わってらっしゃらない理由も、お聞かせ願えませんでしょうか。
 歳の暮れでお忙しい時期に申し訳ありません。

killhiguchiさま、有り難うございます。
サ行の音価をどう考えていらっしゃるかは確かめていませんが、例えば摩擦音ではなく破擦音であるとしても、タ行との対立さえわかれば当面問題は無いとも言えます。
あと、タグ付きコーパスからプレーンなテキストを取り出すことはまったく簡単ですし、今公開されているのはプレーンテキストです。
訓詁が弱いのはおっしゃるとおりですが、彼等にそれを求めるのはむずかしいし、そこでとどまっていては作業が進まないという所はあると思います。

 お答えありがとうございます。
 公開されているコーパスについて誤解がありました。申し訳ありません。
 訓詁の蓄積・最前線の成果を、「彼らに求める」ではなく「こちらから提供する」というのは不可能なのでしょうか。
 読み添え・補読・誤った転写の可能性の指摘・更なる校合の成果…など、日本からしか出せないし日本から出さなければならない知的な財によって、世界的・理論的にOJあるいはPJの形態論・統語論の研究がおおいに修正・促進されるということはないのでしょうか。
 全く私的で細かいことでお手を煩わせて申し訳ありません。お忙しいと拝察しておりますので、お返事は、頂かなくとも当方の気にするところではありませんので、どうぞご随意に願います。

killhiguchi さま、

おっしゃるとおりです。そのようになるように、努力していきたいと思います。

コメントを書く

コメントは記事投稿者が公開するまで表示されません。

(ウェブ上には掲載しません)

トラックバック


この記事へのトラックバック一覧です: 上代文献のテキスト公開:

« 早稲田大学日本語学会 シンポジウムのお知らせ | トップページ | 公開講演会・シンポジウム「ことばの類型と多様性」 »