…交差点でも 夢の中でも こんなとこにあるはずもないのに
現在、現代文を古文に翻訳するプログラムの、助動詞を認識する部分を制作中です。
多分ここが一番ややこしい部分なので、これが完成すれば全体の完成のめどもつけられるかと思います。
その仕組みですが……
たとえば、「思わなかったので」と入力された場合、
(1)「思わ/なかっ/た/ので」と、形態素に分ける。
※形態素とは、意味を持つ最小の文字の固まりのことです。
(2)「思ふ/ず/けり/ば」のようにそれぞれを古文の単語に置き換える。
(3)必要ならば単語の順序を入れ替える。
(4)「思は/ざり/けれ/ば」と、それぞれを正しい活用形にする。
上記のような順序で現代文を古文に訳します。
……
しかしながらいまだに(1)も出来ていない……。
接続を考慮して未然形の後には未然形接続の助動詞がくっつくようにする…という処理が結構めんどくさいです。 とりあえず、日本語の助動詞を整理して、それぞれを接続や活用の情報とともに古文翻訳装置に記憶させておかねばなりません。……地道に辞書とか参考になるウェブページとかとにらめっこしています。
ちなみに
きのう
牛丼を辞書に登録しましたが、
豚丼
を入力していないのは不公平だと思いましたので、
豚丼も登録しておきました。
ところで、あなたは豚丼を「
ぶたどん」と読みますか?「
とんどん」と読みますか?
私は「とんどん」だと思っていましたが……。
PR