忍者ブログ
古文自動翻訳研究センター 中学・高校の古文学習をパソコンにサポートさせようと試みるページ
サイト内検索  サイトマップ   文字サイズ変更方法
トップページ開発者ブログ >形態素解析が終わらない
最終更新日 2024年10月31日 


◆ 形態素解析が終わらない

 
形態素解析が終わらない 2009年03月15日(日) 23時23分  

…交差点でも 夢の中でも こんなとこにあるはずもないのに
現在、現代文を古文に翻訳するプログラムの、助動詞を認識する部分を制作中です。
多分ここが一番ややこしい部分なので、これが完成すれば全体の完成のめどもつけられるかと思います。

その仕組みですが……

たとえば、「思わなかったので」と入力された場合、

(1)「思わ/なかっ/た/ので」と、形態素に分ける。
 ※形態素とは、意味を持つ最小の文字の固まりのことです。

(2)「思ふ/ず/けり/ば」のようにそれぞれを古文の単語に置き換える。

(3)必要ならば単語の順序を入れ替える。

(4)「思は/ざり/けれ/ば」と、それぞれを正しい活用形にする。

上記のような順序で現代文を古文に訳します。




……


しかしながらいまだに(1)も出来ていない……。


接続を考慮して未然形の後には未然形接続の助動詞がくっつくようにする…という処理が結構めんどくさいです。 とりあえず、日本語の助動詞を整理して、それぞれを接続や活用の情報とともに古文翻訳装置に記憶させておかねばなりません。……地道に辞書とか参考になるウェブページとかとにらめっこしています。



ちなみに


きのう牛丼を辞書に登録しましたが、


豚丼


を入力していないのは不公平だと思いましたので、豚丼も登録しておきました。

ところで、あなたは豚丼を「ぶたどん」と読みますか?「とんどん」と読みますか?
私は「とんどん」だと思っていましたが……。
PR

コメント(0) [コメントする]  

トラックバック() [トラックバックする]  


 

この記事にコメントする

個人情報は、必要な範囲内でご記入下さい。コメント本文以外は空欄でも構いません。
お名前
タイトル
文字色
メールアドレス
URL
コメント
パスワード   Vodafone絵文字 i-mode絵文字 Ezweb絵文字
コメントは承認制となっております。投稿後しばらくして表示されます。詳しくは利用規約を御覧下さい。
 

この記事にトラックバックする

  この記事へのトラックURL :
トラックバックは承認制となっております。投稿後しばらくして表示されます。詳しくは利用規約を御覧下さい。



◆ 情報早見表

◆ 来客数

◆ カレンダー
2024年10月 2024年11月 2024年12月
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30

◆ カテゴリー

◆ RSS

◆ ブログ内検索

◆ 月別索引




利用規約   推奨環境   個人情報保護   お問い合わせ トップページへ   最上へ

制作:古文自動翻訳研究センター

忍者ブログ [PR]