忍者ブログ
古文自動翻訳研究センター 中学・高校の古文学習をパソコンにサポートさせようと試みるページ
サイト内検索  サイトマップ   文字サイズ変更方法
トップページ開発者ブログ >古文翻訳装置
最終更新日 2019年08月30日 


◆ 古文翻訳装置

 
どんなときも 2019年07月31日(水) 23時53分  
どんなときも

つまり「どんな時も」なんですが、これを古文翻訳装置で現代文→古文に訳すと、

どんな【連体詞:如何なる】 と【格助詞:と】 きも【形容詞「きもい」終止形:心地惡し】

と誤訳します。なんともまあ酷い訳であります。

連体詞には当然のことながら体言が接続するわけで、格助詞が来る可能性がゼロでは無いとは思いますが、名詞を優先させるべきです。

※連体詞の後に格助詞が来る可能性
 「どんなと聞かれても答えようがない」など

加えて、口語では「きも」と形容詞の語幹だけで使うこともあるのですが、あまり優先的に訳出する用法でもないので、もうちょっと優先度を下げても良いかなと思います。

とはいえ。文節に区切る処理というのがなかなか難しく、色々例外処理を付け加えているのでもはや誰も理解し得ないプログラムと化している部分だったりします。

…もう「どんなとき」で一語として登録してしまうのが早いかも知れません。ちょっと検討してみます。
PR

 
2019年4月1日 新しい古文翻訳装置を公開します。 2019年03月31日(日) 23時44分  

明日(2019年04月01日)、新しい古文翻訳装置を公開します。

バージョンは古文翻訳装置ver3.1とします。
午前11時30分頃に発表される予定の新元号に対応します。
その他、新規単語を登録したり不具合を修正したり致しました。

乞うご期待!お楽しみに!

 
古文翻訳装置の新元号対応 2019年02月28日(木) 21時59分  

古文翻訳装置の新元号対応について、考えています。

古文翻訳装置には和暦を西暦に直す機能があって、例えば、

「文久三年」「嘉永六年」

なら

「西暦1863年」「西暦1853年」

といったように西暦に直して表示できます。

これに新元号もなるべく早く対応させてやろうと。
別に変換候補のリストに1行追加するだけなので手間はたいしたことないです。

「文久,+1860,西暦」

↑このようなリストを作っています。文久なら1860を足すと西暦に直ります。
新元号なら「(新元号),+2018,西暦」ですね。

ただし、例外処理として「元年」だけは別に登録します。
「文久元年」は「西暦1861年」という感じです。
「元年」を「1年」と認識させるより、「文久元年」を一つの単語として認識した方が処理が簡単なので。

特に和暦が古文で西暦が現代文という使い分けはないですし、あまり有用な機能ではないかも知れませんが、実装するのが簡単なので、やります(笑

 
割と単純な処理ながら 2017年10月31日(火) 23時50分  
「など」という古文単語があります。

こなたかなたの御送りの人ども、寺々の念仏の僧など、そこら広き野に所もなし。

…と言う場合の「など」と、

など斯うは泣かせ給ふぞ。

…という場合の「など」。

品詞の面から言えば副助詞と副詞の違いで、
意味の面から言えば「~等」と「どうして」の違いです。
前者の「など」は現代語でも使うので分かりやすい。

「犬や猫などは動物の仲間です」

…という場合の「など」ですね。

と言うわけで、古文を読解する上で覚えなければならないのは後者の「など」です。

ただ、前者の「など」がもっぱら名詞の後につくので判別はしやすい。
…人間にはね。

機械にこの判別をやらせようとすると、前の単語が名詞か否かを判断するという作業が必要になり、これはなかなか難しい。
機械は何を持って名詞を名詞と判断するのか。
正直もうデータベースの問題です。データベースが完璧なら完璧なのです。
古文翻訳装置では、前の単語が名詞の辞書に登録されていれば名詞と判断し、無ければ名詞ではないと判断させています。
登録されていない単語、これを「未知語」と呼びますが、これについては、はい、とりあえずスルーします(^_^;)

辞書の充実、これが命ですね。

ちなみに最初に出した例文の訳ですが、

あちらこちらの葬送の人や、いろいろな寺から来た念仏を唱える僧侶などで、とても広い野原に隙間もない。



どうしてこのようにお泣きになるのであるか。

です。

 
現代語→古文 の形容詞音便処理 2017年02月27日(月) 21時53分  

古文翻訳装置の次期バージョンの開発状況報告です。

形容詞の口語、つまり少し砕けた言い方にも対応する予定で開発しています。
日本人は何も考えずともやっていることなのですが、
機械にやらせるとなると全部1から教え込まなければなりません。





◆ 情報早見表

◆ 来客数

◆ カレンダー
2019年08月 2019年09月 2019年10月
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30

◆ カテゴリー

◆ RSS

◆ ブログ内検索

◆ 月別索引



◆ 最新コメント

◆ 広告


利用規約   推奨環境   個人情報保護   お問い合わせ トップページへ   最上へ

制作:古文自動翻訳研究センター

忍者ブログ [PR]