例文の元ネタを推測してみて下さい。……え、クリスマス?でもそんなの関係ねぇ!!
前回の記事
http://kobun.blog.shinobi.jp/Entry/19/
の続編として、
仮名漢字変換ソフトウェアの比較をしてみました。
…と、いっても、どれを使っても文章は打てます。
実際、いくつかの例を変換してみましたが、格段の性能の差というわけではないようです。
以下に変換例をあげます。
■こっきょうのながいとんねるをぬけるとゆきぐにであった
ATOK 国境の長いトンネルを抜けると雪国であった
Social IME 国境の長いトンネルを抜けると雪国であった
MS-IME 国境の長いトンネルを抜けると雪国であった
…どのソフトウェアでも全く同じですね。
ちなみに「国境」は「こっきょう」と「くにざかい」とどちらに読むべきか論争があるそうです。私は「こっきょう」だと思っていましたが。
■おひるやすみはうきうきうぉっちんぐ
ATOK お昼休みはうきうきウォッチング
Social IME お昼休みはウキウキウォッチング
MS-IME お昼休みはうきうきウォッチング
大概の文章はどの仮名漢字変換ソフトウェアを使っても正しく変換されます。
■くるまではこをはこぶ
ATOK 車で箱を運ぶ
Social IME 車で箱を運ぶ
MS-IME 車で箱を運ぶ
この例は、
来るまでは子を運ぶ。
車では子を運ぶ。
来るまで箱を運ぶ。
など、何種類か正しい日本語になる可能性が秘められているのですが、変換結果はすべて同じでした。
■にせんきゅうねんどのよさんがくがかこさいだいに
ATOK 二千九年度の予算額が過去最大に
Social IME 二線級年度の予算額が過去最大に
MS-IME 二千九年度の予算額が過去最大に
Social IME、惜しいですね。
■ あるはれたひのこと
ATOK ある晴れた日のこと
Social IME ある晴れた火の粉と
MS-IME ある晴れた日のこと
■ きしゃのきしゃはきしゃできしゃした
ATOK 貴社の記者は汽車で帰社した
Social IME 記者の記者は記者で帰社した
MS-IME 貴社の記者は汽車で帰社した
うーん、Social IMEはちょっと同音異義語に弱いようです。
しかし、別にいつもSocial IMEが馬鹿なわけではない!次の例をごらんあれ。
■ すてきなろまんすしたい
ATOK すてきなロマンス死体
Social IME 素敵なロマンスしたい
MS-IME 素敵なロマンス肢体
ロマンス死体ってどんな死体でしょうねATOKさん?
「ロマンスする」という動詞として解釈したのはSocial IMEだけでした。もちろんロマンス死体という可能性もありますが、ロマンスと死体、もしくは肢体が一緒の文脈に出てくることはそうそうないでしょうから、もうちょっと賢い判断をお願いしたいところです。
仮名漢字変換ソフトウェアは、同音異義語を区別するときにたとえば
「はな」を
「花」と
「鼻」とで区別するとき、もしも後に「がたかい」というように文が続いていれば、「鼻がたかい」と「花がたかい」とで「鼻」の方が自然な日本語だと判断して区別しています。「鼻」と「たかい」はつながりやすいという情報を持っているのです。 ですから、ロマンスと結びつきやすいのは「死・肢体」ではなく「したい」だという情報を入れておけばいいわけです。まぁ、この場合「したい」は一語ではなく、サ変動詞「する」と希望の助動詞「たい」との二語で構成されていますから、話はややこしくなりそうですが。
■ まじょがりすいしんしそう
ATOK 魔女が利水新思想
Social IME 魔女狩りす維新しそう
MS-IME 魔女狩り推進思想
私は「魔女狩り推進思想」のつもりで入力したので、MS-IMEの独り勝ちです。でもATOKの「魔女が利水新思想」でも意味は通じる気がする……。この魔女さんは利水に関してどんなアイディアを思いついたのでしょうか、気になります。
■ くにはこくみんからおさめられたぜいきんでおさめられる
ATOK 国は国民から納められた税金で治められる
Social IME 国は国民から収められた税金で収められる
MS-IME 国は国民から納められた税金で納められる
同音異義語の訳し分け。ATOK、かなり賢いです。文の前の方にでてくる「おさめられる」の主語は「ぜいきん」、後の方に出てくる「おさめられる」の主語は「くに」ということを認識して、「ぜいきん」なら「税金」だから「納められる」、「くに」なら「国」だから「治められる」というように変換しているわけですね。
■ いなばうあー
ATOK イナバウアー
Social IME イナバウアー
MS-IME 否バウアー
■ なかいまさひろ
ATOK 中居正広
Social IME 中居正広
MS-IME 中井正弘
上記のような流行語、有名人の名前などはATOK、Social IMEが強いようです。もちろん日本のどこかには「中井正弘」さんだっていらっしゃるでしょう。ですから、「中井正弘」でもあながち間違いとはいえませんので、MS-IMEを責めることはできませんけれど、多くの人が期待する変換候補としてはやはり、「中居正広」ですね。
■ のびのびた
ATOK のびのび他
Social IME 野比のび太
MS-IME 伸び伸びた
さすがSocial IME……漫画やアニメーションの単語には強いですね。ただ、 ATOKもATOK2008から搭載された「ATOKダイレクト for はてな」等の機能を使えばもっと正しく変換されるかもしれません。「ATOKダイレクト for はてな」とは、インターネット上にある単語をATOKが変換の際に参照してくれる機能です。流行語を変換する際に非常に有益です。
元来、仮名漢字変換ソフトウェアはパソコン内に辞書を持っていて、その辞書を元に変換していました。従って、その辞書では対応できない流行語や新語が時間がたつにつれて増えてゆき、結果翻訳精度が低くなっていました。その問題を解消したのがSocial IMEの辞書共有。それに続いたのがATOKという感じでしょうか。
ちなみに、MS-IMEも定期的に辞書をアップデートして新語に対応しています。たとえば、2008年11月の更新で、少し語彙が増えました。
郵貯銀行 → ゆうちょ銀行
ニコニコ堂が → ニコニコ動画
などが、正しく変換できるようになった模様です。
■ びるしゃなぶつ
ATOK 毘盧遮那仏
Social IME ビ流灼眼のシャナ撃つ
MS-IME びるしゃな物
「毘盧遮那仏」という単語が登録されていたのはATOKだけでした。一般的な日本語の単語に強いのはATOKかもしれません。ただ、確証はありませんが差別用語を変換できないようにしているとの話も聞きますので、わざと変換できないようになっている単語もあるのかもしれません。
Social IMEは「しゃな」を「灼眼のシャナ」と変換していますね。「灼眼」は「しゃくがん」と読むようで、「灼眼のシャナ」は小説のタイトル、「シャナ」はその登場人物です。誰かが登場人物から小説のタイトルへ変換できるように登録したのでしょうが、登録する単語によっては逆に変換精度を下げることにもなりますので、登録するときはよく考えてから登録したほうがいいかもしれませんね。
「びるしゃなぶつ」→「毘盧遮那仏」は私が登録させていただきましたので、今はSocial IMEでも正しく変換できるはずです。こうしていろんな人が登録してゆけば、誤変換も徐々に少なくなっていくのでしょうか。
……
以上です。最後にお詫びですが……
こういう比較をするときは、ソフトウェアをインストールしたばかりの状態に戻してから比較しないと公平な比較とはいえませんが、今回はめんどくさいので私が普段使用している状態でのテストです。そのため、ソフトの実力を過大評価、過小評価しているかもしれません。その辺はご了承くださいませ。
この変換テストに使用したのはATOK2007、Microsoft Office IME 2007、Social IMEの2008年12月25日時点での最新バージョンです。それぞれ、文中ではATOK、MS-IME、Social IMEと表記いたしました。
まとめとして、それぞれのソフトの特徴を表にまとめてみました。
あくまで主観なので参考程度にしかなりませんが……。
|
ATOK |
Social IME |
MS IME |
総合的な使いやすさ |
○ |
○ |
○ |
変換速度 |
◎ |
◎ |
◎ |
安定性 |
○ |
○ |
◎ |
一般的な単語・文 |
◎ |
○ |
◎ |
新語・流行語 |
○ |
◎ |
△ |
同音異義語の識別 |
◎ |
△ |
○ |
利用料 |
有料 |
無料 |
無料※ |
◎ → 文句なし!!
○ → 良い・気にならない。
△ → もう一声!!
文中ではふれませんでしたがMS IMEはOSと同じマイクロソフトが開発しているだけあってOSとの親和性は高いといえましょう。
※OSの値段に含まれているので追加投資はありませんね。ただし、正確にはマイクロソフトが出している仮名漢字変換ソフトウェアにも二種類あって、それは、パソコンに最初からついてくるものと、Microsoft Officeを買ったときについてくるものです。後者の方が高機能です。もちろん最初からMicrosoft Officeが入ったパソコンを買えば、後者がついてきます。
PR