> 言語ごとにトレーニングファイルを変える方が楽な気がしますね。
> いろいろと。
そうですね。
ただ日本語の処理を深く組み込むと英語圏での性能(速度・分類・可読性)に影響を与えること必至なので、なかなか簡単に提案できないところがあります。大多数のユーザには必要のないものでしょうし。
全体的に絶対的な性能が向上することが示せればいいんですけど。
言語毎に単語の重みづけがうまく出来れば良いのかも……。
しかし人間が判別するときだって言語が違えば別脳で判別しているだろうし、やっぱり辞書を分けるのは正当な手段なのか。
ううむ、ううむ。