http://lxr.mozilla.org/mozilla/source/mailnews/extensions/bayesian-spam-filter/src/nsBayesianFilter.cpp#90
Thunderbirdの組み込みの閾値は.99みたいです?
設定で上書きされているのでしょうか。
Subject欄をMIMEデコードしてからトークン分割する手法は意外と良さそうです。ヘッダのトークン分割は本文のトークン分割とほとんど同じコードなのでまとめられるような気が。
ベイジアンフィルタ関連はソースコードがまだ混沌としているので非常に「読みにくい」ですが「やりやすい」です。適当にパッチをあてても許される気がする。
フィルタとして最も理想的なのは、単にユーザーは何も考えずに「これはいる」「これはいらない」と選択するだけで、完全に判別してくれることだと思います。ユーザーが細かい設定をして判別確率を上げるのであれば、最初からフィルタ定義を細かく作ればよいわけで……。
Enigmailが使えないのはgccでビルドしているからだと思われます。
私もやってみましたが、モジュールがロードされないとか言われて動きませんでした。本当はVC++6でビルドしたいのだけれども。.NETは持ってないし。MFCを使っていないのであれば2003 Toolkit + Platform SDKでいけるような気もするけどねー。
そもそも、gccにしてもルートのhomeにリパースポイントを設定してやらないとビルドできないのは何かおかしいと思うんだけど。