スパムフィルタの概要

　「フィルタリング機能の仕組みはどうであれ、とりあえず使ってみたい」という場合はこのページを読み飛ばして、次の「フィルタリング機能の基本設定」をお読み下さり、設定を行って下さい。

●当フィルタで用いている二つの方式について

　当プラグインにおけるスパムフィルタリングでは「ブラックリスト参照方式」と「ベイジアンフィルタ方式」を併用しています。

　それらの方式の併用に関しては下図のような流れになっています。

　すなわち、届いたメールはまず、共有化している「ブラックリスト参照方式」のデータベースに基づいてspam判定を行います。そこでspamと判定された場合にはspamであることを「確定」して、spam用メールフォルダに振り分けると同時に、そのメールをベイジアンフィルタ方式用データベースでの学習に自動利用します（これを自動学習と呼びます）。

　共有化している「ブラックリスト参照方式」のデータベースでspamと判定されなかった場合には、ユーザが個別に持っているベイジアンフィルタ方式用のデータベースを用いて、そのメールに対してベイズ理論に基づくspam判定を行います。一定の確率でspamである可能性が高いとされた場合にspamだと「確定」し、やはりspam用メールフォルダに振り分けます。

●二つの方式の比較

	ブラックリスト参照方式	ベイジアンフィルタ方式
ユーザの利用方法	spam登録	spam学習
利用するもの	IPアドレス	メール内容（ヘッダ含む）に出現する単語
利用結果	ユーザ間で共有化するデータベースに反映	ユーザ個々で利用するデータベースのみに反映
当プラグインで対象とするメール	メール言語に関係なし	日本語、英語
一般的な関係キーワード	DNSBL、ORBS、サーバのブラックリスト、オープンリレー(Open Relay)、オープンプロキシー(Open Proxy)	ベイズ理論、ベイジアンフィルタ

●ベイジアンフィルタで使用している二つの指標

　ベイジアンフィルタでは「spamらしさ」と「真っ当なメールらしさ」の二つを利用して、新しく届いたメールの「spamである確率」を出して判断しています。「spamらしさ」も「真っ当なメールらしさ」も、それぞれ、それまでに蓄積された「spam」と「真っ当なメール」から学習した結果に基づきます。
　この時、spamから「spamらしさ」のデータベースを構築することを「spam学習」、「真っ当なメール」から「真っ当なメールらしさ」のデータベースを構築することを「clean学習」と呼んでいます。

●フィルタリング結果のメールヘッダへの付与

　当プラグインではメールヘッダに判定結果や判定理由を書き加えるようになっています。

メール受信時判定結果
X-BkASPil-Result: none	通常時
X-BkASPil-Result: spam	spam判定時
X-BkASPil-Result: white	IPアドレス、メアドなどがホワイトリストにあった場合
判定理由追加ヘッダー
X-BkASPil-Comment: MISHOUDAKU	未承諾広告判定時
X-BkASPil-BLIP: IPアドレス	ブラックリスト参照方式によるspam判定
X-BkASPil-BayesResult:１以下の数字	ベイジアンヒット時の計算値
その他
X-BkASPil-Learn: spam	ベイジアンフィルタのspam学習実施済
X-BkASPil-Learn: clean	ベイジアンフィルタのclean学習実施済
X-BkASPil-Comment: MANUAL	判定の訂正後
X-BkASPil-TLD:	TDL拒否時に付記

●ベイジアンフィルタについて

　当サイトがベイジアンフィルタを導入するに当たっては以下のサイトなどにお世話になりました。

池上大介氏の「ベイジアンフィルタについて」
　http://www.tom.comm.waseda.ac.jp/~ike/column/0006.html
増井俊之氏の「界面駭客日記(31) - SPAM退治」
　http://pitecan.com/ASCII/diary0306.html
Shiro Kawai氏訳「スパムへの対策」「ベイジアンフィルタの改善」
　http://www.shiro.dreamhost.com/scheme/trans/spam-j.html
　http://www.shiro.dreamhost.com/scheme/trans/better-j.html

目次へ

このページの最新版をオンラインで見る（画像付き）

←前の頁へ

→次の頁へ