5ちゃんねる ★スマホ版★ ■掲示板に戻る■ 全部 1- 最新50  

■ このスレッドは過去ログ倉庫に格納されています

【ベイズ】POPFileを語ろう 3蛸目【spamフィルタ】

1 :名無しさん@お腹いっぱい。:2005/05/11(水) 14:11:11 ID:/YU0b2ii
POPFile はベイズ推定を利用した自動メール振り分けツールです。一旦、設定とトレーニングが
きちんとされれば、あなたのパソコンのバックグラウンドで動き続け、到着したメールを読み取って、
好きなように振り分けてくれます。

POPFileドキュメンテーション(日本語)
   http://popfile.sourceforge.net/manual/jp/manual.html
POPFileフォーラム(日本語)
   http://sourceforge.jp/projects/popfile/forums/
POPFileDocumentationProject(JP HowTos/日本)(Wiki形式)…特定のメールクライアントの設定あり
   http://popfile.sourceforge.net/cgi-bin/wiki.pl?JP_HowTos

過去スレ
【ベイズ】POPFileを語ろう 3蛸目【spamフィルタ】
   http://pc8.2ch.net/test/read.cgi/software/1083650039/l50

関連 >>2-10 ぐらい

2 :名無しさん@お腹いっぱい。:2005/05/11(水) 14:11:31 ID:/YU0b2ii
POPFile本家
   http://popfile.sourceforge.net/
POPFileダウンロード
   http://sourceforge.net/projects/popfile/
POPFileDocumentationProject(Wiki形式)
   http://popfile.sourceforge.net/cgi-bin/wiki.pl?POPFileDocumentationProject

POPFile の日本語化ページ
   http://popfile.sourceforge.jp/index.php
   ただしPOPFile は 0.21.0 より、言語を Nihongo に設定すれば日本語のメールを正しく分類できる
   ようになりました。0.20.1 まで必要だった日本語化パッチをあてる必要はありません。

3 :名無しさん@お腹いっぱい。:2005/05/11(水) 14:12:28 ID:/YU0b2ii
関連スレ
【スパムフィルタ】SPAM対策ソフト総合スレッド
http://pc8.2ch.net/test/read.cgi/software/1099817307/l50

4 :名無しさん@お腹いっぱい。:2005/05/11(水) 15:53:19 ID:BDydahSp
EdMAX(free)+AVG7
導入記念カキコ

トレーニング楽しい

5 :名無しさん@お腹いっぱい。:2005/05/11(水) 16:09:06 ID:167onXKi
そのうち賢くなって学習不要になる。
そしてたまーに間違えると逆に嬉しい。
よーし、学習だー、って感じで。

6 :名無しさん@お腹いっぱい。:2005/05/11(水) 17:43:56 ID:XeESNsQ2
いつのまにか刺さってて悲しい気持ちになる。

7 :名無しさん@お腹いっぱい。:2005/05/11(水) 18:32:04 ID:ozHfT5Vo
仕事でbsfilterを評価することになったので、
POPFileとは一時お別れだ。自宅サーバーで動いている
設定を止めて、bsfilterを動かさねば。さぁて、どっちが
使えるかな?



8 :名無しさん@お腹いっぱい。:2005/05/11(水) 19:03:25 ID:ss0XoFaZ
>1乙

立ったばかりで悪いがテンプレ煽り文の修正キボン
>あなたのパソコンのバックグラウンドで動き続け、
偶に固まったり知らんうちに落ちてたりするから「動き続け」はどうかと思う

>好きなように振り分けてくれます
これ自体に振り分け機能は無いから誤解を招く表現はよした方が

9 :名無しさん@お腹いっぱい。:2005/05/11(水) 19:43:31 ID:FeuCdMyw
> >好きなように振り分けてくれます
> これ自体に振り分け機能は無いから誤解を招く表現はよした方が
ソフト内部で学習内容に沿って振り分けてるから 印がつくんだろ?
メールソフト内部での振り分けとは意味が違うけど振り分けてるには変わりない

10 :名無しさん@お腹いっぱい。:2005/05/11(水) 19:45:07 ID:FeuCdMyw
> >あなたのパソコンのバックグラウンドで動き続け、
> 偶に固まったり知らんうちに落ちてたりするから「動き続け」はどうかと思う
とまるのが意図した動作じゃない以上 「動き続け」でいいとおもう

11 :名無しさん@お腹いっぱい。:2005/05/12(木) 01:36:44 ID:WzXi9Goh
>>1
POPFile ドキュメンテーション(日本語)のリンク先は旧バージョンの
マニュアルなので、
POPFile ドキュメンテーションプロジェクト(日本語)
http://popfile.sourceforge.net/cgi-bin/wiki.pl?JP_POPFileDocumentationProject
へのリンクにしてほしい。
ちなみに、>>2のPOPFileの日本語化ページにアクセスすると上記の
ページに飛ぶようになっている。

12 :名無しさん@お腹いっぱい。:2005/05/12(木) 10:43:28 ID:qcP1e7nm
>>11


13 :名無しさん@お腹いっぱい。:2005/05/12(木) 12:32:20 ID:dONPpTmU
Windows環境でバックエンドをMySQLに変えれた人います?
なんだかうまくいかんです…。

14 :名無しさん@お腹いっぱい。:2005/05/13(金) 21:01:02 ID:C9b9KPwK
POPFile: JP HowTos/Avast
http://popfile.sourceforge.net/cgi-bin/wiki.pl?JP_HowTos/Avast

これ、なんかすげぇ遠回りしてるような・・・
127.0.0.1:110:loginname#popserver
とすればavast.iniはいじらなくていいんじゃないの?
間違ってたらごめんね。

15 :名無しさん@お腹いっぱい。:2005/05/29(日) 07:24:47 ID:Zd1YCK/+
受信メールのPOP3アドレスがプロバイダーbiglobeの場合は
このアプリは使えないのでしょうか?Yahooの場合
は受信が出来るのですが…。


16 :名無しさん@お腹いっぱい。:2005/05/29(日) 12:38:12 ID:xnp72ZiV
>15
プロバイダには依存しない、つまり関係なく使えるはず。
動かないなら設定ミスだろうな。

17 :名無しさん@お腹いっぱい。:2005/05/29(日) 15:03:34 ID:Zd1YCK/+
>>16
じゃ、もう一度、見直したいと思います。


18 :名無しさん@お腹いっぱい。:2005/05/30(月) 09:22:41 ID:UuZQV0Bh
なんか見逃しが増えたような感じなので、コーパスのリセットをしたいのですが、
どうやればいいのでしょうか。

19 :名無しさん@お腹いっぱい。:2005/05/30(月) 15:44:02 ID:1unfnoI1
バケツ削除でいいんじゃね?

20 :名無しさん@お腹いっぱい。:2005/05/30(月) 20:38:59 ID:6dhqkWV6
>>19
削除して作り直してみました。鍛えなおします、はい。

21 :名無しさん@お腹いっぱい。:2005/05/31(火) 08:55:03 ID:9PsaRfyE
スタートメニューからは起動しますがタスクのをUIをクリックすると
アプリケーションがみつかりません。となってしまいます。
どう設定すればいいのでしょうか?
いちいちスタートメニューからはめんどいのでお願いします。

22 :名無しさん@お腹いっぱい。:2005/06/03(金) 02:42:33 ID:1Ei86pTM
kakasi で分割された全ての単語が
コーパスの要素になってるわけじゃなさそうだけど
どうやってコーパスの要素(固有単語)が選別されるの?
日本語版 POPFile のコーパス生成に詳しい URL とかありますか?

23 :名無しさん@お腹いっぱい。:2005/06/22(水) 14:24:07 ID:C9OEzDz/0
0.22.2 用日本語パッチクロスプラットフォーム版使ってる人いますか?
linuxに入れたんだが、激しく精度が悪くなった希ガス

24 :名無しさん@お腹いっぱい。:2005/06/26(日) 17:23:59 ID:Q2eaxM2h0
みんな Outclass って使ってる??

25 :名無しさん@お腹いっぱい。:2005/06/26(日) 17:24:43 ID:/ivk4D5T0
うにゃ、つかってへん。
メインのメーラー、鶴亀だし。

26 :名無しさん@お腹いっぱい。:2005/06/29(水) 13:54:19 ID:+q0CxZnA0
もはや空気みたいな存在。

たまにサービスが死んで酸欠になってあわてるけど。

27 :名無しさん@お腹いっぱい。:2005/06/30(木) 10:17:39 ID:XdY0qm3t0
会社のメールサーバーがIMAP対応になったので、
POPFileもIMAPモジュールを使いはじめた。

もっと、空気みたいな存在。POP-Proxyで使っていると
POPFileが死んだ場合、新規メールがGet出来ないが、
(POPFileを再起動したり、メーラーの設定を変えれば
 良いだけですけど。)
IMAP版は生きていようが死んでいようが関係なし。
0.22.2版のServiceディレクトリにIMAP.pmが入っている
ので、設定すれば使える。

28 :名無しさん@お腹いっぱい。:2005/06/30(木) 11:51:57 ID:KnZj2raB0
POPFileのIMAP機能だけでいいんだよなぁ
realに分別されたメールがそのままINBOXに残るようにできないかな

29 :名無しさん@お腹いっぱい。:2005/07/02(土) 22:24:14 ID:RzmLCwwh0
すみません、教えてください。
インストールして、ちゃんとメーラー(Outlook Express)の受信フォルダでタイトルの頭に分類名がつくようになったんだけど、
一度Windows終了して、次にメーラー起動したら何故かIDとパスワードを求められて、さっきと同じもの入れてるのに通らない。
もちろんPOPFileは起動してある。
原因わかりますか?

30 :名無しさん@お腹いっぱい。:2005/07/02(土) 22:40:35 ID:Jqoh6dpw0
わかりません。


貴方の書き込みが。(´・ω・`)

31 :名無しさん@お腹いっぱい。:2005/07/02(土) 22:44:34 ID:RzmLCwwh0
メーラー起動したときに求められたのは、サーバーが127.0.0.1で、それのユーザー名とパスワードです。
ユーザー名はもともとのサーバー名とユーザー名をコロンで区切るやつです。

32 :名無しさん@お腹いっぱい。:2005/07/03(日) 00:10:41 ID:raAgmAFM0
>>29
POPFileコントロールセンターの「バケツ」・「サマリー」・「件名の変更」
がONになっていると件名にunclassified等が付加される。

33 :名無しさん@お腹いっぱい。:2005/07/03(日) 03:34:52 ID:CmKyn9dC0
>>31
29の「さっき」って何のことか判らないけど、
元のサーバー名とパスワードでは繋げるの?


34 :名無しさん@お腹いっぱい。:2005/07/03(日) 13:04:21 ID:rgGlEGed0
元の、POPFileをインストールする前の設定に戻してみると、普通に繋げました。
「さっき」というのは、POPFileをインストールして、自動でメーラーの設定を変えることができたのですが、
そのとき変わった後の設定です。そのときは普通に動作したのですが…。

35 :34:2005/07/03(日) 13:05:04 ID:rgGlEGed0
すみません、31=34です

36 :名無しさん@お腹いっぱい。:2005/07/03(日) 16:48:25 ID:03mLYu0I0
>>34
>元の 前の 普通に 「さっき」 自動で そのとき そのときは普通に
他人の気持ちになって書きなさい。あるいは、書くな。むしろ帰れ。

37 :34:2005/07/04(月) 07:27:13 ID:T19v5Dto0
すみません、前後の文の繋がりでわかるかなと思ったのですが、曖昧すぎました・・。

38 :名無しさん@お腹いっぱい。:2005/07/05(火) 05:09:32 ID:iaYyTAcf0
>>29
SSL導入後に送信でコケてちょっと悩んだ事があったんだが、
それみたいなもんか?

ダイアログに本来の(POPFile導入以前の)
アカウントとパスワードを入れてみよう。

39 :名無しさん@お腹いっぱい。:2005/07/05(火) 11:24:09 ID:cADPl+qQ0
よくわかんないタイミングだが紹介記事が出てる
ttp://bb.watch.impress.co.jp/cda/shimizu/10217.html

40 :名無しさん@お腹いっぱい。:2005/07/05(火) 12:57:44 ID:U+ggMvWW0
>>39
まぁ通り一遍の無難な記事ですな。
最後に清水理史の顔写真が載っていますが、あれがオチですか?

41 :名無しさん@お腹いっぱい。:2005/07/05(火) 21:20:25 ID:bD4hFr0Q0
nPOP+POPFileで利用しているのですが、
nPOPで巡回する度に、同じメールがPOPFileのメッセージ履歴に残ってしまいます。
何か対応策ありませんでしょうか?

42 :名無しさん@お腹いっぱい。:2005/07/06(水) 06:03:51 ID:icPDZwpf0
直近のメールが何度もメッセージ履歴に入ってしまうのです。

43 :名無しさん@お腹いっぱい。:2005/07/06(水) 23:56:46 ID:7+9S6nLh0
>>42
あー、わかった
サーバーがTOPコマンドに対応していないんだろう。
nPOPはTOPが使えないとRETRしてヘッダを確認する。
サーバーには優しくないがユーザーから見た動作を同じにしようとしているのだろう。

RETRってのは受信コマンドだからな。
どうしようもないな。


44 :41:2005/07/07(木) 00:07:57 ID:LhWgLe2B0
>>43

ありがとうございます。
これは仕様上どうしようもないということなのですね。
nPOP+POPFileってすごく便利な構成なので、
設定で克服している人がいるのかと思い書き込んだ次第です。

nPOPで巡回させて、POPFileのUIで分類を確認した後、
MS Outlookで受信させて、POPFileが付けたヘッダでフォルダにふるい分けして使っているのです。

nPOP以外のビューアーを使っても、直近のメールが何度も履歴に入ってしまうという現象は回避できないのでしょうね。
もし、別のビューアーを使って、回避できている方がいらっしゃいましたら、お願いします。


45 :名無しさん@お腹いっぱい。:2005/07/07(木) 04:21:35 ID:M3Q3i9YE0
MS Outlookで受信させる直前でPOPFile通しゃいいんじゃないの?

そういえば過去スレにnPOPの話題があったような。
nPOPだと鯖上メールのヘッダをフィルタリングして削除できるので
SpamをPCに受信させずに捨ててしまえるとか何とか。
それ読んでnPOPにPOPFileかますのはあまり意味がないのかと思ってたけど

46 :名無しさん@お腹いっぱい。:2005/07/07(木) 14:09:22 ID:Ra4ZMrG90
POPTrayでできてた気がする。
いまWin使ってないんで記憶モードだが。

47 :名無しさん@お腹いっぱい。:2005/07/09(土) 00:51:54 ID:T7vJFT0j0
>>44
そういう使い方だとサーバーがTOP対応していてもnPOPが同じメールを何回でも受信してしまう可能性がある。
Outlook受信したときサーバーにメールを一部だけ残す?
これが当たっている場合、nPOPの代りに他のメールソフトなら大丈夫な可能性が非常に高い。

nPOPでなくてもサーバーにメールを残しておけるメールソフトなら何でもいい筈だ。
いっそのことOutlookにもうひとつ受信確認用アカウント作って使えば?

しかし、そんな使い方する理由がサッパリ判らん。
単にOutlook上で分類狂ってたメールを正しいフォルダに移動するほうが手間が少ないと思うのだが、

>>45
なんで?
spamを自動判別して捨ててくれるわけでもないだろう。


48 :名無しさん@お腹いっぱい。:2005/07/09(土) 09:37:20 ID:SWVFc8TM0
>>44
無理にnPOPを使う必要がないなら、
「メールをダウンロードしてもサーバから消さない」
「一度ダウンロードしたメールはサーバーに残ってても無視する」
という機能のあるメーラを導入して
(1)そのメーラで受信する
(2)PopFile UI で分類
(3)Outlookで受信して読む
とかすればよさそう。
Outlookにその機能があるなら、
(1)の受信用のアカウントを一個増やせばいい。

49 :名無しさん@お腹いっぱい。:2005/07/10(日) 19:13:48 ID:r3ie15BT0
41(44)氏が nPOPで何したいのかいまいちよく判って無いけど、

> nPOPで巡回させて、POPFileのUIで分類を確認した後、
って書いてるから、
「POPFile経由でnPOPを使って巡回」している限り、履歴が残るのは当たり前なのでは?
とか思ったりする。

それより
> MS Outlookで受信させて、POPFileが付けたヘッダでフォルダにふるい分けして使っているのです。
ってやるぐらいなら、同じ確認するのでも、
nPOPで巡回して確認しないで、Outlookで受信して確認でも手間変わらん気がするけど。
nPOPでいらないメールを削除してるってこと?

それなら巡回した時にいらないのは削除してて、
いるのは Outlookで受信させればいいだけだから、
nPOPの巡回で何回も同じメールの履歴が残るのは変だけど。

ソフトや設定うんぬんより、運用見直した方が良くないかなぁ。
nPOP使う目的は何だろう?


50 :名無しさん@お腹いっぱい。:2005/07/13(水) 10:30:18 ID:p/GXpNiC0
nPOP+POPFileってすごく便利な構成なのかな?
試してみるか。

51 :名無し募集中。。。:2005/07/23(土) 21:23:42 ID:wwrKfvR90
これ使うのと、メールソフトのフィルタリングを使って
正規表現で振り分けるのと、どっちが効率が良いの
楽しさはこっちの方が上だと思うけど。


52 :名無しさん@お腹いっぱい。:2005/07/24(日) 14:21:30 ID:moz4h3tY0
>>51
楽しさに勝るものはないっしょ。
スパ無業者なんかのためにわざわざ時間割いてコーディングなんて、俺はしたくないね。

53 :名無しさん@お腹いっぱい。:2005/07/24(日) 17:42:43 ID:0d50mSOA0
概ね同意だがメーラーの振分け設定のことをコーディングと呼ぶヤシ始めて見た
あと「楽しい」じゃなくて「楽」だと思う。

54 :名無しさん@お腹いっぱい。:2005/07/24(日) 20:21:35 ID:DLzOvIHp0
途中から、存在自体忘れてしまいそうなくらい、何もしなくなるからな。

55 :名無しさん@お腹いっぱい。:2005/07/25(月) 07:32:38 ID:ZCeRr+mp0
>>53
正表現はコードだからコーディングでいいと思うぞ。
楽には同意。

56 :名無しさん@お腹いっぱい。:2005/07/26(火) 19:44:46 ID:53su1gSQ0
POP FILEを入れて,3日目です。
まだトレーニングの真っ最中ですが,動作が非常に遅いのが気になります。

導入前は,例えば30件のメールを一度に受信するとき,約10秒〜20秒ぐらいで受信して
いましたが,導入後は1分以上かかります。こんなものなのでしょうか。

それともどこか設定が間違っているのでしょうか?

メーラーはベッキーです。ウイルスバスター使用。一応マニュアルどおり設定したつもり。

57 :名無しさん@お腹いっぱい。:2005/07/26(火) 20:47:32 ID:kG1ghylJ0
>>56
そんなものだと思う。

百通以上のメールをインクすると、煙草吸いに行って戻ってきても
余裕で受信中ですもの。

perl で処理している以上、限界なのかな。

58 :56:2005/07/27(水) 19:13:31 ID:ItysHXGJ0
>>57
どうもです。

ちょっときついですね,この早さじゃ……。
さっき家に戻って40件くらい受信しましたが,う〜ん……。


59 :名無しさん@お腹いっぱい。:2005/07/27(水) 21:31:17 ID:d6EznIss0
>>57-58
ウィルス駆除ソフトが入ってると、カナーリ遅くなる。
POP3→POPFile→メール受信ソフト
    ↑     ↑
   2箇所でウィルス駆除ソフトがチョッカイかける。

それと、PCのスペックにもよるんじゃね?
Pen4 3.2Gだと、ウィルス駆除ソフトが入ってても
200通以上受信でタバコ吸ってる間に終わったぞ。

60 :名無しさん@お腹いっぱい。:2005/07/27(水) 21:36:35 ID:fQFg6R/O0
>>56
> POP FILEを入れて,3日目です。
> まだトレーニングの真っ最中ですが,動作が非常に遅いのが気になります。
> 導入前は,例えば30件のメールを一度に受信するとき,約10秒〜20秒ぐらいで受信して
> いましたが,導入後は1分以上かかります。こんなものなのでしょうか。
> それともどこか設定が間違っているのでしょうか?
> メーラーはベッキーです。ウイルスバスター使用。一応マニュアルどおり設定したつもり。

俺の環境では、30件程度であればものの10秒前後だよ。
セレロンM 1.3GHz
メモリ1GB

61 :名無しさん@お腹いっぱい。:2005/07/27(水) 21:38:44 ID:Iu7kHB5W0
ファイルが添付されてたりすると、たまんないっす
数MBの画像ファイルくっついてると、止まったようになる

62 :名無しさん@お腹いっぱい。:2005/07/27(水) 22:02:15 ID:DMTqsHP90
ちなみにウィルス除去ソフトは何使ってるの?

63 :名無しさん@お腹いっぱい。:2005/07/27(水) 23:07:25 ID:9eWYhAeH0
>>61
アレはきついよね。プレゼンのファイル受信したりするともう

で、漏れはメーラで数百kB以上のメールは受信しない設定にしておき、
落ちたメールがあったらpopfile介さない別アカウントで
受信し直すようにしてます。
処理が可能なら、添付ファイルの有無で分けるのも良いかもね
(添付ファイル付きのspamというのもあるので漏れは避けましたが)

64 :名無しさん@お腹いっぱい。:2005/07/28(木) 00:12:48 ID:GeYfmCiE0
そういうの送ってくる相手ってある程度絞れるだろうから、
マグネットでPOPFileスルーさせちゃえばいいんと違う?

65 :名無しさん@お腹いっぱい。:2005/07/31(日) 20:16:10 ID:fA9aK8yX0
そだね。仕事相手とか決まっているなら、
ドメインかメルアド指定してマグネットという手もあるね。

マグネットで決め打ちすると受信がどのくらい速くなるのかが
実験してないので不明ですが‥‥

66 :名無しさん@お腹いっぱい。:2005/07/31(日) 20:25:44 ID:fA9aK8yX0
2Mほどのファイルを添付して実験してみた
popfileの存在を意識させない速さになりました。

確実に添付ファイルのやりとりをする相手とはこれでいけそうですね

67 :名無しさん@お腹いっぱい。:2005/08/19(金) 02:18:28 ID:telN9xGJ0
今日インストールしてみた
まだ使い方が理解できてないのだがw

基本的にspamをバケツに入れるとき、件名を変更して
メーラーで件名に[spam]が入ってるものを適当なフォルダに移動するか
削除するかするってことでOK?

68 :名無しさん@お腹いっぱい。:2005/08/19(金) 02:39:15 ID:Re94E1ke0
メールヘッダに
X-Text-Classification: spam
が追加されるから、それで振り分け。

69 :名無しさん@お腹いっぱい。:2005/08/19(金) 03:24:19 ID:9bJPqKcP0
>>67
最初のうちは学習させるのも重要。
X-Text-Classification: unclassified なメールがあったら
ちゃんと spam かその他のバケツかにPOPFile Uiで振り分けておく。
まちがった振り分けされたときもPOPFile Uiで振り分けしなおす。
1週間もすると振り分けなおしもいらないくらい精度が上がると思うけど。

70 :67:2005/08/19(金) 13:36:06 ID:saTgLljr0
どうもありがとうございます。

OEはヘッダの内容で振り分けられないようなので、
件名で振り分けるルールを設定しました。

71 :名無しさん@お腹いっぱい。:2005/08/19(金) 20:04:46 ID:MTBGO2el0
まずOE使うのをやめれ

21 KB
■ このスレッドは過去ログ倉庫に格納されています

★スマホ版★ 掲示板に戻る 全部 前100 次100 最新50

read.cgi ver 05.04.02 2018/11/22 Walang Kapalit ★
FOX ★ DSO(Dynamic Shared Object)