spam.txt

48aed41a anonymous 2015-05-16 07:52
最近スパム増えてるのにこのスレ保持してるノード少ない・・・
書き込めば新着に出るかな?
81ecf3bb anonymous 2015-05-16 10:50
>>48aed41a
名前で勘違いしてる人が多いのかもね。
03baef9e anonymous 2015-05-18 09:56
最近追加したヤツ

((href://).*){5}
db9629fc anonymous 2015-05-18 10:03
href://だけでもいい気がする。
a11ccbcb anonymous 2015-05-21 18:24
既出を参考にWikipediaのUnicode一覧を睨みつつ作成

# URL
((https?|href)://.+){8}

# メアドあり + 本文にURL (順序違い)
<>body:.*https?://.+<>mail:.+@.+\..+
<>mail:.+@.+\..+<>body:.*https?://.+

# ハングル4文字
([\u1100-\u11FF]|[\u3130-\u318F]|[\uA960-\uA97F]|[\uAC00-\uD7AF]|[\uD7B0-\uD7FF]){4}

# 漢字(CJK)10文字
([\u2E80-\u2FFF]|[\u31C0-\u31EF]|[\u3200-\u9FFF]|[\uF900-\uFAFF]|[\uFE30-\uFE4F]|[\U00020000-\U0002FA1F]){10}

# キリール4文字
([\u0400-\u04FF]|[\u0500-\u058F]|[\u2DE0-\u2DFF]|[\uA640-\uA69F]){4}
9c69384c 新月 朔 uJ6Gb6eSUHi 2015-05-22 00:42
>>a11ccbcb
URLのやつは一つでもヒットしない?
d35ffe29 a11ccbcb 2015-05-22 04:20
>>9c69384c
$ python
>>> import re
>>> re.search("((https?|href)://.+){8}", "http://www.shingetsu.info/")
>>>  # 戻り値はNone
8つ以上ない場合はヒットしないよ
その下のメルアド付きのことならば 1つでも(https?)があればスパムと判定してる
96321149 anonymous 2015-05-26 12:45
# 平仮名/片仮名を含まない
^[^\u3040-\u30FF\u31F0-\u31FF]*$
fad1a1c1 anonymous 2015-05-27 10:23
ひらがながなく、かつhttpがあるのをハジく。
<>body:[^あ-ん]+href\=\"http.+$
<>body:[^あ-ん]+http.+
ebc74ad6 anonymous 2015-05-28 01:19
>>fad1a1c1
お、それ使わせてもらいます。
9ae81a4a anonymous 2015-10-11 07:24
画像に対して
<>suffix:(jp|gif|png|bmp)を使ってるけど、今の新月の使われ方だと、
<>attachで添付ファイル付きレス全部消しても問題なさそうですね
69fc4ca5 anonymous 2015-10-11 15:10
#悪口、暴言を削除
<>body:baka|aho|etc...

ブロックする文字列は各自の判断で
cf373f12 anonymous 2015-10-11 19:28
>>69fc4ca5
それは意図した通りに動かないよ
<>body:.*(baka|aho|etc...)
5a971012 anonymous 2015-11-07 17:42
gouのspam.txtは初期設定のままでもしっかり弾けてるね
78c10fc6 anonymous 2015-11-07 17:44
>>5a971012
wiki全部コピっただけなので、ちょっと厳しすぎる。メアド欄になんか書いてるだけでNG.
4ba79cbf anonymous 2015-11-23 23:51
Wikiのこのフィルタ、結構誤検出があるね。

[^(\>|\:|>)]\ http

http://shingetsu.info/wiki/?%E3%82%B9%E3%83%91%E3%83%A0%E3%83%95%E3%82%A3%E3%83%AB%E3%82%BF%E5%80%89%E5%BA%AB

最近では次のレスが引っかかった。

[[新月質問スレ/14709f24]]
[[合テスト用/ba21ca54]]
[[合テスト用/54aae0a2]]

f6c94d88 anonymous 2016-10-12 13:13
最近スパムフィルタ突破される事が増えてきた
あまりにも多い様なら一旦非公開にしよう
c5bf66e0 anonymous 2016-10-12 13:43
>>f6c94d88
非公開にしても他のnodeが素通しなら意味ないだろ
3d7c2d12 anonymous 2016-10-12 14:05
>>c5bf66e0
スパムだらけの状態で公開するの恥ずかしくない?
5ac22c84 anonymous 2016-10-12 14:23
>>3d7c2d12
ならspamフィルタでどーにかすればいいんじゃね
648f105e anonymous 2016-10-15 13:52
>>5ac22c84
sakuとgouに同じフィルタを入れて取得し直すと、sakuでは完璧に弾けたけどgouではスパムまみれになった
言語による正規表現の違いだろうか、とりあえずsakuに移行
9471dad5 anonymous 2016-11-09 23:28
一回スレの内容取得しちゃった場合は、
後からspam.txtに追加しても常にレス内容は残ったまま?

ようはすでに取得しちゃったスパムを非表示にしたいんだけど
# 削除して再取得だと昔のレスが取得できなくなりそうだから避けたい
f204f6f3 anonymous 2017-02-08 00:33
メールアドレス欄に何か入ってたら弾くっていうだけで、twitter からの引用無差別投稿みたいな標的型スパム以外は弾けるな

Top of this page. | Archive | Mobile

limit: 1536KB

(spam.txt/23/0.0MB)

Powered by shinGETsu.