増え続けるスパムブログの現状は ライブドアが検索に新技術、9割排除 - ITmedia News
ライブドアは10月10日、「livedoorブログ検索」に、検索結果にスパムブログを表示しない技術を実装した。スパムブログを自動判定する技術を新開発。従来、検索結果の半分ほどスパムだったが、新技術でスパムの約9割が表示されなくなったという。
素晴らしいですね。API経由で使えるようにしてもらえると、すぐにでもBlogPeopleで採用しますので是非お願いします。
BlogPeopleのブログ検索でもスパムブログは極力排除するように日々努力しているのですが、スパムのパターンが変わるんでどうしても後追いになっちゃうんですよねえ。
同社エンジニアの山下拓也さんによると、「日々新しいパターンのスパムブログが出てくる」という。スパムが検索結果に表示されなくなれば、スパムブログを通じてアフィリエイトで稼ごうとするユーザーが減り、スパムブログ自体も減っていくと期待する。
減るといいなあ。一生懸命サイト作っても検索で引っかからない、トラックバック送ってもフィルタで弾かれる、という状況になればサイトつくってもアクセスされなくなるのでやっている意味がなくなりますからね。
で、その通りだなあ、と思ったコメントがこれです。
山下さんによると「人が見てもスパムかどうか判定しづらいスパムブログが増えている」という。ニュースをコピーし、語尾を関西弁風に変えているというスパム記事もある。コピー元との類似性を下げることで、スパムフィルターに引っかかりにくくしているというわけだ。「日々新しいパターンのスパムブログが出てくるが、そのパターンはシステムでは判別できず、人間の力に頼るしかない」
BlogPeopleでもフィルタを通り抜けた記事を見てると、どうみても普通の記事にしか見えないんだけど、サイトにアクセスしてその前後の記事を見て初めてそれがスパムブログであることがわかるなど、人間が見てもよくわかんないようなものが増えてきているのでとてもたいへんです。
ということで、サービス提供者も各社それぞれがんばっているので、応援してあげてください。みんなでよりよいブログの世界を作っていきましょう。


