検索エンジンへのスパム被害と、その対策
この上の記事を書いている間にも2件トラックバックスパムがあった。記事を書き終えてすぐのトラックバックは「お、もう反応が?」と期待しているので、反動が大きい。簡単に言うと、「スパマー死ね」って感じだ。
スパムブログに汚される検索結果
スパムブログというのはSEO(検索エンジン最適化対策)をバッチリやっているので、ページランクが高い。しかも大量のキーワードをこれでもかと満載しているので、検索結果に当然ひっかかることになる。つまり、お前ら全員がスパムの被害を毎日受けているのだ。
ページランクが高くなりがちな「はてなダイアリー」でのスパム行為
はてなダイアリーには「自動トラックバック」「自動キーワードリンク」などの「繋がり」を作る機能が充実しており、これがページランクが高くつく原因となっている。ほぼ100%が転載・引用で、コメントはせいぜい一言の「コピペブログ」の代表のような、中身皆無の「Webアプリを作ろう」ですら、ページランク4なのだ。このようなスパムブログがどれだけ検索結果を汚し、どれだけの人間に被害を与えていることか。
ホワイトリストによるスパムブログ対策
このようなスパムブログに対し、「ホワイトリスト」を作って対抗しようというのが「ぽぷる」というプロジェクトだ。
このホワイトリストは、ノイズだらけのブログ検索エンジンやブログアグリゲーションサイトの状況を改善するために取り組んでいるプロジェクトで、河野とその協力者によって運営されています。運営っていうか、みんなでちまちまと登録しています。
とりあえずホワイトリスト(SPAMじゃないブログのリスト)を作って、あとはそれを検索エンジンに使うなり、テキスト解析に使うなり、ディレクトリサービスのような紹介コンテンツに使うなりすればいいかなと思っています。まずはちゃんとした母集団を作ることを目的として進めます。
まだ1000件の登録しかないが、数と質を確保できれば、それだけでも有益なコンテンツとなるだろう。期待したい。
まとめ
スパマー死ね。