goods and life +

Google スパム対策チームわりと仕事はやかったり

Google スパム対策チームわりと仕事はやかったり(´・ω・`)♪

はじめましてを検索する理由 の記事で、Google はこんな仕組み(http://www.google.com/insidesearch/howsearchworks/thestory/)って載せてたんですけど、昨日の夕方頃、気がついたらわかりやすい日本語バージョンも出来ています。


検索の仕組み(日本語版)

基本的な事なんだろうけど、クロールとインデックス、アルゴリズム、スパム対策やポリシーなどなど、Google に関するトピックです。
ネット上で何がしかをおこなう人にとっては興味深い内容。
Search Quality Rating Guidelines Version 1.0 なんかも公開されていて、ダウンロードもできるようになっています(ただし英語)


検索品質評価ガイドライン
Search Quality Rating Guidelines Version 1.0

これはもしかして!
チェックチームの中の人の流出資料だとかいう話で、確か前に見た事あるような…

 


と思ったらそっちは 2011年の General Guidelines Version 3.18 でした。

検索の仕組み(日本語版)のスパム対策のところを見ると…
毎日数百万件に及ぶ無用なスパムページが作成され、毎日消し去られてます。


Google のアルゴリズムでは、大半のスパムを検出して自動的にそれらの順位を下げることができます。
対処できないスパムについては、Google のチームが手動でサイトを確認しています。


pure spam
悪質で攻撃的なスパム手法を使用しているという意味で pure spam と呼ばれているものの例(Google が手動で特定して削除、検索結果に表示されなくなったスパムサイトのスクリーンショット)が公開晒し上げ。
内訳は自動生成された意味不明の文字列、クローキング(検索エンジンのロボットに人間の閲覧者と異なる内容のページを見せるもの)、他のサイトのコンテンツの丸パクリ(スクレイピング)など攻撃性の高いものやバナーと数文字だけの Thin Affiliates など。


おなじみのスパマーも削除されていた
偶然ですけど、これを夕方に見たとき、某井戸端(WordPress製のサイト)へのスパム連投で大暴れしていた支那人スパマーの偽グッチ販売サイトも手動削除された例で掲載され、秒単位のスパム連投で大暴れしていた支那人スパマーの偽モンクレール販売サイトへのサテライト用に作っている自動生成の文章とリンクだけの内容の WordPress製の量産サイトもキャッチされています。

本家もサテライトも全部スパム、ついでに…
このサテライトってのは偽ブランド詐欺サイトへ向かうリンク稼ぎにやっている大量生産自作自演サイトのことで、偽物販売サイトにリンクを供給するその自演サイトにさらにインバウンドリンクを作る為に、次は他人のブログに連投するというパターンです。
無差別コメントスパム投稿で違う IP から分散してリンクを集めて、自然にリンクが集まったように装っています、でもバレてる。
自分のブログのコメント欄やトラックバックのリンク構造が nofollow でなければ、スパマーのサイトへとリンクジュースが流れます。
そうなるとスパム投稿に必ず付けられているリンクはあなたがそのサイトに投票した事と同じ扱いになるので注意が必要。


ファンブログは標的
ユーザー生成スパムを処置せずにいると間接的にスパマーに協力することになり、それを放置する管理者ってことで自分の評価も下げられかねない、積極的に紹介・知らぬ間にやられているに関わらず、クローラーから見れば nofollow なしのアウトバウンドリンク、ページランクの仕組みからみればリンクはそのページへの投票と同じです。

コメント欄やトラックバックに nofollow が付かないファンブログは餌食。
迷惑でウザいスパムリンク、勝手に付けられてませんか

Google はユーザー生成スパムに対してどうするべきかガイドラインで説明しています。


偽モンクレールのサテライトサイトの例
偽モンクレール


偽モンクレールの連中
Facebook で次々偽ブランド広告を出して Amazonでも偽モンクレールを販売していた中国人グループの所有のものだと思われ、ガイドライン違反とかスパム以前に組織犯罪(笑)
Facebook にクレジットカードを登録している人をクラックして、Facebook から広告費の請求をさせていたの、この人たちじゃ?、しらんけど。


スパムの種類は多い
クローキング、不正なリダイレクト、純粋なスパム、サイトからの不自然なリンク、ハッキングされたサイト、スパムコンテンツを含むホスティング サービスと動的 DNS プロバイダ、サイトへの不自然なリンク、隠しテキストまたはキーワードの乱用、付加価値がほとんどまたはまったくない実質のないコンテンツ、ユーザー生成スパム、パークドメイン…。

アルゴリズムで自動的に検出されなかったスパムには手動によるスパム対策が待っていて、それらの特徴への対策が次のアルゴリズムに組み込まれて精度が高まっていく、このサイクルの繰り返し。
検索エンジンを騙す方法を「SEO」といっている人たちの手法はだんだん通用しにくくなっていきます。


手動によるスパム対策のグラフ
手動によるスパム対策


図の吹き出しのように「付加価値がほとんどまったくない、実質のないコンテンツ」も手動によるスパム対策の内に含みます。


そのうちドメインごと嫌われることに
WordPress のコメントスパム対策のために Akismet(アキスメット)というプラグインを入れると、すでにファンブログのドメインはスパマーのドメイン扱いというか認識(笑)になっていて、 fanblogs.jp ドメインからはコメントの書き込みができません。
既にスパムコンテンツを含むドメインやホスティング サービス扱い。
なぜそうなったのか…。


アフィリエイト
付加価値がほとんどまったくない、実質のないコンテンツ=「アフィリエイトによる宣伝の部分がなければまったく中身がなくなってしまう、アフィリエイト先のページで得られる情報以外に何の付加価値もユーザーに提供していないような中身のあまりないアフィリエイトブログ」はスパムに含む、という事を書いています。


Search Quality Rating Guidelines Version 1.0 より

4.1 Thin Affiliates
An affiliate earns money from affiliate commissions.
An affiliate website exists primarily to make money.
Affiliates often show content from other "real" merchant sites, such as Amazon or eBay, or a good hotel or travel website.
When users click on links to buy products or make reservations, they are oftentimes redirected to the real merchant page.
A thin affiliate is a site that offers little additional information and does not offer substantial value to users compared to many other sources on the Web.

For example, an affiliate that has only copied content from the merchant site is considered a thin affiliate.
This is a moneymaking spam technique.


『単に販売者サイトから内容をコピーしただけのアフィリエイトは、 内容の薄いアフィリエイトと考えられ、これは金儲けのスパム技術です』と書いてます。


4.1.1 Recognizing Thin Affiliates
To help determine if a page is a thin affiliate, you can do the following:
Look for original content on the page.
The quality of an affiliate page or site depends on how much added value, usefulness, or original/additional information is available on the page that is not easily available elsewhere on the Web.
If the page has the same “cookie-cutter” text or functionality found on dozens or hundreds of other sites, it is more likely to be spam.

Look at the domain registrants.
If clicking a button takes you to another page, check to see “whois” the registrant (or owner) of the two domains.
If the registrant is the same, the page is typically not a thin affiliate.
Please follow the instructions for checking “whois” in Section 2.3.1 of the Webspam Guidelines.

『有用性、あるいはオリジナルな追加情報やオリジナルコンテンツがあるのか』チェックされます。


こんな感じのアフィリエイトは効果がないどころかガイドライン違反のスパム認定
人の役に立たないどころか検索の邪魔だし、用があるなら販売サイトに直接行けばいいってことで、Googleはこういうのを排除します。
だからこんなのを作っても検索結果にでてこないし、誰にも見てもらえないし、しかもスパムする人扱いになるし。

こういうのは、悪意の有無に関わらず完全にスパム
dame_sample

無料ブログはこういうのが多いですが、これではまるで人の役に立たないし。
デブリを作るくらいなら、何もしないで寝てた方がマシ。

ファンブログでは上の例の他に、完全に悪意でやっているスパマーもいますね。

支那人韓国人スパマー晒しあげ
たとえばその中にあるユーザーネーム部分の chen123xixi とかでググってみ?
結果を見ると、もうね〜「無料ブログ=スパム用」に利用されるのがオチ。
こんなのが大半の無料ブログの実態なのかも。

ファンブログのユーザーもスパマー多すぎ
自動生成の悪意あるスパムの量産やリンク集への登録や購買リンクなど不自然リンクを推奨する輩、あっちこっちに宣伝コメントを書き込んだり、他人にまでそれを推奨する輩、コメントやトラックバックに付いたスパムリンクの放置、宣伝の部分がなければまったく中身がないブログ、アフィリエイト先のページで得られる情報以外に(それすらないものも)何の付加価値もユーザーに提供していない見出しやタイトルだけのブログ、クリック課金のあるバナーを並べてお互いに習慣的にクリックしあうキチガイ、いい加減な情報商材を宣伝するバカ。
いますよね?、いつか表向きにバレてしまっていなくなるんだろうけど、ほんとによく見かけますし実際目立ちます。

共有ドメインのスパム汚染
無料ブログでスパムやゴミをつくる人、コメントやトラックバックのスパムを放置する人が、共有ドメインのスパム汚染に加担することになってしまいます。

じゃあどうする?
アフィリエイターはここの情報が参考になります。


こういう現実ヽ(・∀・ )ノ

お買いもの忘れはないですか?

  • コメント ( 3 )
  • トラックバック ( 0 )
  1. こんばんは

    こうやって記事を読むと、
    ファンブログはやっぱりあんまり良くないかな?って気がしますね

    真面目にアフィリとかブログをやっている人もいるので、
    ファンブログの運営会社にちゃんとした対策をして欲しいですけどね

  2. ファンブログ、コメント欄やトラックバックは今どき nofollow 付ける仕様になってないとまずいですね、必ず悪利用されます。
    Googleのアルゴリズムで自動的にキッチリ制裁喰らってるFC2でさえ、内部向けにFC2スパム対策APIとか作ってますし、ファンブログにもああいう機能があればいいのにね。
    あとドメインの問題、これはここを使うユーザーの質なの偏りなんですけど、これはコントロールできないのでどうしようもできない部分ですね。

  3. ファンブログがリニューアルされて仕様がかわり、コメントレイヤーには rel=”nofollow” がつくようになりました。
    そのことに気付かずコメント欄にスパムサイトのURLを解放するために毎日100%剽窃コンテンツを更新し続けるアカウントがありますけど、もうどうでもいいですね。

*
*
* (公開されません)

CAPTCHA


※スパム対策のため、日本語を含まない投稿は無視されます。

Return Top