Google Analyticsの紹介スパムを倒します。 REFSPHAMとは何ですか

リファレンススパムは、他のサイトからの「アリブ」トラフィックとしてGoogle Analyticsによって識別されたスパムボットからの偽のトラフィックである場合です。

「ボット」とは何ですか?

ボット - これはプログラムです 高速 そして繰り返し作業のサイトへの精度。

ボットは、サイトとコンテンツの更新をインデックスするために最もよく使用されます。

しかし時々彼らは有害な目的で使われています:

  • クリアフロッド
  • ポールアドレス eメール;
  • poule Content Site;
  • マルウェアを広める。
  • サイトへのチートトラフィック。

したがって、ボットを使用する目的に応じて、有用で悪意のあることができると結論付けることができます。

有用で悪意のあるボット

すべてのボットはスクリプトを実行できるものに分けられます javaScript。この機能が利用できないもの。

JavaScriptスクリプトを実行するBotsは、GAレポートにヒットおよびトラフィックデータ(直接紹介と紹介)、および拒否データ、変換などを歪めます。

JavaScriptスクリプトを実行していないボットはカウンタに影響を与えません。 それらはトラフィックとしてレポートに表示されず、メトリックのパラメータを変更しないでください。

有用なボットの例は、Googleがサイトをスキャンしてそのコンテンツを索引付けするために使用されるGoogle Botを提供することができる。

Google Botsは規則に従います robots.txt.悪意のあるボットは彼らに従わないが、非常に重要な危害が引き起こされます。彼らは偽のアカウントを作成し、電子メールスパムを送信し、PARSは電子メールアドレスとバイパスです。

悪意のあるボットは、それらが検出するのに十分なほど難しいために変装するには多くの方法を使用しています。 本当に既存のサイトからのトラフィックの傑出した自身で、ボットはほとんどすべてのユーザーを簡単に誤解させます。

有害なボットのどれがあなたのGAの報告に反映され、したがってあなたの分析のためには、どちらの悪意があるのか\u200b\u200bという精度で誰も言うことはできません。

スパムボット

悪意のあるボットがスパムに使用されるとき、それは呼ばれます - スパムボット .

毎日のスパムボットは、百百ものサイトでさえ訪れ、さまざまなドメインからのHTTPリクエストを送信します。 そのような戦術は彼らが本物のユーザーに自分自身を発行することを可能にします。

多くの場合、このようにスパマーは自分のサイトにバックシートを取得しようとしています。

サイトが紹介スパムボットから要求を受信すると、データはすぐにログファイルによって記録されます。 次に、Googleはログファイルを閲覧し、スパムリンクをサイトからバックリンクとして認識し、それをスパムサイトの参照ドナーとして自動的に定義します。

そのような一連の行動やスパマーを期待しています。 実際、Google Botはログファイルを実際のWebページから区別することができ、そのような疑似リンクを考慮に入れることはできません。 そして最後に、スパムボットはGoogle Analyticsフィルタを迂回することができます:それが彼らが紹介トラフィックレポートに分類される理由です。

ボットネット

スパムボットが使用する場合 ボットネット (すなわち、感染したコンピュータのネットワーク)、彼はあなたのサイトに何百もの異なるIPからあなたのサイトに紹介要求を送ります、そしてそれがBotsを闘う方法は、IPアドレスの黒い葉を引いたものではありません。 そしてよりスパムボットネットでは、それはあなたのサイトの出席の統計を台無しにするでしょう。

しかし、サイトに送信されるスパムボットが紹介されていませんが、直接クエリ、そしてその訪問に関するデータが直接トラフィックレポートに表示されます。

1つのスパムボットは何十もの偽の紹介サイトを生成することができるので、1つの紹介をブロックすることはボット全体の即時分離を保証することはできません。 このようなスパムボットの活動は多くのトラブルをもたらしますが、大きく、大きく、大きな危険はありませんが、本当の危険はもう一方の側に連れて行きます。

本当に危険なスパムボット

おそらく最も危険なスパムボットはスパムボットで、そのタスクはあなたの統計、コンテンツまたはユーザーデータを台無しにするためだけではありません。また、ボットネットの一部にするためにあなたのコンピュータに感染しています。 そして非常に悪いことは、あなたがあなたのコンピュータがボットネットの一部であると疑うことさえできることです。

原則として、コンピュータの感染は次のように発生します。 紹介に関するGAレポートにある特定のWebサイトが表示されます。 あなたはリンクをフォローして遊び場があるもの、そして移行プロセス中にあなたのコンピュータがウイルスを "しがみついている"の間に表示されます。 これに起こさないように、あなたは常に覚えておく必要があります:含まれていたウイルス対策なしでは、紹介レポートからなじみのないサイトを移動する必要はありません。 何らかの理由で疑わしいリンクによる移行が必要な場合は、別の(メインワンではなく)コンピュータを使用することをお勧めします。

スマートスパムボット

いくつかの特にスマートスパムボットはあなたにあなたのサイトを訪問せずにあなたにGAレポートを台無しにすることができます。 このために彼らはあなたのGAカウンターが必要です。

たとえば、BBC.CO.UK - BBC TVチャンネルの公式ウェブサイトでリクエストを送信できます。 それを参照する紹介トラフィックレポートでは、ユーザーがBBCサイトから来たことを確認しますが、残念ながら、 リアルポジション 問題は異なります。 そのようなボットはあなたのサイトにはあなたのサイトに参加しないので、それらに関する情報はあなたのログサーバーに固定されていません、それはあなたがIPまたは経由でそれらをブロックすることができないということです。 ユーザーエージェント 紹介リンクによっても他の方法でも。

すべてのWebサイトがBOTに等しいわけではありません

現場への影響の程度はその脆弱性に正比例します。 ボットは、安価なホスティングまたは遊離CMSを使用して、弱いプレスされた場所を攻撃します。 無料のCMSおよび安価なホスティングの問題は、それらがめったに脆弱性のためにめったに試験されないということです。 ボットの攻撃からあなたのサイトを保護するための推奨事項の1つは、検証済みのCMSのみを使用し、良い評判でホスティングすることです。

スパムボットが関与しているサイトにさらされることが多い アフィリエイトプログラム。 あなたが完璧な購入のためにパートナーを支払うならば、ウェブサイト上の確認済みのアプリケーション、またはあなたが独立してチェックすることができるその他の行動で、あなたは心配することは何もありません。 しかし、支払いパートナーの結果がサイトへのトラフィックを増やすか完了した(しかし確認されていない)、またはアプリケーションを完了した場合は、Botsを使用したり登録したりすることになる不正なウェブマスターがあるという事実のために準備されます。これから報酬。

紹介スパムを取り除くための手順:

ステップ番号1: Google Analyticsの紹介に関するレポートを開き、降退率のデータを降順に並べ替えます。

ステップ番号2: 障害の割合が100%、0%の割合で選択し、10からの訪問数はこれらがスパムボットである可能性です。

ステップ3。:選択した紹介がこのリストに存在するかどうかを確認してください - 彼らのプレゼンスはあなたがスパムボットであることを間違いなく確認されます。

ステップ番号4: このリストに不審なサイトがない場合は、本物の可能性があります。 必要に応じて、これはそのページを訪問することによって確認できます。 しかし、それはあなたがあなたのサイトとあなたのコンピュータが信頼できるウイルス対策によって保護されていることを確信しているのであれば、そのようなリスクに行く価値があります。

ステップ番号5: あなたが紹介ボットのリストを決定したら、彼らはあなたのサイトを訪問することからブロックされるべきです。

注意 :移行元から紹介ボットを削除しようとすると、望ましい結果が生じません。 紹介トラフィックレポートからのボットからの訪問に関するデータの発作時に、GAは直接トラフィック上のレポートへの訪問にデータを転送し、そこに現れた場合は、このトラフィックを取り除くことは不可能ではありません。

じゃあ何をすればいいの?

1. open.htaccessあなたのサイトと次のコードを追加します。

RewriteEngine On。

オプション+フォローリンク。

RewriteCond%(http_referer)^ https?://([^。] + \\。)* semalt \\ .com \\

書き換え。* - [f]

このコードはすべてのHTTPとHTTPSの紹介をブロックします。 に この例 その結果、ドメインとSabdomena "Semalt.com"からのすべての兆候がブロックされます。

2. スパムボットのIPアドレスとv.htaccessファイルのIPアドレスをブロックします。

RewriteEngine On。

オプション+フォローリンク。

注文拒否、allow.

234.45.12.33から拒否されています

したがって、「拒否から」フィールドに、ブロックするように設計されたIPボットを入力します。

あなたに知られているすべてのIPボットをブロックしようとしないでください..htaccessファイルを過負荷にし、サーバーの作業の品質に悪影響を及ぼす。 あなたのサイトを攻撃したものだけをブロックします。 スパムIPの葉が積極的に成長し続けるならば、これはあなたのサイトが保護に関して大きな問題を抱えていることを示唆しています。 既存の問題を解決するためにホスティングプロバイダに連絡してください。 上訴が有形の肯定的な結果に従わない場合は、それを変更してください。

3. 数のIPをブロックするには、次のコードが適しています。

RewriteEngine On。

オプション+フォローリンク。

76.149.24.0 / 24から拒否されます

全部から許可します

76.149.24.0/24はここで CIDR(クラスレス間ドメイン間ルーティング)。 このツールの説明の詳細はこちらがあります.http://www.ipaddressguide.com/cidr。

4. スパムボットで使用されるブロックユーザーエージェント。

時間内に表示するには、少なくとも週に1回はサーバーのログファイルを確認する必要があります。 不審なユーザーエージェントが検出されたときは、このQ.htaccessコードを使用してブロックします。

RewriteEngine On。

オプション+フォローリンク。

Rewritecond%(http_user_agent)Baiduspider

書き換え。* -

悪意のあるユーザーエージェントのより正確な決定のために、Googleにリストを見つけて自分のものと比較してください。 一致した位置はすぐにブロックされるべきです。

また、悪意のあるユーザーエージェントを識別するプロセスを自動化してみてください。 特殊スクリプト。 そして忘れないでください 常に更新します 悪意のあるスクリプトの基礎。

5. Google Analyticsのボトルフィルタを使用して、紹介トラフィックのデータから除外します。

6. ログサーバーを少なくとも週に1回確認してください。

サーバーレベルでボットの戦いを開始します。 このステップでそれらを明らかにして除外することができれば、GAレポートでそれらを戦う必要はありません。

7. コンピュータ/ Webサーバーとインターネットの間のフィルタとしてファイアウォールを使用してください。

8. インターネットの使用にアクセスするためのコンピュータとウェブサイトをさらに保護する グーグルクローム。:彼は悪意のあるサイトを定性的にフィルタリングし、それは自動的に感染の危険性を減らす。

9. GAのカスタムアラートを使用する:それは疑わしい紹介についての信号を正確にします。

スパマーとの戦いで頑張ってください!

リリースしました 新しい本 インテリアマーケティング ソーシャルネットワーク:加入者の頭の中に座り、彼らのブランドと恋に落ちる方法。」

申し込む

紹介SPAMは、他のユーザーの招待後に登録されたアフィリエイトプログラムのメンバーを介したスパムの種です。 これは検索からの遷移の模倣、すなわち ログファイルでは、ユーザーの訪問が記録され、実際にはページに参\u200b\u200b加しませんでした。 Yandex.MetricおよびGoogle Analyticsレコードでは、それに何も関係ないドメインからサイトの視聴者が表示されます。

私たちのチャンネルでのより多くのビデオ - セマンティカでインターネットマーケティングを学ぶ

リファママの特徴

そのような行動は、遷移が記録されるそのリソースの一種の自由広告である。 あなたはサイトに不正にあなたを引き付けます。

説明する 簡単な例。 私たちはいつも私たちに注意を払っている人を知ることに興味があります、そして、これらは風の行動的要因を楽しんでいます。 誰かがあなたの写真を絶えず嘘をついているならば、夢中になったコメントを残して、あなたはこれが誰であるか、そしてそれがなぜあなたにそんなに存在するのかを見るために、あなたは早くまたは後でこのユーザーのアカウントに行きます。 そして、あなたはおそらくあなたがおそらくがっかりしたときにあなたが署名の「不正行為、購読者、instagramの昇格者、宣伝」を持つ偽のアカウントを見るでしょう。 REFSPAMでも。 レポート内の通常の安定したトラフィックのソースが表示されます。 リソースのためのものを見つけるためにアドレスに移動して、そのサイトへのリンクを見つけます。 しかし、そこにはリンクはありませんでしたが、すべての訪問者が偽物、そしてあなたのサイトへの移行は本当にコミットしませんでした。 トラフィックはfalseであり、実際のユーザーから来ませんが、から来ません。

移行元が偽の最も明白な指標 - 奇妙な ドメイン名例えば、share-buttons.com、buttons-forsite.com。 リンクをクリックすると、無用または悪意のあるコンテンツでリソースが表示されます。 Google Analyticsレポートでは、そのようなトランジションの発生源はステータス "Not Definess"をマークしました。

Refspamを使用するために

紹介スパムまたはログを使用する場合は、リソースへのアクセスが自動的にアクセスされます。 に 最良の場合 接続の開始機能を使用して接続が発生した場合は、サイトからキロバイトが1キロバイトまたは何もしませんでした。

REFSPAMは訪問数に関するデータの意図的な歪みです 行動要因。 私たちのブログでは、任意のスパムがデマであると結論付けることができます。 トランジション数を増やすためにサイトの所有者が必要です。 Refspamは交通データを人為的に増やし、したがってウェブサイトの所有者は引渡しの位置を増やすことを望みます。 しかし、効果は通常逆です。 不正な方法では、PFサイトの怒りが盗難防止フィルタの下に入るためにリスクされます。 厄介なため、このサイトはトラフィックと位置を引渡しに失います。

どのような害をもたらすのは紹介スパムをもたらします

ログのスパムで最も無害なことはインターネットスペースを投稿しています。 より深刻な結果 - refspamに送られるサイトの位置の減少。 偽の遷移は100%の故障率を持ち、セッションの持続時間はほぼゼロです。 Web分析レポート内の情報は歪んでいて、サイトの所有者は誤った情報を受信し、これとともに、行動要因の低減によりそのリソースの位置への立ち下がりが観察されます。

サイトでRefspamを禁止する方法

最も人気があり大きい サーチエンジンYandexやGoogleなど、侵入者からの自動保護があると主張し、そのようなサイトからの遷移を考慮に入れていません。 しかし実際には、サイトの所有者はまだログにスパムを訴えています。 特に、保護されていないリソースのスパム所有者の影響を受けやすい。 たとえば、リソースが安価なホスティングまたは信頼できないCMSにある場合などです。

RefSpamに関する問題を回避できます。 このためには2つの方法があります。

方法1.外部リンクがサイト分析レポートに表示されるようにフィルタを配置します。

Google Analyticsレポートでは、紹介トランジションを完全に排除することができます。 フィルタを入れると、ホストとのみトラフィックを考慮に入れます。 主なもの - 必要なホストを考慮することを忘れないでください、そうでなければトラフィックは失われます。

フィルタをインストールする手順

  • トランジションのレポートを開き、最大許容時間間隔に注意してください。
  • 追加のパラメータとして「ホスト名」を祝います。」

  • 結果が表示されたら、その中にはサブドメインを含むあなたのサイトに関連するものを選択する必要があります。
  • [フィルタパターン]フィールドにサイトを入力してフィルタ設定に従ってください。

このアプローチの不利な点 - すべてのホストを不注意に含めることはできません。その後、レポート内の情報は正しくありません。

方法2レポートからの不要なトラフィックをすべて除外します。

スパムボットからのすべての遷移を削除する別のタイプのフィルタ。

  • フィルタに入り、設定を実行します。

  • フィルタパターンフィールドには、特定の式を示します。 スクリーンショットに示されている場合は、DARODARとP PRICERによる遷移は考慮されません。
  • 他のリソースを追加したい場合は、レポートから除外する遷移が縦スラッシュを介して括弧内に書き込みます。

困難は、紹介の数が絶えず成長しているという事実にあります。 したがって、新しいリストを定期的に監視して更新する必要があります。

最近 同様の写真は多くの(特にGoogle Analyticsではそれほど多くの交通源ではない)によく知られています。

執行されたデリントは、そのサイトへの偽の移行を生み出し、GAのアカウントの所有者がリンクに注意を払ってそれを通過することを決定することを期待して、再トランジションのリファレイまたはキャンペーンソースを残します。

このリンクに進み、人はどんな種類のサイトを参加させるのを待つでしょう。 CPAネットワーク (例えば、AliExpress)。 もちろん、人はそのようなサイトを閉じますが、料理訪問は残ります。 計算全体が可能な限り多くの人々としてそのようなクッキーを「感染」することになるでしょう。そのため、訪問者の中にはこのサイトでターゲットの行動が行われます。

なぜなら、私たちはAliExpressで何も買いたくない、あなたはどういうわけかこれらの参照を取り除き、GAでの報告を派遣する必要があります。 Google Analyticsスパムを取り除くためのいくつかの方法を下回る。

ソースを除外します

フィルタを使用する(履歴データは変更されません)

すべてのソースを排除するためには、私たちに不要な情報を排除するために - フィルタを適用する新しいプレゼンテーション(ビュー)を作成します(スクリーンショットに表示)。

フィルタの最後のパターン(最も低減されたソースを収集) -

Darodar \\。| Semalt \\。| Buthtons-for-Webサイト| Blackhatworth | Blose-Share-Buttons \\。| BOY-SHAY-SHARE-ONLINE \\。| GoogleSurchs \\。| TheGuardlan \\。| YouPornフォーラム\\。| Get-free-traffic-now \\。| RANKSONIC \\。| Adcash \\。| SIMPLE-SHARE-BOTTONS \\。| SOFICTONSONS \\。| BEST-SEO-SOLITER \\。| BESTONS- -youur-website \\。 余分なものを除外しないようにあなたのフィルターをチェックすることを忘れないでください。

uPD:フィルタテンプレートには255文字が閉じられます(チェックでエラーが発生する可能性があるため)、ラインを2フィルタに分割することをお勧めします。

セグメントの助けを借りて(履歴データを変更)

そのような設定で拡張セグメントを作成します。

ソース/チャンネルの正確に同じソースに降りる - DaroDar \\。| Semalt \\。| ButhaTworth | Blackhatworth | Blackhatworth | Busights | Cenokos \\。| Free-Share-Button \\。| BOY-SHARE-ONLINE \\ 。 。| BEST-SEO-SOLITOLE \\。| BOTHONS-for-oyur-website \\。

そのようなセグメントを適用した後は、レポートの大幅な違いを観察することができます。

結果は明らかです。 この記事が毎日この問題に衝突する小企業(スタートアップ)に役立つことを願っています。

あなたが他のより便利で自動的な方法を知っていれば - コメントを共有してください。

こんにちは、ウェブマスター、ブロガー、オプティマイザー、ランダムなゲスト!

今日は素晴らしい春の日です! 別の役に立つような時期です。

私はこの記事が多くの人にとって面白いと確信しています。 たとえば、私は同様の事実に興味を持っていました、そして私はそれを徹底的に理解することにしました。

あなたがすでにあなたの紹介スパムとあなたのWebリソースへの影響についてすでに実現した記事のタイトルから。

紹介スパムとは何ですか

それでは、紹介スパムは何ですか? 紹介スパムは同じですが、単純なスパムとの主な違いは、特定の製品やサービスに当たらないが、偽装された紹介リンクを残してください。

あなたがいくつかの好奇心があるならば、あなたはおそらくこのリンクを動くでしょう。 基本的には、そのようなリンクは、構成されたものを使用して別のアドレスを持つWebリソースをもたらします。 最後のサイトでは、特定の製品またはサービスに関する情報が広告として表示されています。

ちなみに、クッキーファイルはブラウザにかなり長い時間(1年まで)保存されています。しばらくしてこのサイトで何かを購入したとしても、あなたはあなたに稼ぐでしょう。

さて、今、私は補材の行動の基本原則を伝えたいと思います。 おそらくあなたはまたあなたの時間内に私にどのように私にとってもらうことにも興味があるでしょう。

まず第一に、あなたのブログへの訪問の統計:またはyandex.metrica。 他のサイトからブログへの移行に注意を払い、100%の失敗と時間の訪問が表示されます。 これらは鉄筋の部位 - ガスケットです。

私のブログから元の統計を見てください。

RefSpamenを行動する方法

さて、今、私はあなたにRefSpamenの行動の原則を共有します。

  1. ブログコードまたはその他の方法で出席カウンタのIDを抽出します。
  1. あなたのブログをエミュレートし、統計を訪問します。 同時に、ブログとの実際の対話は行われません。
  1. ウェブマスターからの行動を待っています。 Refspameによると、奇妙な指標(100%の失敗)を持つ彼のブログへの多数の遷移の形のブログ著者は、紹介リンクを切り替える必要があります。
  1. 著者は参照によって通過し、したがって彼の同意なしに適用されます 必要なファイル - 彼のブラウザに持続し、それをマシン上の紹介に変えるクッキー。 まあ、リンクをクリックすると、著者はリダイレクトを使用して広告情報を使ってリダイレクトされます。

先に言ったように、長時間のクックファイルをブラウザに格納することができるので、同様の戦略が長期間設計されています。 したがって、後でも 一定時間 製品やサービスの作者を買うとき、RefSpamenは彼の手数料を得ることができます。 しかし、それは購入ではないかもしれませんが、簡単な行動です。

現在Runetに入っているところでパートナーを積極的に開発し始めました。 私は彼らについてすぐに書くでしょう、それで私のブログを更新することを購読することを忘れないでください。

はい、もう一つのこと。 あなたが今日インターネット上で知っているように非常にあります たくさんの さまざまなサイトとブログ。 Refspamに従事しているクレメーターははるかに小さいです。 したがって、このような収益のモデルは正しいアプローチで強固な利益をもたらす可能性があります。

個人的には、私は似たような詐欺を伴うこのタイプの濃縮の支持者ではありません。 他に何もできない人々はメインの詐欺に取り組んでいます。

紹介スパムからの害

そのような質問。 紹介スパムは有害ですか? まあ、それが有用ではないという事実は100パーセントです。 ただし、ネットワークでは、RefSphamがサイトに害を与える確認を見つけませんでした。 したがって、この質問を開くと思います。

この問題の過程で検索エンジンの理論では、類似した「ブログ」をカウントし、検索結果のブログのランキングに影響を与えてください。 しかし、これが実生活でどのように行われるか、確かに誰も言えません。

紹介スパムを取り除く方法

よくアドバイスするためにここに。 参照スパムは、通常のスパムの種類の1つです。 そしてどのようにあなたは普通のスパムに苦しんでいますか? 正しい。 一番いい方法 戦いは無視しています。 あなたの出席カウンターに処方されているサイトの提供されたリンクを単にクリックするだけで十分でしょう。 ここで私の例を見てください:

以前は、このドメインは非常に頻繁に処方されました。このドメインは100%の失敗を抱いていますが、後でそれについて。

そう。 紹介スパムで問題を解決するための検索エンジンを提供することを知っていますか? はい、カウンタ統計のフィルタにこれらのドメインまたはそれらのIPアドレスを追加するだけです。 涼しい。 このアプローチは、彼が誰かから隠れているとき、私の息子のダニルカのゲームを思い出し、彼の手のひらと彼の目を閉じ、そして神聖では誰も気づかないと信じています。 面白い、そうではありませんか? だからここで同じです。

必要なのは、このコードをFile.htaccessの下部に追加することです。 このファイル。 それで全部です。 さて、今、私は私が本当に助けたコードをあなたと共有します:

オプションすべて。 stenvifnocaseリファラー "^ http://(+)?refsamameサイト。* $" bad_site 注文許可、拒否拒否のすべての拒否からenv \u003d bad_site

インストールした後、RefSpearドメインはから消えました google統計 分析 これは私が個人的に使う働く方法であり、あなたはすべての消防士にあなたに助言します。 それが私のfile.htaccessのスパムドメインを処方した方法です:

それでおしまい。 私の記事は論理的な結論に達しました。 あなたはそれに提供された便利な情報に来ましたか? コメント内のあなたの答えを待っています。

P.S. あなたがアンティーク - 古いものを売ることに興味があるならば、ここであなたは見つけるでしょう

非常に頻繁に、私たちはサイトのスプラッシュを祝い、Google Analyticsによって収集されたデータを分析します。 これはリソースへの関心として認識されています。 そしてもちろん、そのような出席の増加は喜ぶことはできません。

しかし、これは常に喜びの理由ではありません。 後で、この紹介トラフィックのほとんどがスパマーから送信されたことを発見しました。 最近大きな問題になったスパムでした。

紹介スパムは、サイトがスパムボットからのトラフィックの偽の方向を受信したときに発生します。 この人身売買により、Google Analyticsを書き込みます。 スパムソースから受信したAnalystトラフィックで気付いた場合は、統計からこのデータを排除するために特定のアクションを実行する必要があります。

ボットとは何ですか?

ボットは、最大速度と精度の程度の繰り返し問題を遂行するというタスクがプログラムと呼ばれます。

BOTSの従来のバージョンは、検索エンジンによって定期的に実行されるインターネットリソースの内容のWebインデックスです。 しかし、ボットは悪意のある目的でも使用できます。 たとえば、:

  • クリックで詐欺をコミットする。
  • eメールアドレスの蓄積
  • ウェブサイトのコンテンツの送信。
  • 悪意のあるソフトウェアの分布
  • リソーストラフィックの人工的な過大評価
ボットを使用するタスクを分析すると、安全で危険に分けることができます。

危険で安全なボット

グーグルがインターネット上のWebページをスキャンおよびインデックス化するために使用される、良いボット - "Googlebot"の例。

ほとんどのボット(安全か危険か)は、JavaScriptスクリプトを実行しないでくださいが、いくつかを実行します。

JavaScriptスクリプト(Google Analyticsコードとして)実行する検索ボットは、Google Analyticsレポートおよびトラフィックインジケータ(直接トラフィック、紹介トラフィック)、およびセッションに基づいてトラフィックインジケータ(直接トラフィック、紹介トラフィック)およびその他のメトリックデータ(故障率、変換率など)に記載されています。

JavaScriptを実行しない検索ボット(たとえば、GoogleBotなど)は上記のデータを歪めません。 しかし、彼らの訪問はまだサーバーログに記録されています。 彼らはまたサーバーリソースを消費します スループット そして彼らはサイトのダウンロード速度に悪影響を及ぼすことができます。

安全なボットは、危険とは対照的に、robots.txtディレクティブに従います。 彼らは偽物を作成することができます アカウント ユーザー、スパムを送信し、電子メールアドレスを収集し、CAPTCHAを迂回することができます。

危険なボットが使われています 様々な方法それらの検出を複雑にする。 それらは、Webブラウザ(たとえば、Chrome、Internet Explorerなど)、および通常のサイトからのトラフィックに影響を与える可能性があります。

どの危険なボットがグーグルのこれらのアナリストを歪めることができるかを確かに言うことは不可能です。 したがって、データの完全性に対する脅威として、すべての危険なボットを考慮する価値があります。

スパムボット

名前から明らかなように、これらのボットの主な仕事はスパムです。 彼らは、偽の参照ヘッダーを持つサイトのHTTP要求を送信することによって、毎日毎日のWebリソースに参加します。 これにより、それらがボットとして検出を回避することができます。

参照元の偽のヘッダーには、スパマーが宣伝したい、またはバックリンクを受信したいWebサイトのアドレスが含まれています。

サイトがリファラーの偽のヘッダーを持つスパムボットからHTTPリクエストを受信すると、直ちにサーバーログに記録されます。 サーバーログにオープンアクセス権がある場合は、Googleによってスキャンされ、生成できます。 システムは、サーバーログ内の参照元の値を反対側のリンクとして処理します。これは、最終的にスパマーによって宣伝されているWebサイトのランク付けに影響します。

最近、Googleの索引付けアルゴリズムは、ログからデータを考慮に入れないように構築されています。 このレベルでは、そのようなボットのクリエイターの努力。

JavaScriptスクリプトを実行できるスパムボットは、Google Analyticsが使用するフィルタリング方法をバイパスすることができます。 この能力のおかげで、このトラフィックはGoogleの分析レポートに反映されます。

ボットネット

スパムボットがBotnetを使用する場合(地元または世界中にある感染業者のネットワーク)は、何百ものさまざまなIPアドレスを持つWebサイトにアクセスできます。 この場合、IPアドレスのブラックリストまたは レート制限送受信されたトラフィックの割合) ほとんど役に立たない。

スパムボットのサイトにトラフィックを歪める能力は、スパムボットを使用するボットネットのサイズに正比例します。

互いに異なるIPアドレスを持つ大量のボットネットで、スパムボットはファイアウォールまたは他の伝統的な安全メカニズムをブロックせずにあなたのウェブサイトにアクセスできます。

すべてのスパムボットが参照元の見出しを送信するわけではありません。

この場合、そのようなボットからのトラフィックは、Google Analyticsレポートの紹介トラフィックの源としては表示されません。 それは直接的なトラフィックのように見えます。 言い換えれば、参照元が送信されないときはいつでも、このトラフィックはGoogle Analyticsで直線として処理されます。

スパムボットは数十の偽の参照者のヘッダーを作成できます。

参照元の1つのソースをブロックした場合、スパムボットは別の偽物をサイトに送信します。 したがって、Google Analytics or.htaccessのスパム上のフィルタは、サイトがスパムボットから完全にブロックされていることを保証しません。

今、あなたはすべてのスパムボットが危険ではないことを知っています。 しかし、それらのいくつかは本当に危険です。

非常に危険なスパムボット

本当に危険なスパムボットの目標は、Webリソースのトラフィックを歪めるだけでなく、内容をきれいにする メールアドレス。 彼らの目標は他の誰かの悪意のあるソフトウェアに感染することです、ボットネットのあなたの車の部分を作ります。

コンピュータがBotNetネットワークに統合されたら、スパム、ウイルスなどを出荷するために使用され始めます。 悪意のあるプログラム インターネット上の他のコンピュータに。

世界中の何百ものコンピュータが使用されている 現実の人間同時にボットネットの一部である。

あなたのコンピュータがボットネットの一部である可能性が高いですが、それについて知りません。

ボットネットをブロックすることにした場合は、実際のユーザーからのトラフィックをブロックする可能性が最も高いです。

あなたの紹介トラフィックレポートから疑わしいサイトを入力するとすぐに、あなたのマシンは悪意のあるソフトウェアに感染しています。

したがって、適切な保護ではなく、分析レポートから疑わしいサイトには参加しません( ウイルス対策ソフトコンピュータにインストールしてください。 好ましくは、別個の機械の使用は、特にそのようなサイトを訪問するためのものである。 あるいは、あなたは連絡することができます システム管理者この問題に対処するために。

スマートスパムボット

スパムボット(DaroDar.comのような)あなたのサイトを訪問せずに人工トラフィックを送ることができます。 Webリソース識別子を使用してGoogle Analytics追跡コードからのHTTPリクエストを再生することで作成します。 彼らはあなたに偽のトラフィックを送ることができるだけでなく、偽の参照もます。 たとえば、bbc.co.uk. BBCは法的サイトであるため、このレポートにこの参照者が表示されたら、尊敬されているサイトからのトラフィックが偽物になる可能性があると考えています。 実際、BBCを持つ人はあなたのサイトを訪問しませんでした。

これらのスマートで危険なボットはあなたのウェブサイトにアクセスするか、JavaScriptスクリプトを実行する必要はありません。 実際にあなたのサイトにアクセスしないように、これらの訪問はサーバーログに記録されません。

また、訪問はサーバーログに記録されていないため、任意の手段(IP、ユーザー、紹介トラフィックなどをブロックする)を使用してブロックすることはできません。

スマートスパムボットは、Webプロパティ識別子を検索してサイトをスキャンします。 Google Tag Managerを使用しない人は、Google Analyticsの追跡コードをWebページに残します。

Googleトラッキングコード分析には、WebリソースIDが含まれています。 識別子はスマートスパムボットをクラッシュし、他のボットの使用に送信することができます。 誰もがあなたのWebリソース識別子とボットを盗んだBOTが、あなたの人工トラフィックを送るボットが同じ「顔」です。

Google Tag Manager(GTM)を使用してこの問題を解決できます。

あなたのサイトのGoogle Analyticsを追跡するためにGTMを使用してください。 WebリソースIDがすでに借用されている場合は、この問題を解決してください。 今できることは、別のIDを使用するか、Googleからの解決策を待つことです。

スパムボットの攻撃の下にあるサイトはありません。

最初に、スパムボットのタスクは、Webリソースへの脆弱な当事者の検出と使用です。 彼らは弱い保護されたサイトを攻撃します。 したがって、「予算」ホスティングまたはカスタムCMSを使用してページを投稿した場合、それは攻撃されているという大きな可能性があります。

時には危険なボットの攻撃に基づいて陥るサイトは、そのウェブホスティングを変更するのに十分です。 この簡単な方法は本当に助けることができます。

以下の手順に従ってスパムソースを検出してください

1)紹介トラフィックレポートに移動します。 googleアカウント 分析と降順の障害の割合に関するレポートを並べ替えます。

2)100%または0%の故障率、および10人以上のセッションを持つ人と同様に参照者を見てください。 ほとんどの場合、これらはスパマーです。

3)疑わしい参照元の1つが下のサイトのリストに属している場合、これは紹介スパムです。 あなたは自分でそれをチェックすることはできません:

buttons-For-WebSite.com


7makeMoneyonLine.com。


ilovevitaly.ru。


resellerclub.com。


vodkoved.ru。


cenokos.ru。


76brighton.co.uk。


sharebutton.net


simple-Share-Buttons.com
フォーラム20.Smailik.org。
social-Buttons.com
forum.topic39398713.darodar.com

スパムソースの包括的なリストをダウンロードすることができます。

4)疑わしい紹介者の身元を確認できなかったら、リスクを冒して疑わしいWebサイトを訪問してください。 おそらくこれは本当に通常のリソースです。 ウイルス対策があることを確認してください ソフトウェア同様の疑わしいリソースを訪れる前に。 彼らは彼らのページへの移行時にあなたのコンピュータに感染することができます。

5)危険なボットのアイデンティティを確認した後、次のステップはそれらをあなたのサイトをもう一度訪問することからブロックすることです。

スパムボットからサイトを制限するにはどうすればよいですか。

グラフィックと書き込みに注釈を作成します 異常なトラフィックスプラッシュを引き起こした説明書のメモ 。 分析中にアカウントからこのトラフィックをリセットすることが可能になります。

スパムボット機能を使用して紹介スパムをブロックします 。 File.htaccess(またはWeb構成、IISが使用されている場合)に、以下の指定されたコードを追加します。

optionsengine + FallowSymlinks RewriteCond%(http_referer)^ https?://([^。] + \\。)*ボタン-For-Webサイト\\ .com \\ rewriterule * - [f]

このコードは、subdomainsボタン-for-website.comを含む、buttons-for-website.comからのすべてのHTTPの指示をブロックします。

スパムボットによって使用されるIPアドレスをブロックします 。 Take.htaccessファイルと下記のコードを追加します。

RewriteEngine On。
オプション+フォローリンク。
注文拒否、allow.
234.45.12.33から拒否されています

注意:コードをyour.htaccessにコピーする必要はありません。スキームは機能しません。 ここでは、ファイル.htaccessファイル内のIPアドレスをブロックするための例だけが説明されています。

スパムボットはさまざまなIPアドレスを使用することができます。 サイトで利用可能なスパムボットIPアドレスのリストを体系的に補充します。

サイトに影響を与えるIPアドレスのみを配布します。

それぞれの周知のIPアドレスをブロックするように努力するのは無意味です。 file.htaccessは非常に面倒なものになります。 管理が困難になり、Webサーバーの生産性が低下します。

IRアドレスのドラフトブラックリストの量が急速に増加することに気付きました。 安全性の明らかな問題があります。 Webホスト担当者またはシステム管理者に連絡してください。 Googleを使用してIPアドレスをブロックするためのブラックリストを見つけます。 この作業を自動化し、悪意のある証明書を独自に見つけて禁止できるスクリプトを作成し、その悪意が疑問がない。

スパマーボットで使用されているIPアドレスの範囲をブロックする可能性を活用する 。 SPAMBOTによって特定の範囲のIPアドレスが使用されていることが確信がある場合は、次に示すように、一度に多数のIPアドレスをブロックできます。

rewriteEngine。オン。

オプション。 + フォローモンリンクズ。


否定するから。 76.149.24.0/24


全部から許可します

ここで76.149.24.0/24 - CIDR範囲(CIDRはアドレス範囲を表すために使用される方法です)。

CIDRを使用すると、特定のIPアドレスをブロックすると、サーバー上の最小スペースを保持できるように優れています。

注意: CIDR番号のIPアドレスの数、およびこのツールでそれらを開くには反対に隠すことができます.www.ipaddressguide.com/cidr

スパムボットを使用して禁止されているユーザーをブロックする 。 サーバーログファイルを毎週分析し、スパムボットを使用しているユーザーの悪意のあるエージェントを検出してブロックします。 ブロッキング後、それらはWebリソースにアクセスできません。 これを行う能力を以下に示します。

rewriteEngine。オン。


オプション+フォローリンク。


Rewritecond%(http_user_agent)Baiduspider


書き換え。* -

Googleの開始ラインを使用すると、既知の禁断されたユーザーエージェントの記録をサポートする、優れたリソースのリストが表示されます。 あなたのサイト上のそのようなユーザーエージェントを識別するために受信した情報を使用してください。

最も簡単な方法は、プロセス全体を自動化することを可能にするスクリプトを書くことです。 既知のすべての禁断されたユーザーエージェントをデータベースにします。 データベースからデータに頼ることで、自動的に識別してブロックするスクリプトを使用します。 新しい禁止されているユーザーエージェントでデータベースを定期的に補充する - 羨ましい恒常性で表示されます。

リソースに本当に影響を与えるカスタムエージェントのみをブロックします。 それは各既知のIPアドレスをブロックするように努力することは意味がありません - これはファイル.htaccessが大きすぎるようになります、それは管理が難しいでしょう。 サーバーのパフォーマンスが低下します。

Google Analyticsにアクセスできるボットフィルタフィルタを使用するのは、「有名なボットやクモからのヒットを排除します」です。

監視サーバーは少なくとも毎週ログに記録されます . 危険なボットとの戦いの始まりを実際にサーバーレベルで置きます。 これまでのところ、スパムボットをあなたのリソースを訪問することを「残す」ことに失敗しました、Googleの分析報告からそれらを排除しないでください。

ファイアウォールを使用してください 。 ファイアウォールは、コンピュータ(サーバー)と仮想スペースの間の信頼できるフィルタになります。 Webリソースと危険なボットから保護することができます。

システム管理者から修飾ヘルプを入手してください . 悪意のあるオブジェクトからのクライアントWebリソースの24時間保護は、その主な仕事です。 ネットワークの安全を担当する人は、サイトの所有者よりもボットの攻撃を反映するためのよりはるかに多くのツールです。 サイトを脅かす新しいボットが検出された場合は、すぐにSisadmin Findについて知らせます。

使用する グーグル クロム。 Webサーフィンのために . ファイアウォールが使用されていない場合は、Google Chromeを使用してオンラインページを表示するのが最善です。

クロム。悪意のあるソフトウェアを検出することもできます。 同時に、それは悪意のあるプログラムのためにそれらをスキャンするのを忘れないで、他のブラウザよりも早くウェブページを開きます。

Chromeを使用している場合は、悪意のあるソフトウェアを「ピックアップ」するリスクが軽減されます。 紹介レポートから疑わしいリソースに行く場合でも googleトラフィック 分析

予期しない出席ジャンプを監視するときは、カスタム警告を使用してください。 Googleのアナリストのパーソナライズされた警告は、ボットの悪意のある需要を迅速に検出して中和し、サイトへの悪意のある影響を最小限に抑える機会を提供します。

Google Analyticsで使用可能なフィルタを使用してください . これを行うには、[ビュー]列の[管理者]タブで、[フィルタ]を選択して新しいものを作成する必要があります。

カットフィルタ設定は非常に簡単です。 主なことは、これがどのように行われるかを知ることです。

[管理者]タブの[設定]セクションにある[BOTフィルタリング]チェックボックスを使用できます。 傷つかないでしょう。

Google Analyticsのフィルタの使いやすさにもかかわらず、私たちはまだ実際にそれらを使用することを助言しません。

このためには3つの良い理由があります。

  • 何百もの悪いボットがあり、毎日膨大な数の新しいものが現れます。 どのくらいのフィルタが作成してレポートに適用する必要がありますか?
  • より もっと フィルタが適用され、Googleの分析サービスから受信したレポートを分析するのが難しくなります。
  • Google Analyticsでスパムトラフィックをブロックすることは隠蔽ですが、問題に対する解決策はありません。 あなたは交通歪みスパムボットの程度を評価する機会を失います。

同様に、紹介トラフィックをブロックしないでください。 紹介除外リスト " - これはあなたの問題を解決することはありません。 それどころか、このトラフィックは後で直接評価され、それはあなたのWebリソーストラフィックに対するスパムの影響に従う能力の喪失につながります。

スパムボットが分析統計に落ちた後 googleサービストラフィックデータは永遠に歪められます。 あなたはそれを修正することができません。

結論

上記の推奨事項があなたのサイト上のすべてのスパム源を取り除くのを助けることを願っています。 それは行うことができます 違う方法また、多くのリソースがGoogle Analyticsでデータを保護するのに役立ちました。

タグ:タグを追加する

トピックを続ける:
インターネット

Windowsブートディスクを作成する最も一般的な方法の1つは、この記事で説明されている方法です。 そしてより正確に創造の中で、それは遠い世界で私たちを助けるでしょう...