k2 内の重複エントリを削除します。 Joomla で重複ページに対処するにはどうすればよいですか? 重複ページに対処するための JL No Doubles プラグイン

みなさん、こんにちは。この記事を読んでいるということは、多くの初心者の Web 開発者と同様に、まったく正当な質問があるということです。 Joomlaで重複ページに対処する方法.

この記事では、この質問に答えていきたいと思います。 まず、サイト上に重複ページが出現する危険性について説明し、次に重複に対処する既製のソリューションを見ていき、最後に代替案を見ていきます。 重複ページに対処する方法.

重複ページを削除する価値があるのはなぜですか?

Joomla が他のコンテンツ管理システムと同様に、その作業の過程で異なるサイト アドレスで利用できる同一のページ、つまり重複を作成することは周知の事実です。 サイトの訪問者にとって、これらの同じページは無害であり、その存在にさえ気づかない可能性があります。

ただし、訪問者にとって無害な重複は、検索結果におけるサイトの位置に大きな影響を与える可能性があります。 なぜこうなった?

状況を想像してみましょう - あなたはいくつかのユニークな資料を作成し、Web サイトで公開しました。 検索ロボットがこれらのページにインデックスを作成し、すべて問題ありませんでしたが、しばらくすると、検索ロボットがこれらのページの重複を見つけました。 検索ロボットは、これが重複していることを認識しません。これらは 2 つの完全に異なるページであるため、結果として、最初は一意だったマテリアルはもう一意ではなくなります。

サイト上に同一のページ (重複) が多数出現すると、検索結果におけるサイトの位置が大幅に「下がる」可能性があります。 だからこそ、重複したページをできるだけ早く削除することが重要です。

重複が表示されるのはなぜですか?

追加の拡張機能をインストールした結果、CMS Joomla に重複が表示されます。 しかし、これが結成の唯一の理由ではありません。

重複ページが形成される同様に一般的な理由は、サイト構造が考慮されていないことです。 これをどうやって結びつけることができるのでしょうか? はい、とても簡単です。サイト上に 1 つの親カテゴリを持つ複数のカテゴリを作成し、マテリアルをこれらのカテゴリに配置しました。 マテリアル内には、以前に作成したマテリアルなどへのリンクを作成します。 例として、スクリーンショットを見てください。

カテゴリのメニューを作成しない場合、ページ アドレスは次のようになります。

http://joom4all..php?option=com_content&view=article&id=38&catid=10

住所が完璧とは程遠いため、アドレス バーの数字を削除したいと考えました。 これを行うには、カテゴリとマテリアルのメニュー項目を作成します。 この後、アドレスはさらに魅力的であることが判明しました。

http://site/sites-creation/basics/intro

すべてがうまくいくはずですが、古いページのアドレスは消えておらず、重複したままになっています。 その結果、同じページに一度に複数のアドレスが存在する可能性があります。

http://site/32-sites-creation/10-basics/38-intro http://site/32-sites-creation/basics/intro http://joom4all..php?option=com_content&view=article&id=38&catid =10

これは快適な状況ではありませんね。それに、検索ロボットはこれらすべてのページをまったく異なるものとみなします。

重複ページに対処する方法

もちろん、初期段階では重複ページの出現を避けることが最善です。サイトの構造を事前に検討し、必要なカテゴリとメニュー項目を作成します。 しかし、実践が示すように、誰もがこれを行うわけではなく、時間が経つにつれて、検索結果から重複を削除する方法についての問題が生じます。

重複を処理するにはいくつかのオプションがあります。

  • 特別な拡張機能を使用する
  • Robots.txt ファイル
  • htaccess ファイルのリダイレクト 301
  • ウェブマスター パネルを使用して不要なアドレスを削除する
  • リダイレクトコンポーネント

重複ページに対処するための JL No Doubles プラグイン

最もシンプルであると同時に十分なもの 重複ページに対処する効果的な方法これが拡張機能の使用です。 そのような拡張機能の 1 つが、 JL No Doubles プラグイン.

このプラグインは非常に軽量で、特別な設定は必要ありません。 このプラグインをダウンロードし、インストールして有効にするだけです。 残りの作業は彼が自分でやります。

JL No Doubles プラグインは、com_content コンポーネントを含む 20 以上のコンポーネントの重複ページを削除します。 404 エラーの表示またはサイトの正しいページへの 301 リダイレクトを構成できます。 プラグイン設定ページは次のようになります。

プラグインを設定するためのパラメーターは 5 つだけです。

  • ライセンスキー– k2、Virtuemart、Zoo コンポーネントでプラグインをアクティブ化します。
  • 限界の多重度– Joomla マテリアル カテゴリの設定。 /advanced?start=3 のようなリンクを作成するときにリダイレクトを設定できます。 カテゴリに表示されるマテリアルの数を指定するだけです。
  • 301リダイレクトを使用する– 正しいページへのリダイレクトを使用する機能を有効にするか、(「いいえ」に設定されている場合) 404 エラーを発行することができます。 サイトがかなり長い間存在しており、他のサイトがそのページにリンクしている場合は、ページの重量を失わないようにリダイレクトを設定することをお勧めします。
  • エイリアス– コンポーネント/コンテンツ/記事 (デフォルトではホーム) などのリンクをエイリアスに置き換える設定。
  • ストップワード– これらはページ アドレス内で見つかった、処理すべきではない文字列です。

基本的な設定を整理しました。次に、「コンポーネント」タブに移動しましょう。

このタブでは、サイトで使用され、インデックス作成に使用できるコンポーネントを選択します。 デフォルトでは、com_content コンポーネントがすでに選択されています。 考えられるコンポーネントをすべて選択しないでください。特にコンポーネントを使用しない場合、サイトに不要な負荷がかかります。

Robots.txt ファイルの使用

ページ リダイレクト プラグインがどれほど優れていても、すべての重複を削除することはできません。 この場合、検索ロボットによるサイトの特定のページのインデックス作成を禁止する、つまり、それらのページへのアクセスをブロックすることができます。

Robots.txt ファイルのセットアップの複雑さについては、この記事ですでに説明しました。 簡単に言えば、ロボットの「目」からあなたの一部をブロックする指令があるとだけ言っておきます。 許可しない .

301リダイレクトとhtaccessファイル

重複に対処するもう 1 つの一般的な方法は、リダイレクト、つまり正しいページへの 301 リダイレクトを設定することです。 これはファイルで実行できます。 .htaccess ».

リダイレクトを作成するには、RewriteRule ディレクティブを使用する必要がありますが、ホスティング上で mod_rewrite モジュールが有効になっていることを確認する必要があります。

Web サイトのページに PHP でアクセスするには、「.htaccess」ファイルの RewriteEngine On ディレクティブの後に次の行を記述します。

RewriteRule http://site/index.php$ http://site

この記事では、「.htaccess」ファイルの操作について詳しく説明しました。

リダイレクトコンポーネント

非常に便利であると同時に、ページのリダイレクトを手動で設定できるようにする Joomla 3 に組み込まれたコンポーネントです。 このコンポーネントは、その操作に特別なプラグインを使用しますが、デフォルトでは無効になっています。

最初に、プラグインを有効にする必要があります。幸いなことに、「コンポーネント」 -> 「リダイレクト」ページに移動すると、プラグインを有効にする必要があるというメッセージが表示されるため、他のプラグインを探す必要はありません。リンクをクリックしてアクティブ化します。

プラグインが有効になったら、ページの開始 (古い) アドレスと終了 (新しい) アドレスを指定してリダイレクトを作成できます。

この方法は、重複ページがそれほど多くない場合に適しています。

要約しましょう

結論として、Joomla は重複ページを作成することで有名ですが、それらを削除する方法はたくさんあると言いたいです。 どの方法が最適であるかは自分で決めることができますが、この問題を解決するには統合的なアプローチが望ましいと言えます。 そして、Web サイトの構造を作成するための正しいアプローチから始める必要があります。

さらに、サイトのアドレスバーにあるindex.phpを削除する方法を検討する価値があります。これは、重複ページの数を減らすのにも役立ちます。

静的 HTML で Web サイトを作成および宣伝することはますます人気がなくなり、ほとんどの Web マスターが最新の CMS、特に Joomla に切り替えています。Joomla は、その利点に加えて、まずページを複製することでユーザーを混乱させる可能性があります。 Joomla の重複ページはウェブマスターにとって一種の災難ですが、率直に言って、多くのウェブサイト自動化システムがこれを犯しています。

重複を検索する

まずは、見分け方を見てみましょう 重複したページそしてなぜそれがウェブサイトのプロモーションプロセスに悪影響を与えるのか。 重複を判断する最も簡単な方法は、Yandex の高度な検索を使用することです。「サイト」行にプロジェクトを入力し、検索行にこれまたはそのクエリを入力します。 その結果、関連性に従ってサイトのページを表示することができ、互いに重複するページも存在します。 Netpeak Spider を使用すると、ワンクリックでページをアンロードして重複を検索できるので、さらに簡単です。

2 番目の重要な疑問は、なぜ検索エンジンがこれを否定的に見るのかということです。なぜなら、これは検索エンジンを欺こうとする意図的な試みではなく、原理的にロボットが知っておくべき CMS の技術的問題だからです。 実際には、同じ内容が 2 つの異なるアドレスで提供されているため、そのようなページを意図的なスパムとして識別できるのはロボットであるということです。 Yandex サポート サービスに連絡しようとしても何も起こらないため、Joomla ページの重複を避けるようにしてください。

重複の削除

禁止: /search/

禁止: /*.pdf

禁止: /*print=1

禁止: /*type=atom

禁止: /*type=rss

禁止: /*task=rss

禁止: /*?sl*

禁止: /*?sl*

したがって、Joomla が複製を詰め込むことができるメインの倉庫ベースは遮断されます。 たとえば、xmap コンポーネントのページを実際に開く必要がある場合、つまりサイト マップを Web マスター パネルに追加するために、必要なページは、前に配置されるAllow: ディレクティブを使用して簡単に開くことができます。許可しない:。

ただし、私個人としては、次のような重複した Joomla ページによって命が与えられたわけではありません。

また、長い検索を行っても、robots.txt 内の何百もの左側のリンクを手動で閉じる以外には、何も良い結果は得られませんでした。 しかし、ある日、洞察のように答えがもたらされ、最も単純なことに私の目を開かせてくれました。それに遭遇したのは私だけではないことは確かです。 今日、多くの人が、統合用のボタンをインストールすることによって、ソーシャル ネットワーク上で Web サイトのプロモーションを実践しています (そして正しく行っています)。 同時に、一部のプラグインは Twitter に統合されると単純にリンクを切断し、ロボットは「ツイート」リンクをたどって終了するため、問題を解決するにはプラグインを設定または置き換える必要があるという事実に誰もが注意を払っているわけではありません。彼らはインデックスに対する電子的な無知のためにその切り取ったビューを入力します。

問題は銅製の洗面器と同じくらい単純であることが判明しました。これが私が最も心配していた部分ですが、この方法でテイクの一部だけが削除されたのは残念です。 ウェブマスターの見落としと CMS の欠陥の組み合わせにより、一部の最適化エラーが依然として発生していることが判明したため、これは対処可能であり、対処する必要があります。 幸運を。

/sobstven-sate/eksperiment-seo/383.html のような重複、つまり短縮されたページ アドレスに満足できない場合は、Joomla Shnodoubles のプラグインを使用してください。このプラグインは、グーグルで検索するか、コメントで私に書いて見つけることができます。これを使用すると、数分で問題を完全に解決できました。 それについて考え、購読を解除するのにうんざりしたので、サイトから直接 Joomla 用の nodouble をダウンロードすることをお勧めします。

301 リダイレクトを使用して Joomla で重複を削除するビデオも提供しています。

質問と回答

重複を自動的に削除することはできますか?

自動モードでは、重複がないことが 90% 保証されます。 Joomla の場合、ロボットと htaccess を設定し、ページをメイン ナビゲーションにマージする処理を行うだけで十分です。 ただし、サイトが拡大するにつれて重複が表示される可能性があるため、Netpeak Spider を通じて重複を追跡します。

PS スパイダーは Joomla 上の重複が開発者のミスであることを理解していないのでしょうか?

なぜこのエラーが所有者によって修正されないのでしょうか? 欠陥のある車を購入した場合、ヘッドライトが点灯しなかったり、排気ガスが基準を満たしていないという理由で交通警察に罰金を科せられても文句を言わないでしょうか? CMS は料金が支払われないため、サポートに問い合わせても意味がありません。

最近では、重複に対して厳しく罰金を科されることはほとんどありませんが...たとえば、重複ページがあり、同じ内容で URL が異なる 3 ~ 4 つのドキュメントが検索に含まれている場合、静的な重みはそれぞれのドキュメントで最大になると思いますか?それとも汚れてしまいますか? 結局のところ、装飾的なジャンク Web サイトが必要なのか、それとも CMS を正しく設定すればユーザーと情報を共有して利益を得たいのかを決めるのはあなた次第です。

この記事では、Joomla の重複ページについて説明したいと思います。 このテーマに関しては多くの記事が書かれていますが、この問題についての私の見解を記録する価値があるように思えます。 この記事では Joomla 3 について説明しますが、ほとんどすべてのヒントは Joomla 2.5 に関連しています。

Joomla の重複ページの問題は、CMS 自体の根幹、正確に言うと Joomla 自体ではなく、CMS Mambo の祖先に深く関わっています。 実際のところ、彼らは当時 CNC (人間が読める URL) について考えていませんでした。そして問題が関連性を持つようになり、Joomla 1.5 がリリースされたとき、リンク システムを根本的に作り直す代わりに、現在私たちが対処している問題が作られました。 。 はい、当時はそれが問題の解決策のように見えましたが、私たちが見ているように、半分の措置は世界的な問題に成長しました。

幸いなことに、Joomla 開発者は問題があることを理解していますが、コミュニティによって提案された抜本的な対策は講じたくありません。 新しい Joomla ルーターの募金活動も成功しましたが、この変更を主要な Joomla ディストリビューションに組み込むのは困難です。

では、Joomla は重複を避けるために実際に何をしているのでしょうか?

彼らは再び半分の道を歩み、実際のJoomlaページを指すように設計されたcanonicalタグを導入しました。 導入の茨の道については話しませんが、それが本当に茨の道だったということだけは述べておきます。 そして、この方法でサイト上の重複の数を本当に減らすことができると言いますが、問題は、コンポーネント開発者がサポートの実装、正しいサポート、およびこれを処理する必要があるため、この方法は Joomla コンポーネントではほとんど機能しないことです。常に起こるわけではありません。 正直に言うと、正規タグ自体は万能薬ではありません。

この簡単で効果的な方法については、以下で説明します。

実際、この方法を使用すると、テイク数を数分の 1 に減らすことができます。 私の練習では、これによりテイクを 10 分の 1 に減らすことができました。

そのためには何が必要なのでしょうか?

  • 少しの時間と手間

Google が最初に指示するのは、重複したドメインを除外することです。

どうやってするの?

www ドメインから非 www ドメインにリダイレクトします。 つまり、サイト www.site.ru にアクセスすると、サイト site.ru にリダイレクトされます。

次のルールを .htaccess ファイルに追加します。

RewriteCond %(HTTP_HOST) ^www\.site\.ru$ RewriteRule ^(.*)$ http://site.ru/$1

Site.ru を実際のドメインに置き換えます。

さて、楽しいことに移りましょう。

JL No Doubles プラグインをインストールし、プラグイン マネージャーで有効にします。 標準の Joomla マテリアルのみがある場合は、何も設定する必要はありません。 実際、この一連の簡単な手順は、サイト上の重複の数を根本的に減らすのに役立ちます。

それらが発生する理由と、それらを見つける方法について話しました。 この記事では、重複を削除する方法、または重複が検索結果に表示されないようにする方法について説明します。

それぞれのケースは個別であるため、99% のケースで完全に機能する最も一般的な方法を検討します。 自分で選択することも、組み合わせて使用​​することもできます。

これらの方法はすべて他の CMS システムにも適用できますが、Joomla の機能について詳しく説明します。

これらの例はすべて、J のグローバル設定で標準の SEF と URL リダイレクトを有効にしている場合に有効です。

  • 1.Joomla用プラグイン

URL に混乱がある場合 (カテゴリ エイリアスとメニュー項目の両方からリンクが形成されている場合)、最初にできることは、sherza から Shnodoubles プラグインをインストールすることです。

優れたプラグインで、そのタスクに100%対応します。 インストール後、間違って形成されたリンク (カテゴリ エイリアスから) は、(メニュー項目から) 正しいリンクにリダイレクトされます。 Joomla 2.5 の重複を排除するこの素晴らしいプラグインをダウンロードできます (直接リンク!)

プラグインを有効にすると、一部の重複が単純にくっつきます。

  • 2. Joomla 用の Robots.txt

このファイルは標準の Joomla ディストリビューションに含まれており、ルートにあり、リンク site.ru/robots.txt から入手できます。 主な目的は、サイトのインデックスを作成するために検索ロボットに指示を与えることです。 これを利用すると、サイトの一部の (必要な) セクションを閉じることができます。正規表現もサポートされており、マスクを使用して個々のページを閉じることができます。

ほとんどの場合、私はこの命令を (デフォルトのファイルに含まれているものに加えて) 使用します。

たった一行で大量のゴミが除去されます。 かもね:

  • 印刷資料のページ。URL に print= または tmpl=component も含まれます。
  • RSSフィードへのリンク
  • サイト検索結果ページ
  • ページネーションページも閉じます
  • 使用されている拡張機能に応じて、他のオプションがある場合があります

この行を使用するか、各タイプのページを個別にブロックするかはあなたの裁量に任されていますが、ロボットが多すぎると完全に許容されるとみなされることに注意してください。 また、この行がサイト マップなどの重要なものをカバーしていないことを確認することも重要です。この場合、次のように記述できます。Allow: /path_to_map

robots.txt の使用について詳しくは、Yandex ヘルプ - help.yandex.ru/webmaster/?id=996567 をご覧ください。

  • 3. タグの rel="canonical" 属性

この属性を使用すると、ロボットがどのページをインデックスに含めるべきか、どのページを含めるべきではないかを判断するのに役立ちます。 サイト上に非常によく似たページ (あいまいな重複) があり、たとえば並べ替えオプション (最初から新しいページ、昇順で並べ替え、または 20 ~ 30 で表示するなど) のみが異なる場合は、次のコマンドを使用できます。この属性。 この場合、ランク付けされる正規ページを 1 つ選択し、選択したページを示す残りのページに rel="canonical" を追加する必要があります。そのような文書は検索結果には含まれず、ロボットはそれを認識します。インデックスに含める必要はありません。

Joomla 1.7/2.5 で rel="canonical" を実装する方法の詳細については、「」を参照してください。

  • 4. 301リダイレクト

ページ アドレスを変更したが、ドキュメントがまだ存在している、つまり削除していない場合に使用するのが適切です。 この場合、適切に結合するために、.htaccess で 301 リダイレクトを使用することをお勧めします。検索エンジンは、ドキュメントが新しいアドレスに移動したことを認識します。 この方法では、Web サイトのインジケーター (Tietz と PR) を保存できます。

301 リダイレクトは、重複をマージするために使用することもできます。 たとえば、Joomla 上のサイトのメイン ページのよく知られた複製は、/index.php と、ホーム メニュー項目のエイリアス (/home または /homepage など) です。

これらを貼り付けるのは非常に簡単です。.htaccess を開いて次のように入力します。

リダイレクト 301 /index.php http://site.ru/

または、テンプレートのインデックス ファイルで php への 301 リダイレクトを作成することもできます。

if($_SERVER["REQUEST_URI"] == "/index.php") (
header("場所: /",TRUE,301);
出口();
}
?>

そして、www から www なしへの古典的なリダイレクトを提供します。

リライトエンジンオン
RewriteCond %(HTTP_HOST) ^www.example.ru$
RewriteRule ^(.*)$ http://example.ru/$1

* example.ru をドメイン名に置き換えます。

  • 5.メタロボットタグ

Joomla で重複がインデックス付けされるのを防ぐもう 1 つの方法は、メタ タグを使用することです。

現時点では、この方法は、robots.txt ファイル内の指示を禁止するよりも Google にとって効果的です。 たとえば、印刷ページと at?tmpl=component の重複をインデックス作成からブロックするには、テンプレートのルートにあるcomponent.php ファイルを開き、このタグを .

標準のcom_searchを使用してWebサイトの検索結果ページを閉じるには、テンプレートのindex.phpに条件を追加できます。



ただし、最初に変数を定義する必要があります

$option = JRequest::getVar("オプション", null);

テンプレートの条件についてはあまり深く立ち入りません。それがこの記事の主題ではありません。原則が明確であることを願っています。

  • 6. パネルから URL を削除する

もう 1 つの簡単な方法は、ウェブマスター パネルから手動で削除することです。

Yandex の場合は、アドレス webmaster.yandex.ru/delurl.xml に移動する必要があります。

検索結果から Joomla の重複を排除するためのあまり一般的ではない方法がまだ 1 つ残っていますが、それも検討します。

  • 7. X-Robots タグヘッダー

非常に珍しいタイトルで、海外のオプティマイザーによってよく使用されますが、Google では機能します。 残念ながら、Yandex はこの http ヘッダーのサポートについてまだコメントしていません。

HTTP/1.1 200 OK
日付: 2010 年 5 月 25 日火曜日 21:42:43 GMT
...
X-Robots-タグ: noindex
...

ご覧のとおり、重複した Joomla コンテンツを削除するには多くの方法があります。最適なオプションを選択して状況に適用するには、少なくともそれぞれの仕組みを大まかに理解する必要があります。

トピックの続き:
その他

http://market.yandex.ru/model.xml?hid=418706&modelid=8497927&clid=502 成功した設計と制御、優れた人間工学、長い動作時間、A2DP サポートなど...