Odstráňte duplicitné položky v k2. Ako sa vysporiadať s duplicitnými stránkami v Joomle? Doplnok JL No Doubles na boj proti duplicitným stránkam

Dobrý deň všetkým, ak čítate tento článok, znamená to, že ako mnohí začínajúci web developeri máte úplne legitímnu otázku - ako sa vysporiadať s duplicitnými stránkami v Joomle.

V tomto článku sa pokúsim odpovedať na túto otázku. Najprv si povedzme o nebezpečenstvách výskytu duplicitných stránok na webe, potom sa pozrieme na hotové riešenia na boj proti duplikátom a nakoniec sa pozrieme na alternatívy. spôsoby riešenia duplicitných stránok.

Prečo sa oplatí zbaviť sa duplicitných stránok?

Nie je žiadnym tajomstvom, že Joomla, ako každý iný redakčný systém, v procese svojej práce vytvára identické stránky dostupné na rôznych adresách stránok – duplikáty. Pre návštevníkov vašej stránky sú tieto stránky neškodné, možno ani nevedia o ich existencii.

Avšak duplikáty, ktoré sú pre návštevníkov neškodné, môžu výrazne ovplyvniť pozíciu stránky vo výsledkoch vyhľadávania. Prečo sa to deje?

Predstavme si situáciu – napísali ste niekoľko unikátnych materiálov a zverejnili ich na svojom webe. Vyhľadávacie roboty ich indexovali, všetko je v poriadku, ale po určitom čase vyhľadávací robot nájde duplikáty týchto stránok. Vyhľadávací robot nechápe, že ide o duplikát, pretože ide o dve úplne odlišné stránky, takže pôvodne jedinečný materiál už nie je jedinečný.

V dôsledku objavenia sa veľkého počtu identických stránok (duplikátov) na stránke môže pozícia stránky vo výsledkoch vyhľadávania značne „klesnúť“. Preto sa oplatí čo najrýchlejšie zbaviť duplicitných stránok.

Prečo sa objavujú duplikáty?

Duplikáty v CMS Joomla sa objavujú v dôsledku inštalácie ďalších rozšírení. To ale zďaleka nie je jediný dôvod ich vzniku.

Rovnako častým dôvodom vzniku duplicitných stránok je nepremyslená štruktúra stránok. Ako to môže byť spojené, pýtate sa? Áno, je to veľmi jednoduché – na stránke ste vytvorili niekoľko kategórií s jednou nadradenou kategóriou a umiestnili ste materiály do týchto kategórií. Vo vnútri materiálov vytvárate odkazy na predtým vytvorené materiály atď. Pozrite si napríklad snímku obrazovky:

Ak nevytvoríte ponuku pre kategórie, adresa stránky môže vyzerať takto:

Http://joom4all..php?option=com_content&view=article&id=38&catid=10

Adresa nie je ani zďaleka dokonalá a chceli ste sa zbaviť čísel v paneli s adresou. Na tento účel vytvoríte položky ponuky pre kategórie a materiál. Potom sa adresa ukázala ako atraktívnejšia:

Http://site/sites-creation/basics/intro

A všetko by bolo v poriadku, ale staré adresy stránok nezmizli, zostali ako duplikáty. V dôsledku toho môže mať tá istá stránka niekoľko adries naraz:

Http://site/32-sites-creation/10-basics/38-intro http://site/32-sites-creation/basics/intro http://joom4all..php?option=com_content&view=article&id=38&catid =10

Nie je to príjemná situácia, okrem toho, vyhľadávacie roboty považujú všetky tieto stránky za úplne odlišné.

Spôsoby riešenia duplicitných stránok

Samozrejme, že je najlepšie vyhnúť sa vzhľadu duplicitných stránok v počiatočnej fáze - premyslite si štruktúru stránky vopred, vytvorte potrebné kategórie a položky ponuky. Ako však ukazuje prax, nie každý to robí a časom vyvstáva otázka, ako odstrániť duplikáty z výsledkov vyhľadávania.

Existuje niekoľko možností, ako sa vysporiadať s duplikátmi:

  • Pomocou špeciálnych rozšírení
  • Súbor Robots.txt
  • Presmerovanie 301 v súbore htaccess
  • Na odstránenie nepotrebných adries použite panel správcu webu
  • Komponent presmerovania

Doplnok JL No Doubles na boj proti duplicitným stránkam

Najjednoduchšie a zároveň postačujúce účinný spôsob boja proti duplicitným stránkam Toto je použitie rozšírení. Jedným z takýchto rozšírení je Plugin JL No Doubles.

Plugin je veľmi ľahký a nevyžaduje žiadne špeciálne nastavenia. Všetko, čo musíte urobiť, je stiahnuť si tento plugin, nainštalovať ho a povoliť. Zvyšok práce urobí sám.

Doplnok JL No Doubles odstraňuje duplicitné stránky vo viac ako dvadsiatich komponentoch vrátane komponentu com_content. Môžete nakonfigurovať zobrazenie chyby 404 alebo presmerovania 301 na správnu stránku lokality. Stránka s nastaveniami doplnku vyzerá takto:

Existuje iba päť parametrov na konfiguráciu doplnku:

  • Licenčný kľúč– na aktiváciu doplnku s komponentmi k2, Virtuemart, Zoo.
  • Mnohopočetnosť limitov– nastavenie pre kategórie materiálov Joomla. Presmerovanie môžete nastaviť pri vytváraní odkazov ako /advanced?start=3. Všetko, čo musíte urobiť, je uviesť počet materiálov zobrazených v kategórii.
  • Použite presmerovania 301– môžete povoliť možnosť použiť presmerovanie na správnu stránku alebo (ak je nastavené na „nie“) vydať chybu 404. Ak vaša stránka existuje pomerne dlho a na jej stránky odkazujú iné stránky, potom odporúčam nastaviť presmerovanie, aby ste nestratili váhu stránok.
  • Alias– nastavenie, ktoré nahrádza alias pre odkazy ako komponent/obsah/článok (predvolene domov).
  • Zastavte slová– sú to reťazce nájdené v adrese stránky, ktoré by sa nemali spracovávať.

Vyriešili sme základné nastavenia, teraz prejdeme na kartu „Komponenty“:

Na tejto karte vyberáme komponenty, ktoré sa používajú na stránke a sú dostupné na indexovanie. Štandardne je komponent com_content už vybratý. Nemali by ste vyberať všetky možné komponenty, najmä ak ich nepoužívate, vytvorí to zbytočné zaťaženie vašej stránky.

Pomocou súboru Robots.txt

Bez ohľadu na to, aký skvelý je doplnok na presmerovanie stránok, nebudete sa môcť zbaviť všetkých duplikátov. V tomto prípade môžete vyhľadávacím robotom zakázať indexovanie určitých stránok lokality, inými slovami, zablokovať k nim prístup.

Všetky zložitosti nastavenia súboru Robots.txt sme už rozobrali v tomto článku. V krátkosti poviem len to, že existuje príkaz blokovať časť vás pred „očami“ robota Zakázať .

301 presmerovanie a súbor htaccess

Ďalším bežným spôsobom riešenia duplikátov je nastavenie presmerovania, inými slovami, presmerovanie 301 na správnu stránku. Dá sa to urobiť v súbore " .htaccess ».

Ak chcete vytvoriť presmerovanie, musíte použiť direktívu RewriteRule, ale musíte sa uistiť, že na vašom hostingu je povolený modul mod_rewrite.

Php na webovú stránku, na tento účel do súboru „.htaccess“ za príkazom RewriteEngine On napíšeme nasledujúci riadok:

RewriteRule http://site/index.php$ http://site

Prácu so súborom „.htaccess“ sme podrobnejšie rozobrali v tomto článku.

Komponent presmerovania

Celkom užitočný a zároveň komponent zabudovaný do Joomla 3, ktorý vám umožňuje manuálne nakonfigurovať presmerovanie stránok. Tento komponent využíva na svoju činnosť špeciálny plugin, ktorý je štandardne vypnutý.

Najprv musíte plugin povoliť, našťastie ho nemusíte hľadať medzi ostatnými, pretože po prechode na stránku „Komponenty“ -> „Presmerovanie“ dostanete správu, že je potrebné povoliť plugin a odkaz na jeho aktiváciu.

Po povolení doplnku môžete vytvoriť presmerovanie zadaním počiatočnej (starej) a koncovej (novej) adresy stránky:

Táto metóda je dobrá, keď nie je príliš veľa duplicitných stránok.

Poďme si to zhrnúť

Na záver by som chcel povedať, že hoci je Joomla známa vytváraním duplicitných stránok, existuje veľa spôsobov, ako sa ich zbaviť. Môžete sa sami rozhodnúť, ktorá metóda je najlepšia, ale môžem povedať, že integrovaný prístup k riešeniu tohto problému bude vhodnejší. A mali by ste začať so správnym prístupom k tvorbe štruktúry webu.

Okrem toho stojí za to premýšľať o tom, ako sa zbaviť index.php v paneli s adresou stránky, čo tiež pomôže znížiť počet duplicitných stránok.

Vytváranie a propagácia webstránok na statickom HTML je čoraz menej populárna a väčšina webmasterov prechádza na moderné CMS, najmä Joomla, ktorá okrem svojich výhod dokáže používateľa znepríjemniť v prvom rade duplikovaním stránok. Duplicitné stránky v Joomle sú akousi pohromou správcu webu, aj keď, úprimne povedané, veľa systémov na automatizáciu webových stránok je za to vinných.

Vyhľadajte duplikáty

Najprv sa pozrime, ako to určiť duplicitné stránky a prečo negatívne ovplyvňujú proces propagácie webovej stránky. Najjednoduchší spôsob, ako určiť duplicitu, je použiť rozšírené vyhľadávanie na Yandex, kde do riadku „site“ zadáme váš projekt a do vyhľadávacieho riadku ten alebo ten dotaz. V dôsledku toho môžete vidieť stránky webu podľa ich relevantnosti; existujú aj stránky, ktoré sa navzájom duplikujú. Ešte jednoduchšie je použiť Netpeak Spider, ktorý jedným kliknutím uvoľní stránky a nájde v nich duplikáty.

Druhou dôležitou otázkou je, prečo to vyhľadávače vnímajú negatívne, pretože nejde o úmyselný pokus o oklamanie vyhľadávačov, ale o technické problémy CMS, o ktorých by v zásade roboty mali vedieť. Faktom je, že sú to roboti, ktorí dokážu identifikovať takéto stránky ako úmyselný spam, pretože v skutočnosti sa rovnaký materiál poskytuje na dvoch rôznych adresách. Pokusy o korešpondenciu so službou podpory Yandex nevedú k ničomu, takže by ste sa mali snažiť vyhnúť duplicitným stránkam Joomla.

Odstraňujú sa duplikáty

Disallow: /search/

Disallow: /*.pdf

Disallow: /*print=1

Disallow: /*type=atom

Disallow: /*type=rss

Disallow: /*task=rss

Disallow: /*?sl*

Disallow: /*?sl*

Tým je odrezaná hlavná skladová základňa, do ktorej môže Joomla vkladať duplikáty. Ak niekto naozaj potrebuje otvoriť nejaké stránky, napríklad pre komponent xmap, teda za účelom pridania mapy lokality do panela správcu webu, potom sa potrebné stránky dajú jednoducho otvoriť pomocou príkazu Allow:, ktorý je umiestnený pred Disallow:.

Mne osobne však duplicitné stránky Joomla nedali život

A dlhé vyhľadávania neviedli k ničomu pozitívnemu, okrem manuálneho zatvorenia stoviek odkazov na ľavej strane v súbore robots.txt. Jedného dňa však odpoveď prišla ako vhľad a otvorila mi oči pre tie najjednoduchšie veci, s ktorými som, istotne viem, nebol som jediný, kto sa s tým stretol. Mnohí dnes praktizujú (a robia to správne) propagáciu webových stránok na sociálnych sieťach inštaláciou tlačidiel na integráciu. Zároveň nie každý venuje pozornosť skutočnosti, že niektoré doplnky, keď sú integrované do Twitteru, jednoducho odrežú odkaz a na vyriešenie problému musíte nakonfigurovať alebo nahradiť doplnok, pretože roboty sledujú odkaz „tweet“ a skončia na jeho orezaný pohľad, do ktorého vstupujú z dôvodu svojej elektronickej neznalosti indexovania.

Ukázalo sa, že problém je jednoduchý ako medená panva, je škoda, že sa týmto spôsobom odstráni iba časť odberov, aj keď táto časť ma najviac znepokojovala. Ukazuje sa, že niektoré optimalizačné chyby sa stále vyskytujú v dôsledku kombinácie nedostatkov zo strany správcu webu a CMS, takže sa to dá a malo by sa riešiť. Veľa štastia.

Ak nie ste spokojní s duplikátmi ako /sobstven-sate/eksperiment-seo/383.html, teda skrátenými adresami stránok, použite plugin pre Joomla Shnodoubles, ktorý nájdete na googli alebo mi napíšete do komentárov, s ním som úplne vyriešil problém v priebehu niekoľkých minút. Keď som o tom premýšľal a už som unavený z odhlásenia, navrhujem stiahnuť si nodoubles pre Joomla priamo zo stránky.

Ponúkam tiež video o odstraňovaní duplikátov v Joomle pomocou presmerovania 301 -

Otázky a odpovede

Je možné sa automaticky zbaviť duplikátov?

Neprítomnosť duplikátov je v automatickom režime zaručená na 90 %. Pre Joomlu stačí nakonfigurovať roboty a htaccess, ako aj poradiť si so zlučovaním stránok do hlavnej navigácie. Keď sa však stránka rozšíri, môžu sa objaviť duplikáty, preto ich sledujte cez Netpeak Spider.

Nechápu pavúky PS, že duplikáty na Joomle sú chybou vývojárov?

Prečo vlastník túto chybu neopraví? Ak si kúpite auto s defektom, nebudete sa sťažovať, že vám dopravná polícia dala pokutu za to, že vám nesvietia predné svetlá alebo výfukové plyny nespĺňajú normy? Nemá zmysel kontaktovať podporu, pretože CMS nie je platený.

V dnešnej dobe málokedy pokutujú tvrdo za duplikáty, ale... Ak napríklad duplicitné stránky, máte vo vyhľadávaní 3-4 dokumenty s rovnakým obsahom, ale rôznymi URL, potom si myslíte, že statická váha bude maximálna na každej z nich, alebo sa to rozmaže? Nakoniec je len na vás, aby ste sa rozhodli, či potrebujete dekoratívnu nevyžiadanú webovú stránku alebo či chcete zdieľať informácie s používateľmi a získať za to zisk, ak správne nakonfigurujete CMS.

V tomto článku chcem hovoriť o duplicitných stránkach v Joomle. Na túto tému bolo napísaných veľa článkov, ale zdá sa mi, že stojí za to zaznamenať môj pohľad na tento problém. V tomto článku budem hovoriť o Joomle 3, hoci takmer všetky tipy sú relevantné pre Joomla 2.5.

Problém duplicitných stránok v Joomle siaha hlboko ku koreňom samotného CMS, presnejšie, ani nie v samotnej Joomle, ale v predchodcovi CMS Mambo. Faktom je, že vtedy nemysleli na CNC (ľudsky čitateľné URL) a keď sa problém stal relevantným a bola vydaná Joomla 1.5, namiesto radikálneho prepracovania systému odkazov sa urobila škvrna, s ktorou sa teraz zaoberáme . Áno, vtedy sa to zdalo ako riešenie problému, no ako vidíme, polovičné opatrenie prerástlo do globálneho problému.

Našťastie vývojári Joomla chápu, že existuje problém, ale nechcú prijať radikálne opatrenia, ktoré mimochodom navrhla komunita. Dokonca sa uskutočnila úspešná zbierka na nový router Joomla, ale zmeny majú problém dostať sa do hlavnej distribúcie Joomla.

Čo teda Joomla vlastne robí, aby sa vyhla duplikátom?

Opäť sa vydali cestou polovičných opatrení a zaviedli kanonickú značku, ktorá je navrhnutá tak, aby ukazovala na skutočnú stránku Joomla. Nebudeme hovoriť o tŕnistej ceste implementácie, len podotýkam, že bola naozaj tŕnistá. A poviem, že táto metóda vám skutočne umožňuje znížiť počet duplikátov na stránke, ale problémom je, že táto metóda takmer nefunguje pre komponenty Joomla, pretože vývojári komponentov sa musia postarať o implementáciu podpory, správnu podporu a to nie vždy sa to stane. A aby som bol úprimný, samotná kanonická značka nie je všeliekom.

O tejto jednoduchej a efektívnej metóde vám poviem nižšie.

V skutočnosti vám táto metóda pomôže niekoľkokrát znížiť počet odberov. V mojej praxi mi to umožnilo znížiť dávky 10-krát.

Čo k tomu potrebujeme?

  • Trochu času a ruky

Prvá vec, ktorú nám Google hovorí, je vylúčiť duplicitnú doménu.

Ako to spraviť?

Presmerujte z domény www na doménu bez www. To znamená, že ideme na stránku www.site.ru a sme presmerovaní na stránku site.ru.

Pridajte nasledujúce pravidlo do súboru .htaccess.

RewriteCond %(HTTP_HOST) ^www\.site\.ru$ RewriteRule ^(.*)$ http://site.ru/$1

Nahraďte Site.ru svojou doménou.

Teraz prejdime k príjemným veciam.

Nainštalujte doplnok JL No Doubles a povoľte ho v správcovi doplnkov. Ak máte iba štandardné materiály Joomla, nemusíte nič konfigurovať. V skutočnosti vám táto séria jednoduchých krokov pomôže radikálne znížiť počet duplikátov na stránke.

Hovorili sme o tom, prečo vznikajú a ako ich hľadať. V tomto článku vám poviem, ako môžete odstrániť duplikáty alebo zabrániť ich zobrazovaniu vo výsledkoch vyhľadávania.

Keďže každý prípad je individuálny, zvážime najobľúbenejšie metódy, ktoré fungujú perfektne v 99% prípadov. Môžete si vybrať jeden pre seba alebo ho použiť v kombinácii.

Aj keď sú všetky tieto metódy použiteľné na akýkoľvek iný CMS systém, podrobne sa zastavím pri vlastnostiach Joomly.

Všetky tieto príklady sú platné, ak ste povolili štandardné SEF a presmerovanie URL v globálnych nastaveniach J.

  • 1. Plugin pre Joomla

Prvá vec, ktorú môžete urobiť, ak máte zmätok v adresách URL (keď sa odkazy tvoria z aliasu kategórie aj položky ponuky), je nainštalovať doplnok Shnodoubles zo spoločnosti sherza.

Vynikajúci plugin, zvláda svoju úlohu na 100%. Po jeho nainštalovaní sa nesprávne vytvorený odkaz (z aliasu kategórie) presmeruje na správny (z položky menu). Môžete si stiahnuť tento úžasný doplnok, ktorý eliminuje duplikáty pre Joomla 2.5 (priamy odkaz!)

Po aktivácii pluginu sa niektoré duplikáty jednoducho zlepia.

  • 2. Robots.txt pre Joomla

Tento súbor sa dodáva v štandardnej distribúcii Joomla, nachádza sa v koreňovom adresári a je dostupný na odkaze site.ru/robots.txt. Hlavným účelom je poskytnúť pokyny vyhľadávacím robotom na indexovanie stránky. S jeho pomocou môžete zavrieť niektoré (potrebné) časti webu, podporované sú aj regulárne výrazy - jednotlivé stránky môžete zatvárať pomocou masky.

Najčastejšie používam tento návod (okrem toho, čo je súčasťou predvoleného súboru):

Len jeden riadok vás zbaví veľkého množstva odpadu. To môže byť:

  • stránky pre tlačové materiály obsahujú v URL aj komponent print= alebo tmpl=
  • odkazy na rss feed
  • stránky s výsledkami vyhľadávania
  • zatvorí aj stránkovacie stránky
  • V závislosti od použitých rozšírení môžu existovať aj ďalšie možnosti

Či použijete tento riadok alebo zablokujete každý typ stránky jednotlivo, je na vašom uvážení, ale majte na pamäti, že príliš veľa robotov sa považuje za úplne tolerantných. Tiež sa oplatí uistiť sa, že tento riadok nezahŕňa niečo dôležité, napríklad mapu lokality - v tomto prípade môžete napísať: Allow: /path_to_map

Viac o používaní robots.txt si môžete prečítať v pomocníkovi Yandex - help.yandex.ru/webmaster/?id=996567

  • 3. Atribút rel="canonical" značky

Použitie tohto atribútu pomôže robotovi určiť, ktoré stránky by mali byť zahrnuté do indexu a ktoré nie. Ak sú na webe veľmi podobné stránky (fuzzy duplikáty), ktoré sa líšia napríklad len možnosťami zoradenia - nové od začiatku, alebo zoradiť vzostupne, alebo zobraziť podľa 20-30 atď., potom môžete použiť tento atribút. V takom prípade budete musieť vybrať jednu kanonickú stránku, ktorá bude hodnotená, a pridať rel = „canonical“ k ostatným, ktoré označujú vybranú stránku - takéto dokumenty nebudú zahrnuté do výsledkov vyhľadávania, robot bude vedieť, že sú nemusia byť zahrnuté v indexe.

Viac informácií o tom, ako implementovať rel="canonical" v Joomla 1.7/2.5, nájdete na

  • 4. 301 presmerovanie

Je vhodné použiť, ak ste zmenili adresy stránok, ale dokumenty stále existujú, to znamená, že ste ich nevymazali. V tomto prípade sa pre správne zlepenie odporúča použiť presmerovanie 301 v .htaccess - vyhľadávače budú vedieť, že sa dokument presunul na novú adresu. Táto metóda vám umožňuje uložiť ukazovatele webovej stránky - Tietz a PR.

Presmerovania 301 možno použiť aj na zlúčenie duplikátov. Napríklad dobre známe duplikáty hlavnej stránky webu na Joomle sú /index.php a alias položky ponuky Domov, napríklad /home alebo /homepage

Ich lepenie je celkom jednoduché, otvorte .htaccess a zadajte

Presmerovanie 301 /index.php http://site.ru/

Alebo môžete urobiť 301 presmerovanie na php v indexovom súbore vašej šablóny

if($_SERVER["REQUEST_URI"] == "/index.php") (
header("Umiestnenie: /",TRUE,301);
VÝCHOD();
}
?>

A dám vám klasické presmerovanie z www na bez www

RewriteEngine On
RewriteCond %(HTTP_HOST) ^www.example.ru$
RewriteRule ^(.*)$ http://example.ru/$1

* example.ru nahraďte názvom svojej domény.

  • 5. Meta robots tag

Ďalším spôsobom, ako zabrániť indexovaniu duplikátov v Joomle, je použiť metaznačku:

Momentálne je táto metóda pre Google efektívnejšia ako zákaz pokynov v súbore robots.txt. Ak chcete napríklad zablokovať indexovanie tlačových stránok a duplikátov na?tmpl=component, môžete otvoriť súbor component.php v koreňovom adresári svojej šablóny a zadať túto značku do .

Ak chcete zatvoriť stránky s výsledkami vyhľadávania na webovej lokalite pomocou štandardného com_search, môžete do index.php šablóny pridať podmienku



Najprv však musíte definovať premennú

$option = JRequest::getVar("možnosť", null);

Nebudem zachádzať príliš hlboko do podmienok v šablónach, o tom tento článok nie je, dúfam, že princíp je jasný.

  • 6. Odstránenie adresy URL z panela

Ďalším rýchlym spôsobom je manuálne odstránenie z panela správcu webu.

Pre Yandex musíte prejsť na adresu - webmaster.yandex.ru/delurl.xml

Na odstránenie duplikátov Joomly z výsledkov vyhľadávania stále zostáva 1 nie veľmi populárna metóda, ktorú však tiež zvážime.

  • 7. X-Robots-Tag Headers

Pomerne vzácny titul, ktorý používajú zahraniční optimalizátori častejšie, funguje pre Google. Bohužiaľ, Yandex zatiaľ nekomentoval podporu pre túto hlavičku http.

HTTP/1.1 200 OK
Dátum: Ut, 25. máj 2010 21:42:43 GMT
...
X-Robots-Tag: noindex
...

Ako vidíte, existuje mnoho spôsobov, ako odstrániť duplicitný obsah Joomla; mali by ste aspoň približne pochopiť, ako každý z nich funguje, aby ste si vybrali najvhodnejšiu možnosť a aplikovali ju na svoju situáciu.

Pokračovanie v téme:
Zmiešaný

http://market.yandex.ru/model.xml?hid=418706&modelid=8497927&clid=502 Vydarený dizajn a ovládanie, dobrá ergonómia, dlhá prevádzková doba, podpora A2DP a...