3 moduri în care puteți elimina paginile de blog nedorite de la Google

3 moduri în care puteți elimina paginile de blog nedorite de la Google / Wordpress și dezvoltare web

Ești un credincios în ideea că odată ce ceva este publicat pe Internet, este publicat pentru totdeauna? Păi, astăzi vom elimina acel mit.

Adevărul este că, în multe cazuri, este posibilă eradicarea informațiilor de pe Internet. Sigur, există o înregistrare a paginilor web care au fost șterse dacă căutați în Machine Wayback, nu? Da, absolut. Pe Mașina Wayback există înregistrări ale paginilor web care se întorc de mai mulți ani - pagini pe care nu le veți găsi cu o căutare Google, deoarece pagina web nu mai există. Cineva a șters-o sau site-ul a fost închis.

Deci, nu mai e nimic în jur, nu? Informația va fi pentru totdeauna gravată în piatra de Internet, acolo de generații pentru a vedea? Nu exact.

Adevărul este că, deși ar putea fi dificil sau imposibil să ștergi știri importante care au proliferat de pe un site de știri sau de la un blog la altul, ca un virus, este de fapt destul de ușor să eradici complet o pagină web sau mai multe pagini web din toate înregistrările de existență - pentru a elimina acea pagină atât pentru motoarele de căutare, cât și pentru Machine Wayback Noua mașină Wayback vă permite să călătoriți vizual înapoi în timp Internet Noua mașină Wayback vă permite să călătoriți vizual înapoi în Internet Timpul pare că, 2001, proprietarii de site-uri au decis să distrugă back-end-ul bazat pe Alexa și să-l redesigneze cu propriul cod sursă. După efectuarea testelor cu ... Citește mai mult. Există o înțelegere, desigur, dar vom ajunge la asta.

3 moduri de a elimina paginile de blog de pe net

Prima metodă este cea pe care o utilizează majoritatea proprietarilor site-urilor web, deoarece nu cunosc mai bine - ștergând pur și simplu paginile web. Acest lucru s-ar putea întâmpla deoarece ați realizat că aveți conținut dublu pe site-ul dvs. sau pentru că aveți o pagină pe care nu doriți să apară în rezultatele căutării.

Pur și simplu ștergeți pagina

Problema cu ștergerea în întregime a paginilor de pe site-ul dvs. web este că, de vreme ce ați stabilit deja pagina de pe net, este posibil să existe linkuri de pe site-ul dvs., precum și linkuri externe de la alte site-uri către acea pagină. Atunci când ștergeți, Google recunoaște imediat acea pagină a dvs. ca pagină lipsă.

Prin urmare, la ștergerea paginii dvs. nu ați creat doar o problemă “Nu a fost gasit” răsfoiți erorile pentru dvs., dar ați creat, de asemenea, o problemă pentru oricine a fost vreodată legat de pagină. De obicei, utilizatorii care ajung pe site-ul dvs. dintr-unul din aceste link-uri externe vor vedea pagina dvs. 404, care nu este o problemă majoră, dacă utilizați ceva asemănător cu codul 404 personalizat Google pentru a oferi utilizatorilor sugestii sau alternative utile. Dar, ați crede că ar putea exista mai multe modalități grațioase de ștergere a paginilor din rezultatele căutării, fără a da naștere tuturor celor 404 pentru legăturile de intrare existente,?

Ei bine, sunt.

Eliminați o pagină din rezultatele căutării Google

Mai întâi de toate, trebuie să înțelegeți că, dacă pagina web pe care doriți să o eliminați din rezultatele căutării Google nu este o pagină de pe site-ul dvs., atunci nu aveți noroc dacă nu există motive legale sau dacă site-ul dvs. a postat personal informații online fără permisiunea dvs. Dacă este cazul, utilizați instrumentul de depanare a depanării Google pentru a trimite o cerere de eliminare a paginii din rezultatele căutării. Dacă aveți un caz valid, ați putea găsi un succes în ceea ce privește eliminarea paginii - bineînțeles că ați putea obține chiar mai mult succes doar contactând proprietarul site-ului Cum să eliminați informațiile personale false pe Internet Cum să eliminați informațiile personale false pe Internet Citiți mai multe așa cum am descris în 2009.

Acum, dacă pagina pe care doriți să o eliminați din rezultatele căutării se află pe propriul dvs. site, aveți noroc. Tot ce trebuie să faceți este să creați o robots.txt fișier și asigurați-vă că ați respins fie pagina specifică pe care nu o doriți în rezultatele căutării, fie întregul director cu conținutul pe care nu doriți indexat. Iată cum arată blocarea unei singure pagini.

User-agent: * Disallow: /my-deleted-article-that-i-want-removed.html

Puteți bloca boturile din accesarea cu crawlere a întregilor directoare ale site-ului dvs. după cum urmează.

User-agent: * Disallow: / content-about-personal-stuff /

Google are o pagină de suport excelentă care vă poate ajuta să creați un fișier robots.txt dacă nu l-ați creat niciodată înainte. Acest lucru funcționează extrem de bine, așa cum am explicat recent într-un articol despre structurarea tranzacțiilor de sindicalizare Cum să negociați oferte de sindicalizare și să vă protejați clasamentul de căutare Cum să negociați sindicalizarea și protejarea clasamentului dvs. de căutare Sindicalizarea este toată furia în aceste zile. Dar dintr-o dată ați putea găsi că partenerul de sindicalizare este listat mai sus decât dvs. în rezultatele căutării pentru o poveste pe care ați scris-o inițial! Protejați-vă clasamentele de căutare. Citește mai mult, astfel încât să nu te rănească (cer partenerilor de sindicare să nu permită indexarea paginilor în care ești sindicalizat). Odată ce partenerul meu de sindicare a fost de acord să facă acest lucru, paginile care au fost duplicate din blogul meu au dispărut complet din listele de căutare.

Numai site-ul principal apare pe locul al treilea pentru pagina în care ne afișează titlul, dar blogul meu este listat acum atât la primul, cât și la cel de-al doilea loc; ceva care ar fi fost aproape imposibil dacă un site web de autoritate mai mare a lăsat pagina indexată indexată.

Ceea ce mulți oameni nu-și dau seama este că acest lucru este, de asemenea, posibil să se realizeze cu Arhiva Internet (Machine Wayback), de asemenea. Iată liniile pe care trebuie să le adăugați în fișierul dvs. robots.txt pentru ca acest lucru să se întâmple.

User-agent: ia_archiver Disallow: / sample-category /

În acest exemplu, le spun Arhivei Internet să elimine orice din subdirectorul de categorii de eșantioane de pe site-ul meu de pe Machine Wayback. Arhiva de Internet explică modul în care se face acest lucru pe pagina de ajutor a excluderii. Și aici explică acest lucru “Arhiva de Internet nu este interesată să ofere acces la site-uri Web sau alte documente Internet ale căror autori nu doresc ca materialele lor să fie colectate.”

Aceasta zboară contrar convingerii obișnuite că orice postat pe Internet devine aruncat în arhivă pentru toată eternitatea. Nu - webmasterii care dețin conținutul pot avea în mod special conținut eliminat din arhivă utilizând abordarea robots.txt.

Eliminați o pagină individuală cu etichete Meta

Dacă aveți doar câteva pagini individuale pe care doriți să le eliminați din rezultatele Căutării Google, de fapt nu trebuie să utilizați deloc abordarea robots.txt, ați putea adăuga pur și simplu corect “roboți” meta-tag pentru paginile individuale și spuneți robotilor să nu indexeze sau să urmeze link-uri pe întreaga pagină.

Ai putea folosi “roboți” meta de mai sus pentru a opri robotul de la indexarea paginii sau puteți spune în mod explicit robotului Google să nu indexeze astfel încât pagina să fie eliminată numai din rezultatele căutării Google, iar alte roboți de căutare ar putea accesa în continuare conținutul paginii.

Depinde de dvs. cum vă doriți să gestionați ce fac robotii cu pagina și dacă pagina este listată sau nu. Pentru doar câteva pagini individuale, aceasta poate fi abordarea mai bună. Pentru a elimina un întreg director de conținut, mergeți cu metoda robots.txt.

Ideea de “Eliminarea” Conţinut

Acest tip transformă întreaga noțiune “ștergerea conținutului de pe Internet” pe capul lui. Din punct de vedere tehnic, dacă eliminați toate propriile dvs. linkuri către o pagină de pe site-ul dvs. și îl eliminați din Căutarea Google și din Arhiva de Internet utilizând tehnica robots.txt, pagina este pentru toate intențiile și scopurile “eliminat” de pe internet. Lucrul cool este însă că, dacă există legături existente către pagină, acele link-uri vor funcționa și nu veți declanșa 404 de erori pentru acei vizitatori.

E mai mult “blând” abordare a eliminării conținutului de pe Internet fără a afecta în totalitate popularitatea legăturilor existente între site-ul dvs. pe Internet. În cele din urmă, modul în care gestionați conținutul colectat de motoarele de căutare și de arhivele de internet depinde de dvs., dar amintiți-vă întotdeauna că, în ciuda a ceea ce spun oamenii despre durata de viață a lucrurilor postate online, este cu adevărat sub controlul dvs..

Explorați mai multe despre: Google, Căutare Google, SEO, Web Design, Instrumente pentru webmasteri.