
Paskutiniu metu praktiškai nebeskaitau RSS, bet šiandien užkliuvo vieno iš Google paieškos strategų balandžio 2 dienos įrašas kaip geriausiai pašalinti savo puslapius iš Google indekso. Kad suprastumėte ką turiu omenyje trumputė citata:
If you have a lot of urls that you don’t want in Google anymore, you can make the pages return a 404 and wait for Googlebot to recrawl/reindex the pages. This is often the best way.
Google genijai priėmė dar vieną genialų sprendimą – pamatei 404 ir išmetei puslapį iš Google indekso. Jie gal kažkokiame idialiame pasaulyje gyvena, kur atsitiktinių 404 klaidų niekada nebūną? Nes mano pasaulyje toks scenarijus labai įmanomas. Ne kasdien, bet jeigu parašysiu naują įrašą ir sugalvosiu atnaujinti kokį nors įskiepį, tai teoriškai įmanoma, kad vietoje įrašu matysis 404 klaida. O tuo metu Google kirminas kaip tiks ateis indeksuoti mano svetainės. Ir kur tik nepažiūrėsi visur 404. Valio – daugiau indeksuoti nebereikės!
To įrašo komentaruose kažkas artimas Google Analitics komandai sako, kad tų 404 turi pasitaikyti bent keletą Google kirmino apsilankymo metu, bet problema vistiek išlieka – jeigu aš nepastebėsiu, kad kai kurie puslapiai kurį tai laiką nebuvo pasiekiami tai dingsiu ir iš Google indekso. Galite sakyti pats kaltas ir iš dalies būsite teisūs, bet tai vistiek kodėl Google nenori tobulinti savo įrankių ir prisigalvoja išeičių, kurios tik pridarys rūpesčių ir niekam naudos neatneš?
Čia turbūt naujo vado įtaka? Kažin kokių dar siurprizų galime tikėtis iš Google artimiausiu laiku…
hmm.. gal tikrins tarkim vieną dieną, po to kitą dieną, jei dar tą pati klaida ir pašalino, o ne iškarto ?
nes būtų nelogiška, kad iškarto šalina
Man irgi būtų įdomu sužinoti teisybę. Nes vienas iš vedančiųjų Google paieškos specialistų tiesiog tėškė, kad užtenka Google kirminui rasti 404 ir dingsi iš indekso. Kai paprasti mirtingieji komentaruose suteikia daugiau informacijos nei Matt. Teisybė kažkur per vidurį… O visai gali būti, kad teisybės niekas nežino – Google algoritmas jau toks komplikuotas, kad… žodžiu…
Toks jausmas, kad Google patys tiksliai nepasako arba nežino kaip puslapiai indexuojami. Čia iš serijos gerai, kol veikia
Man irgi labai dažnai atrodo, kad Google nebėra žmonių suprantančių kurlink eina kompanija, ko ji siekia ir kaip visa ta košė verda
Galbūt google bando sutaupyti išteklius, kuriuos naudoja google robotai. Jei robotai pastoviai indexuoja jau nebeegzistuojančius puslapius sunaudojama nemažai išteklių veltui.
Google indeksuoja keletą kartų per valandą netgi tokius mažiukus kaip aš. Tai resursų jiems tikrai užtenka. Radai 404, tai nesilankyk kurį laiką. Galima pažeminti paieškos rezultatuose, bet ne visai pašalinti iš indekso.
O kuo šis būdas geresnis už http://archive.netdummy.com/netdummy-31-20070808IndicatingWebPageExpiration.html ? Ar yra kokių esminių skirtumų?
O kas nors realiai tai naudojo? O jeigu ir naudojo, ar kas tebesinaudoja?
Tam ir yra skirtas error reportingas ir htaccess, nusikreipi kai neveikia į 404 puslapį ir tenais įrašinėji kiek žmonių į tokį dalyką ir iš kur patenka
Jeigu žinai, kuo tai gresia tai vienaip ar kitaip gali pasiruošti tam. Bet kai Google sugalvoja ir pradeda naudoti standartines klaidas savo algoritmuose tai… nieko gero
O kur tamstos įrašų daugiau?
Čia paskutinis. Daugiau nebebus.
Naujų Įrašų šiame bloge nebebus,jei teisingai supratau ? Pasakyti ,jog apmaudu ir gaila,tai nieko nepasakyt…
Bus. va už kelių dienų tikrai bus. Ir šiaip bus
Ok,lauksim,o jau buvau pamanęs kad dar vieno gero blogo neliko.
Na toks kaip buvęs greičiausiai jau nebebus. Daugiau rašysiu kas skaudą. Jeigu netingėsiu
Busi dar neįdomesnis nei buvai?
Na, tu čia lygioje vietoje sliekų ieškai. Google sprendimas labai logiškas ir teisingas! Kodėl?
Na, visų pirma G visada teigė, kad pirmas jų kriterijus yra kiek jų pateikiamas paieškos rezultatas bus naudingas _ieškotojui_. Taigi, aš suradau kažkokį tavo puslapį, einu pagal nuorodą ir gaunu 404. Kokia mano pirma reakcija? „Ir kurių galų G mane čia atsiuntė?!“ G tai, aišku, nepatinka ir, kad mano nepasitenkinimas nepasikartotų, jie tokią nuorodą šalina iš rodomų rezultatų (sako, kad iš indekso, nes taip paprasčiau pasakyti, ar iš tiesų iš ten dingsta, turiu didelių abejonių). Nori pasakyti šitame nėra logikos?
Antras dalykas, webmasteriams laikas nuo laiko būna poreikis pašalinti tam tikrus puslapius iš indeksų. Pradedant pasibaigusiomis akcijomis ir baigiant po saito nulaužimo ir bileko pridėliojimo. Nori pasiūlyti G atidaryti telefoninę liniją, kur būtų galima paskambinti ir paprašyti ką nors ištrinti? Prieš tai gavus svarių įrodymų, jog saitas išties priklauso tau? Per brangu tai! G visur, kur gali, tokius dalykus palieka technologijoms. Ir standartinis kelias kaip pasakyti, kad šiuo adresu nieko nėra/nebėra yra 404.
Dabar apie tokius vargšiukus, kuriems saitas sugriūna ir nueina 404 klaidomis. Nerimti tokie saitai. Rimti turi stebėjimus, kas darosi, pakeitimai ant testinių sistemų pirma praeina. Galų gale, aš manau, kad ištaisius tas klaidas dėl kurių 404 puslapiai lenda, grįš tavo puslapiai į indeksą ir į rezultatus. Tam užtenka standartinio radimo perindeksuojant. O gali būti, kad dar bus įvertinta ir tai, kad jie kažkada indekse buvo. Greičiausiai bus rodomi žemiau, bet tai natūralu, nes saitas tai nerimtas
Nereikia telefoninės linijos – gi yra Google Webmaster Tools – ten daug ką galima. Va ten galėjo ir palikti galimybė pašalinti iš indekso nepageidaujamus puslapius.
O 404 naudojimas kažkam kitam nei pasakyti, kad toks puslapis neegzistuoja yra standartų nesilaikymas. Jeigu aš norėsiu pranešti, kad puslapio nebėra, tai padarysiu 301 – redirect.
O dėl grįžimo, tai jie didelis kalusiams ar jie bus rodomi ar papuls į kokią smėlio dėžę.
Žodžiu čia apie tai, kad Google naudoja interneto nusistovėjusius standartus ne pagal paskirtį.