Blekko mai multe blocuri de „spam“ Domenii: 1,1 milioane dintre ei

A+ A-

Motor de căutare Blekko a anunțat că a blocat acum 1,1 milioane de site-uri web din rezultatele căutării sale, folosind un nou sistem îl numește „AdSpam,“ și noi pagini de pe orice site web nu vor fi adăugate în cazul în care nu trec repliere.

Blocarea spam înainte de a ajunge în

Din comunicatul de presă Blekko:

„Aceasta noua tehnologie va bloca spam-ul înainte de a apărea vreodată într-o pagină cu rezultate de căutare“, a declarat Rich Skrenta, CEO al Blekko. „Am identificat în mod algoritmic, mai multe semnale de spam pentru fiecare pagină în indexul nostru. Eliminarea acestor domenii din indexul nostru a curățat dramatic la rezultatele noastre de căutare „.

Și de la blog al companiei:

Astăzi, vom lua urmatorul pas uriaș înainte cu lansarea noului algoritm AdSpam Blekko lui. Această nouă tehnologie va schimba în mod dramatic de căutare. Este primul algoritm de căutare creat vreodată pentru a găsi spam-ul, mai degrabă decât rezultate rang. Algoritmul este special conceput pentru a recunoaște pagini care sunt spam și a le elimina înainte ca acestea să apară vreodată în rezultatele căutării.

Asta e interesant, această idee de a bloca paginile care conțin spam înainte de a fi adăugate la un index de căutare. Este posibil să fi fost făcut înainte, dar dacă este așa, nu-mi amintesc de ce serviciu. Desigur, aceasta nu a fost niciodată ceva suficient pentru mine să amintesc demn de menționat. Dacă vă păstrați spam-ul în întregime, potențial, care face pentru rezultate mai curate.

Apoi, din nou, este, de asemenea, ceva care este mult mai probabil să beneficieze Blekko decât Google sau Bing. Motivul este că ambele aceste motoare de căutare au algoritmi de căutare mult mai matur decât Blekko, astfel încât acestea s-ar putea face deja o treabă mai bună de a păstra spam-ului din cele mai importante rezultate, chiar dacă paginile de tip spam sunt incluse în index de căutare generală - care este ca o carte mare de toate paginile web pe care le-am colectat.

Mai important, atât Google și Bing au resurse uriașe în cazul în care indexarea un milion sau chiar un miliard de pagini de spam nu lasă într-adevăr mai puțin „cameră“ pentru a stoca „bun“ chestii. Ei au mii de servere. Depozitarea pentru ei este relativ ieftină. Dar pentru Blekko, fiecare pagină de spam pe indici este mai costisitoare.

În ceea ce privește „AdSpam“ numele - e groaznic. Am înțeles că vine de la ideea că acestea sunt pagini încărcate cu anunțuri - dar mi se pare destul de confuz.

Anterior, în „Banat pe Blekko“

Luna trecuta, Blekko primit atenție prin interzicerea de 20 de „spam“ site-uri din indexul său. De la acoperirea atunci:

Bogat Skrenta, CEO-ul Blekko a confirmat interdicția cu noi astăzi. El ne-a spus Blekko a decis să interzică „primele 20 de site-uri de tip spam din indexul Blekko lui în întregime, bazată pe utilizatorii noștri faceți clic / spam pe rezultate.“ Aceasta include ehow.com, unul dintre venituri de top site-uri generatoare de web al companiei Demand Media.

Site-urile?

  • ehow.com
  • experts-exchange.com
  • naymz.com
  • activehotels.com
  • robtex.com
  • encyclopedia.com
  • fixya.com
  • chacha.com
  • 123people.com
  • download3k.com
  • petitionspot.com
  • thefreedictionary.com
  • networkedblogs.com
  • buzzillions.com
  • shopwiki.com
  • wowxos.com
  • answerbag.com
  • allexperts.com
  • freewebs.com
  • copygator.com.

Dar asteapta. Sunt acestea primele 20 de site-uri de spam sau, după cum a declarat eliberarea Blekko astăzi, „Top 20 ferme de conținut.“ Ambele. Nici. Este confuz.

Spam-ul este în ochiul Motorul de cautare Medaliatul

spam-ul motorului de căutare este, indiferent de un motor de căutare decide să fie. De exemplu, atât Google și Bing ar lua în considerare, în general, pagini care „deghizați“ - spectacol de conținut pentru utilizator care este diferit de ceea ce vezi crawler lor automate - pentru a fi spam. Ambele sunt de acord asupra multor alte tactici care ar fi considerate spam, dar ele nu pot conveni cu precizie. De asemenea, nu va sunt de acord cu Blekko.

Practic, nici unul dintre site-urile de mai sus, de la analiza mea rapidă, ar fi considerat spam de către oricare dintre Google sau Bing. Desigur, Google a cauzat unele dintre ele să-și piardă în clasamentul recente update Farmer / Panda. Dar asta nu a fost pentru că au fost spam-ul Google. A fost pentru că au avut un conținut că noul algoritm a decis să nu mai recompensa cât și în trecut.

Pe scurt, conținutul de slabă calitate nu spam-ul egal, nu la Google sau Bing. E doar ceva ce ei nu vor fi clasificate ca foarte, care este exact ceea ce algoritmii lor ar trebui să facă.

Cu lista de blocare inițială Blekko lui, a decis că site-urile au fost spam în baza rapoartelor de utilizator, indiferent dacă aceste site-uri a încălcat orice orientări tradiționale de spam motor de căutare. Cu cea mai recentă mișcare, Blekko este în continuare decide că o calitate scăzută este egal cu spam. Din nou, de la post:

Deci, ce este exact este AdSpam? Pe scurt, acesta este un algoritm de învățare mașină care examinează pagini pentru semnale de spam specifice - prezența mai multor poziții de anunțuri de afișare pe o singură pagină și subțire la conținutul zero.

Rezultatul final al abordării Blekko versus Google ar putea fi la fel. Google încearcă să păstreze conținut „superficial“ să nu apară pentru mai multe căutări, chiar dacă paginile sunt printre cele pe care le-a colectat. Blekko este, de asemenea, cu scopul de a menține conținutul superficial afară - dar, spre deosebire de Google, se aplică „spam“ eticheta astfel de conținut și împiedică indexarea în primul rând.

Ce plecat acum?

De-a lungul la New York Times, Claire Cain Miller a avut o bună parte despre mutarea Blekko și dacă site-uri bune ar putea fi afectate. Nu, spune Blekko:

Desi se pare ca multe site-uri legitime ar putea fi considerate spam în cadrul acestui algoritm - ziare acoperă o gamă largă de subiecte, de exemplu, și mulți bloggeri pot fi scriitori amatori, dar sunt experți în domeniile lor - Dl Skrenta a spus că atunci când a pieptănate prin mii de site-uri care algoritmul interzise, ​​el a găsit doar două rezultate fals pozitive.

Exemple de site-uri Blekko interdicții acum: cheap-refrigerators.net, best-weddinggifts și Boston.diningguide.com.

Nu-l ajuta?

Eu nu am făcut nici o testare pe scară largă. Dar observând că numele site-ului cheap-refrigerators.net de mai sus, care a fost confirmată ca fiind eliminată - „Frigidere de cumparare Sfaturi“ - M-am gândit o căutare pe acest subiect ar putea fi interesant:

Puteți da clic pentru a mări imaginea. Am eliminat anunțul care a fost în partea de sus a rezultatelor din ambele Blekko și Google, astfel încât să vă puteți concentra pe primele cinci rezultate editoriale. Ia mea:

Blekko

  1. OK, dar de scurtă și de bază
  2. Irelevant - trebuie să căutați mai departe în site-ul pentru a obține sfaturi
  3. Bune sfaturi de bază de la retailer
  4. Conținutul subțire care se leagă doar la conținut mai subțire
  5. despre filtre de apa pentru frigidere - irelevanți

Google

  1. Bine, articolul substanțial cu mai multe părți
  2. Sfaturi bune, ceea ce poate conduce la comentarii suplimentare
  3. sfaturi bune
  4. sfaturi bune de la Consumer Reports, un brand important de încredere
  5. sfaturi OK, în vârstă de aproximativ trei ani

Ne pare rău, Blekko - Nu pot spune că dropping că site-ul frigider, mult mai puțin alte 1 milion sau astfel încât alte site-uri, te-a ajutat la toate împotriva Google pentru această interogare specială. Utilizarea / comentarii slashtag a ajutat - a ajuns una dintre cele mai bune site-uri pe care Google a trebuit să fie enumerate mai întâi. Dar celelalte trei site-uri bune pe care Google a avut în primele cinci rezultate nu au arătat.

Mai mult decât atât, cele mai multe căutătorii tipice nu sunt de gând să folosească slashtags - și există chiar și mai puțin un motiv pentru a le folosi în cazul în care aceeași căutare de la Google aduce rezultate mai bune, nu este necesar slashtag.

Factorul uman

Blekko post-lui, de asemenea, spune:

Spre deosebire de algoritmii utilizați de către alte motoare de căutare, AdSpam este utilizat în conjuncție cu custozi uman pentru a detecta pentru a continua războiul de pe spam.

Adevărat - Blekko este de a face uz de eforturi umane pentru a decide ce este bine și rău. În special, Blekko recent un parteneriat cu stivă de schimb (fosta stivă Overlow) pentru custozi de programare și subiecte tehnice.

Asteptati Google pentru a împinge înapoi pe întreg „nu are nici un om“ aspect, cu toate acestea. Se face acest lucru înainte, ultima dată când ambele Mahalo și Search Wikia au încercat acel unghi. Google a subliniat că are revizori, care servesc ca un fel de „dublu-cec“ pe algoritm de computer schimbă-l face, de exemplu.

Google a subliniat acest lucru din nou, recent, atunci când a făcut Update Farmer, pentru a sublinia faptul că schimbarea pe bază de calculator părea să fie susținută de datele umane urmărește să model. Google a sugerat, de asemenea, că ceea ce oamenii bloca utilizarea extensiei sale personale Chrome Blocklist ar putea fi datele care sunt utilizate în algoritmul său de căutare, în viitor.

Cu toate acestea, Google are nimic ca curation slashtag care oferă Blekko. Acestea fiind spuse, Blekko trebuie încă să demonstreze că acest custozi se transforma in rezultate de calitate mai mare, care atrag utilizatorii semnificative de la Google, Bing mult mai puțin. Dar, pe frontul de PR, nu există nici o îndoială că se mută Blekko sunt menținerea presiunii pe Google pentru a îmbunătăți, de asemenea.

Mai multe informatii

Nu am avut o șansă de a vorbi cu Blekko mai multe despre sistemul, așa cum eu sunt în prezent, la SMX West conferința noastră de căutare de marketing în San Jose. Blekko - împreună cu Google și Bing - este de a lua parte la „Poliția Spam“ noastră și „Cere motoarele de căutare“ sesiuni de mâine, așa că mă aștept mai specifice sub-capota detalii va ieși din asta. Stay tuned (și urmăriți, de asemenea, pentru o acoperire legate pe TechMeme). De asemenea, a se vedea articolele de mai jos pentru mai multe detalii cu privire la unele din lucrurile pe care le-am menționat mai sus.


Ads

Acțiune