cargando menú...

inicio

temario

calendario

tutoría

notas

cambios

comunica

servicios

buscar

salir
Situación en la jerarquía: Posicionamiento -> Segunda parte -> Unidad P239 -> Artículo
Master en Buscadores
Artículo P239. Como evitar las penalizaciones de los buscadores: Spam buscadores
Autor: Mari Carmen Marcos

Usuario: . Tipo de página: contenido. Fichero: pag316.htm
[imprimir] · [exportar a Openoffice]

Citación recomendada: Mari Carmen Marcos. Artículo P239. Como evitar las penalizaciones de los buscadores: Spam buscadores [en línea]. En Cristòfol Rovira; Lluís Codina (dir.). Máster en Buscadores. Barcelona: Área de Ciencias de la Documentación. Departamento de Periodismo y de Comunicación Audiovisual. Universidad Pompeu Fabra, 2007. http://www.masterenbuscadores.com [Consulta: 14 febrero 2008]

Sumario
1. Introducción
2. Enlaces recibidos
3. Textos de las páginas web
4. Link-bombing
5. Cloacking
6. Conclusiones
7. Bibliografia

1. Introducción

Como suele decirse, “hecha la ley hecha la trampa”. Es decir, conocer cómo hacen los buscadores los rankings de resultados lleva a algunas personas a aplicar este conocimiento de forma no ética, intentando engañar a los buscadores para conseguir mejores posiciones. La intención de estas personas es que cuando una persona realice una búsqueda en un buscador por un determinado término, su sitio web aparezca entre los primeros puestos, aunque en realidad el sitio web no trata sobre ese tema o no tiene calidad suficiente para que los buscadores lo consideren tan relevante como para colocarlo en una buena posición.

Un ejemplo de spam en buscadores: Pedro busca páginas web en las que descargarse de forma gratuita un fondo de escritorio, y escribe en Google <descargar fondo escritorio>. Los dos primeros resultados son sitios que sí le ofrecen esta opción. En tercera posición aparece el sitio web de la empresa SoftHigh, dedicada a la venta de software por Internet, y que no da este servicio que Pedro quiere. ¿Por qué aparece SoftHigh en tercera posición si no contiene lo que el usuario ha pedido? Porque la empresa SoftHigh ha realizado algunas técnicas engañosas y ha hecho creer a los buscadores que su sitio web tiene la posibilidad de descargar fondos de escritorio. ¿Cómo? Veamos algunas formas de “engañar” a los buscadores, aunque no olvidemos que el engaño no tardará en ser descubierto y eso supondrá recibir una sanción que consistirá en ser relegado a una mala posición.

Podemos decir que todo lo que sea utilizar las técnicas de SEO para forzar el posicionamiento de un sitio que de forma natural no lo merece se considera posicionamiento no ético, y si los buscadores lo detectan sancionan al sitio web quitándole posicionamiento en sus resultados. Frente a las técnicas que abusan de los algoritmos de ranking de motores, éstos desarrollan continuamente mejoras para luchar contra ellas (“adversarial retrieval information”).

Actividad: Utilice un buscador de blogs como Google Blog Search o Technorati y realice una consulta sobre “blackhat seo”. De los resultados obtenidos escoja un post en el que se explique en qué consisten estas prácticas y/o qué técnicas se consideran poco éticas.

2. Enlaces recibidos

Como los buscadores valoran positivamente recibir muchos enlaces, las personas que usan técnicas “black hat” buscan formas fáciles de conseguir muchos enlaces. Las más habituales son:

  • Redes de dominios (granjas de enlaces)

  • Compra de enlaces

  • Comentarios en foros y blogs de forma automática

El problema que tienen estos enlaces es que no son naturales sino forzados, por ejemplo incluyen su sitio web en “granjas de enlaces” (link farm), esto es, en sitios web creados específicamente para colocar enlaces a otras páginas, sin ningún tipo de contenidos. O pagan para que determinado sitio web bien posicionado ponga un link a su página. O envían de forma automática mensajes a foros y a blogs poniendo un link a la página en cuestión, por ejemplo:


La manera que los buscadores tienen para detectar estas prácticas es fijarse en si los contenidos de los sitios que ponen el enlace están relacionados con las páginas enlazadas. Si no hay coincidencia, sospechan que se trata de un SEO forzado. Igualmente, si detectan que un sitio web recibe un gran número de enlaces en muy poco tiempo, también sospechan de que se esté poniendo en práctica una de estas acciones comentadas.

Actividad: Ojee distintos blogs, no importa cuáles, y localice spam en ellos, es decir, comentarios de usuarios que no dicen nada pero sí ponen su URL . Para encontrar blogs en los que ocurra esto le recomendamos que busque blogs personales (no institucionales) ya que el mantenimiento suele estar más descuidado y habrá menos posibilidades de que hayan borrado el spam.

3. Textos de las páginas web

Puesto que los buscadores miran con atención los textos que aparecen en las páginas web, una forma de “engañar” al robot es ofrecerle textos que las personas no verán. Las formas más habituales de estas prácticas son:

  • Ocultar texto escribiendo con un color de fuente igual al color de fondo, de forma que las personas no lo veremos pero sí los robots, y lo indexarán, por ejemplo que el color de la letra sea rojo (#FF0000) y el color de fondo también (#FF0000), el resultado sería este:


pero en realidad el texto está ahí i podemos verlo si lo seleccionamos con el ratón:


  • Usar un tamaño de letra muy pequeño que las personas apenas puedan leer, en cambio a los robots esto no les influye y lo indexarán, por ejemplo:


  • Abusar de las palabras para las que se quiere posicionar la página, repitiéndolas de forma poco natural con una alta densidad para que el robot crea que el sitio trata de ese tema que tanto se repite en sus textos, por ejemplo:


Cualquiera de estas 3 formas son fácilmente detectables por los buscadores, por lo que su uso no servirá de mucho para el SEO.

Actividad: Pruebe a buscar en alguno de los grandes buscadores palabras muy comunes como gratis, software, alquiler, etc . y encuentre un ejemplo de repetición de palabras como el mostrado en el ejemplo.

4. Link-bombing

El link-bombing es uno de los fenómenos más curiosos que se ha producido en SEO desde que Google comenzó a utilizar la popularidad como criterio de gran peso en el ranking de resultados. Primero se dio en Google y poco a poco se fue extendiendo a otros buscadores. Veamos de qué se trata.

Con un criterio lógico, los buscadores dan un gran peso a las palabras que otras páginas web utilizan para poner un enlace a otras. Por ejemplo, si en una página web hay un link con este aspecto: Ordenadores , lo que esperamos es que al clicar sobre él nos lleve a una página sobre ordenadores, o al menos de informática. Eso es lo normal en la Web. Aprovechándose de esta idea, algunas personas comenzaron a usar de forma distinta y fraudulenta para el SEO este criterio y usaron palabras que no correspondían con los contenidos del sitio al que lindaban. Los casos más conocidos de este efecto que podemos considerar de protesta fueron las búsquedas “miserable failure” y “ladrones”: EN el primer caso, la página web a la que llevaba esta búsqueda era la página del presidente de Estados Unidos George Bush, y en el segundo caso la búsqueda daba como primer resultado el sitio web de la Sociedad General de Autores y Editores de España (SGAE). Como se puede imaginar, ni en el sitio web de Bush aparecía la expresión “miserable failure” ni en el de la SGAE la palabra “ladrones”, en cambio estaba posicionados para sendas búsquedas. La forma de conseguir ese buen puesto fue que estos sitios recibieron multitud de links desde otras páginas que habían usado estas palabras como texto de su enlace, de esta forma: miserable failure y ladrones.

En este ejemplo se ve el efecto del Google-bombing:


Google ha puesto fin a esta práctica y ahora da mucho peso a la relación temática que encuentra entre la página que pone el enlace y la página enlazada, de esta manera frena el link-bombing.

Actividad: Busque en Wikipedia la entrada sobre GoogleBombing y localice otros ejemplos como el que hemos visto en los que se haya producido algo similar .

5. Cloacking

Las técnicas de cloaking consisten en ofrecer a los robots un texto distinto del que pueden ver las personas. La forma de hacerlo es mediante redirecciones, lo que se denomina “doorways”.

El funcionamiento es el siguiente:

  1. Existe una página inicial para usuarios y robots de forma estándar a como se hace en una web sin spam
  2. Los robots indexan el contenido de esta página inicial sin ningún problema, pero los usuarios no la ven porque de forma automática y rápida (por ejemplo mediante un guión de javascript) son redireccionados a otra página inicial
  3. El usuario ve la segunda página inicial a la que ha sido redireccionado

El resultado final es que el robot ve una página y el usuario ve otra, hay dos versiones del contenido.

6. Conclusiones

A modo de resumen recogemos los aspectos que los buscadores consideran buenas prácticas en SEO y malas prácticas.

Aspecto

SEO ético

SEO no ético

Edad del dominio

Google confía más en sitios web que tengan un mismo dominio desde hace varios años.

Dominios nuevos, que entran temporalmente en el Sandbox de Google.

Contenidos

Contenidos originales

Contenidos de calidad

Contenidos actualizados

Contenidos idénticos duplicados en distintas páginas, aunque sean de otros dominios (penaliza los sitios que han copiado de otros)

Palabras por las que posicionarse

Palabras relevantes colocadas en etiquetas xhtml:

- title

- etiquetas h1, h2…

- alt de imágenes

Palabras relevantes en el dominio

Palabras relevantes en el nombre de los ficheros de imágenes

Palabras con una alta densidad de aparición

Navegación

Navegación completa

Mapa del sitio o Sitemap en XML

Links internos programados en JavaScript

Páginas de creación dinámica sin enlaces a ellas

Links “rotos”

Acceso a textos

Accesibilidad

Imágenes, sonidos y vídeos sin textos alternativos

Flash sin texto vinculado

Texto oculto por su color o su tamaño

Enlaces

Popularidad:

Cantidad de enlaces recibidos

Calidad y popularidad de las páginas que hacen los enlaces

Enlaces desde sitios de temática relacionada

Enlaces desde granjas de enlaces

Link-bombing

Recibir muchos enlaces de golpe

7. Bibliografia

ACM SIGIR. Adversarial information retrieval on the web (AIRWeb 2006), Vol. 40 , Issue 2 (December 2006).

Castillo, Carlos; Donato, Debora; Gionis, Aristides ; Murdock, Vanessa; Silvestri, Fabrizio: "Web Spam Detection Using the Web Topology". SPIRE 2007, http://www.citeulike.org/user/ChaTo/article/955052

Castillo, Carlos. “Todo por el rating” Tejedores del web, http://www.tejedoresdelweb.com/307/article-77584.html

Castillo, Carlos. WebSpam, Univ. de Salamanca, Mayo 2007. http://www.tejedoresdelweb.com/slides/2007_talk_spam_salamanca.pdf

Gyöngyi, Zoltán; Garcia-Molina, Hector. "Spam: It's Not Just for Inboxes Anymore". IEEE Computer Magazine, vol. 38, no. 10, pp. 28-34. Octubre 2005, http://doi.ieeecomputersociety.org/10.1109/MC.2005.352

Marco Gori y Ian Witten: "The Bubble of Web Visibility". Comm. ACM, vol. 48, núm. 3, pp. 115-117. Marzo 2005, http://portal.acm.org/ft_gateway.cfm?id=1047715&type=pdf

Ntoulas, Alexandros; Najork, Mark; Manasse, Mark; Fetterly, Dennis. "Detecting spam web pages through content analysis". World Wide Web Conference, pp. 83-92. Edimburgo, Escocia, Mayo 2006, http://www2006.org/programme/item.php?id=3052



inicio temario calendario tutoría notas cambios comunica servicios buscar salir

© Master en Buscadores (IDEC-UPF)
14/2/2008