1. Introducción
Como suele decirse, “hecha la ley hecha la trampa”. Es decir, conocer cómo hacen los buscadores los rankings de resultados lleva a algunas personas a aplicar este conocimiento de forma no ética, intentando engañar a los buscadores para conseguir mejores posiciones. La intención de estas personas es que cuando una persona realice una búsqueda en un buscador por un determinado término, su sitio web aparezca entre los primeros puestos, aunque en realidad el sitio web no trata sobre ese tema o no tiene calidad suficiente para que los buscadores lo consideren tan relevante como para colocarlo en una buena posición.
Un ejemplo de spam en buscadores: Pedro busca páginas web en las que descargarse de forma gratuita un fondo de escritorio, y escribe en Google <descargar fondo escritorio>. Los dos primeros resultados son sitios que sí le ofrecen esta opción. En tercera posición aparece el sitio web de la empresa SoftHigh, dedicada a la venta de software por Internet, y que no da este servicio que Pedro quiere. ¿Por qué aparece SoftHigh en tercera posición si no contiene lo que el usuario ha pedido? Porque la empresa SoftHigh ha realizado algunas técnicas engañosas y ha hecho creer a los buscadores que su sitio web tiene la posibilidad de descargar fondos de escritorio. ¿Cómo? Veamos algunas formas de “engañar” a los buscadores, aunque no olvidemos que el engaño no tardará en ser descubierto y eso supondrá recibir una sanción que consistirá en ser relegado a una mala posición.
Podemos decir que todo lo que sea utilizar las técnicas de SEO para forzar el posicionamiento de un sitio que de forma natural no lo merece se considera posicionamiento no ético, y si los buscadores lo detectan sancionan al sitio web quitándole posicionamiento en sus resultados. Frente a las técnicas que abusan de los algoritmos de ranking de motores, éstos desarrollan continuamente mejoras para luchar contra ellas (“adversarial retrieval information”).
Actividad: Utilice un buscador de blogs como Google Blog Search o Technorati y realice una consulta sobre “blackhat seo”. De los resultados obtenidos escoja un post en el que se explique en qué consisten estas prácticas y/o qué técnicas se consideran poco éticas.
2. Enlaces recibidos
Como los buscadores valoran positivamente recibir muchos enlaces, las personas que usan técnicas “black hat” buscan formas fáciles de conseguir muchos enlaces. Las más habituales son:
El problema que tienen estos enlaces es que no son naturales sino forzados, por ejemplo incluyen su sitio web en “granjas de enlaces” (link farm), esto es, en sitios web creados específicamente para colocar enlaces a otras páginas, sin ningún tipo de contenidos. O pagan para que determinado sitio web bien posicionado ponga un link a su página. O envían de forma automática mensajes a foros y a blogs poniendo un link a la página en cuestión, por ejemplo:

La manera que los buscadores tienen para detectar estas prácticas es fijarse en si los contenidos de los sitios que ponen el enlace están relacionados con las páginas enlazadas. Si no hay coincidencia, sospechan que se trata de un SEO forzado. Igualmente, si detectan que un sitio web recibe un gran número de enlaces en muy poco tiempo, también sospechan de que se esté poniendo en práctica una de estas acciones comentadas.
Actividad: Ojee distintos blogs, no importa cuáles, y localice spam en ellos, es decir, comentarios de usuarios que no dicen nada pero sí ponen su URL . Para encontrar blogs en los que ocurra esto le recomendamos que busque blogs personales (no institucionales) ya que el mantenimiento suele estar más descuidado y habrá menos posibilidades de que hayan borrado el spam.
3. Textos de las páginas web
Puesto que los buscadores miran con atención los textos que aparecen en las páginas web, una forma de “engañar” al robot es ofrecerle textos que las personas no verán. Las formas más habituales de estas prácticas son:
Ocultar texto escribiendo con un color de fuente igual al color de fondo, de forma que las personas no lo veremos pero sí los robots, y lo indexarán, por ejemplo que el color de la letra sea rojo (#FF0000) y el color de fondo también (#FF0000), el resultado sería este:

pero en realidad el texto está ahí i podemos verlo si lo seleccionamos con el ratón:


Abusar de las palabras para las que se quiere posicionar la página, repitiéndolas de forma poco natural con una alta densidad para que el robot crea que el sitio trata de ese tema que tanto se repite en sus textos, por ejemplo:

Cualquiera de estas 3 formas son fácilmente detectables por los buscadores, por lo que su uso no servirá de mucho para el SEO.
Actividad: Pruebe a buscar en alguno de los grandes buscadores palabras muy comunes como gratis, software, alquiler, etc . y encuentre un ejemplo de repetición de palabras como el mostrado en el ejemplo.
4. Link-bombing
El link-bombing es uno de los fenómenos más curiosos que se ha producido en SEO desde que Google comenzó a utilizar la popularidad como criterio de gran peso en el ranking de resultados. Primero se dio en Google y poco a poco se fue extendiendo a otros buscadores. Veamos de qué se trata.
Con un criterio lógico, los buscadores dan un gran peso a las palabras que otras páginas web utilizan para poner un enlace a otras. Por ejemplo, si en una página web hay un link con este aspecto: Ordenadores , lo que esperamos es que al clicar sobre él nos lleve a una página sobre ordenadores, o al menos de informática. Eso es lo normal en la Web. Aprovechándose de esta idea, algunas personas comenzaron a usar de forma distinta y fraudulenta para el SEO este criterio y usaron palabras que no correspondían con los contenidos del sitio al que lindaban. Los casos más conocidos de este efecto que podemos considerar de protesta fueron las búsquedas “miserable failure” y “ladrones”: EN el primer caso, la página web a la que llevaba esta búsqueda era la página del presidente de Estados Unidos George Bush, y en el segundo caso la búsqueda daba como primer resultado el sitio web de la Sociedad General de Autores y Editores de España (SGAE). Como se puede imaginar, ni en el sitio web de Bush aparecía la expresión “miserable failure” ni en el de la SGAE la palabra “ladrones”, en cambio estaba posicionados para sendas búsquedas. La forma de conseguir ese buen puesto fue que estos sitios recibieron multitud de links desde otras páginas que habían usado estas palabras como texto de su enlace, de esta forma: miserable failure y ladrones.
En este ejemplo se ve el efecto del Google-bombing:

Google ha puesto fin a esta práctica y ahora da mucho peso a la relación temática que encuentra entre la página que pone el enlace y la página enlazada, de esta manera frena el link-bombing.
Actividad: Busque en Wikipedia la entrada sobre GoogleBombing y localice otros ejemplos como el que hemos visto en los que se haya producido algo similar .
5. Cloacking
Las técnicas de cloaking consisten en ofrecer a los robots un texto distinto del que pueden ver las personas. La forma de hacerlo es mediante redirecciones, lo que se denomina “doorways”.
El funcionamiento es el siguiente:
- Existe una página inicial para usuarios y robots de forma estándar a como se hace en una web sin spam
- Los robots indexan el contenido de esta página inicial sin ningún problema, pero los usuarios no la ven porque de forma automática y rápida (por ejemplo mediante un guión de javascript) son redireccionados a otra página inicial
- El usuario ve la segunda página inicial a la que ha sido redireccionado
El resultado final es que el robot ve una página y el usuario ve otra, hay dos versiones del contenido.
6. Conclusiones
A modo de resumen recogemos los aspectos que los buscadores consideran buenas prácticas en SEO y malas prácticas.
Aspecto | SEO ético | SEO no ético |
Edad del dominio | Google confía más en sitios web que tengan un mismo dominio desde hace varios años. | Dominios nuevos, que entran temporalmente en el Sandbox de Google. |
Contenidos | Contenidos originales Contenidos de calidad Contenidos actualizados | Contenidos idénticos duplicados en distintas páginas, aunque sean de otros dominios (penaliza los sitios que han copiado de otros) |
Palabras por las que posicionarse | Palabras relevantes colocadas en etiquetas xhtml: - title - etiquetas h1, h2… - alt de imágenes Palabras relevantes en el dominio Palabras relevantes en el nombre de los ficheros de imágenes | Palabras con una alta densidad de aparición |
Navegación | Navegación completa Mapa del sitio o Sitemap en XML | Links internos programados en JavaScript Páginas de creación dinámica sin enlaces a ellas Links “rotos” |
Acceso a textos | Accesibilidad | Imágenes, sonidos y vídeos sin textos alternativos Flash sin texto vinculado Texto oculto por su color o su tamaño |
Enlaces | Popularidad: Cantidad de enlaces recibidos Calidad y popularidad de las páginas que hacen los enlaces Enlaces desde sitios de temática relacionada | Enlaces desde granjas de enlaces Link-bombing Recibir muchos enlaces de golpe |
7. Bibliografia
ACM SIGIR. Adversarial information retrieval on the web (AIRWeb 2006), Vol. 40 , Issue 2 (December 2006).
Castillo, Carlos; Donato, Debora; Gionis, Aristides ; Murdock, Vanessa; Silvestri, Fabrizio: "Web Spam Detection Using the Web Topology". SPIRE 2007, http://www.citeulike.org/user/ChaTo/article/955052
Castillo, Carlos. “Todo por el rating” Tejedores del web, http://www.tejedoresdelweb.com/307/article-77584.html
Castillo, Carlos. WebSpam, Univ. de Salamanca, Mayo 2007. http://www.tejedoresdelweb.com/slides/2007_talk_spam_salamanca.pdf
Gyöngyi, Zoltán; Garcia-Molina, Hector. "Spam: It's Not Just for Inboxes Anymore". IEEE Computer Magazine, vol. 38, no. 10, pp. 28-34. Octubre 2005, http://doi.ieeecomputersociety.org/10.1109/MC.2005.352
Marco Gori y Ian Witten: "The Bubble of Web Visibility". Comm. ACM, vol. 48, núm. 3, pp. 115-117. Marzo 2005, http://portal.acm.org/ft_gateway.cfm?id=1047715&type=pdf
Ntoulas, Alexandros; Najork, Mark; Manasse, Mark; Fetterly, Dennis. "Detecting spam web pages through content analysis". World Wide Web Conference, pp. 83-92. Edimburgo, Escocia, Mayo 2006, http://www2006.org/programme/item.php?id=3052