Referral spam en Google Analytics: Como deshacerte de él

entrada actualizada a 26 de abril de 2019
Referral spam ¿Debo preocuparme y bloquearlo en Google Analytics?
A ver, vamos a ir por partes.
En la imagen ves como vienen 29 y 27 visitas de estos bots en un período de un mes.
Esto para un sitio con cierta antigüedad y con un número de visitas considerable no es nada, pero, si estas empezando y tus visitas aún son bajas, puede causarte un problema ya que arruinan ciertos ratios que influyen en el posicionamiento en buscadores de tu página web.
Pero no todo son las estadísticas, también influye en la optimización de la página y su seguridad.
Este tipo de visitas se producen en un corto espacio de tiempo, concentrándose a veces en unos cuantos segundos, puedes cambiar la vista de analytics que normalmente está en mes a día y verás lo que te digo.
Esto se traduce en un exceso de carga de trabajo para tu servidor, lo que provoca que se ralentice y puede que algunos usuarios abandonen la web lo que también hará que aumente el rebote, esto sin contar que se vayan a la competencia a encontrar lo que no han podido encontrar en tu página porque no había manera de que cargara.
Y por último también por la seguridad de tu web, al que desde mi punto de vista hay que ir prestándole la importancia que merece, es decir, mucha.
ya que como dicen por ahi, si cerca del 45% de las webs del mundo están bajo wordpress, es un terreno especialmente bien abonado para los «malos».
¿Qué co***** han venido a hacer estos robots a mi página?
quizás estén buscando indexar la info como Google o Yahoo, pero también, y seguramente por aquí irán los tiros, estén buscando vulnerabilidades en algún plugin para de esta forma controlar tu página para sus fines, que normalmente son «spamear» a todo el que llegue a ella, y que por cierto, cada día perfeccionan más la técnica de hackeo, haciéndolos más sofisticados.
Algunos de los referral spam más populares y como identificar otros
Con la ilusión que te hizo cuando viste ese tráfico que venía desde fuera.
Pues no, solo usan el código de analytics que tienes insertado para enviar información falsa a otros servidores.
¿Y para qué todas esas molestias?
pues para crear redes de spam para generar más spam.
Casi todos esos dominios están en manos de unas pocas «empresas» que venden los más variopintos servicios.
Algunos de los que ya estarás viendo sus referencias en tus informes de GA son:
- darodar.com
- econom.co
- ilovevitaly.co
- semalt.com
- buttons-for-website.com
- see-your-website-here.com
Aunque también te los puedes encontrar con variaciones de extensión y subdominios.
¿Cómo saber si una de estas referencias son spammers?
pues normalmente la duración de las sesiones es cero.
En otras ocasiones también usan esos enlaces que los diseñadores web suelen poner a modo de firma de sus trabajos en el footer o pié de página de las webs de sus clientes, de la misma forma sabremos que eso está ocurriendo por un número inusual de conexiones desde esa web y que la duración de las sesiones también es cero.
Como solucionar el problema de los referral spam bots
Existen algunos medios con los que poder detener estos referral spam bots, vamos a ver los más sencillos, así sea cual sea tu nivel técnico podrás hacerlo sin ningún problema.
Modificando el archivo .htaccess
No soy técnico pero creo que si las instrucciones para parar estos robots spam están en este archivo, no solo podremos detenerlos sino que además impedimos esos clics virtuales en el servidor previniendo caídas del servicio además del impacto positivo en las estadísticas de GA que obtendremos a partir de ya.
Para empezar hay que editar este archivo e incluir estas dos lineas que pongo a continuación incluyendo la información especifica de tu dominio:
RewriteCond %{HTTP_REFERER} !.*YOUR URL\.com/.*$ [NC]
RewriteCond %{HTTP_REFERER} !.*YOUR SECONDARY URL\.com/.*$ [NC]
A continuación hay que incluir las instrucciones para bloquear a los robots de spam. Para ello te dejo este enlace donde hay una lista negra con ¡¡más de 8.000!!. Tan solo tienes que copiar y pegar.
Advertencia
El fichero .htacces controla el modo en que tu página web se comunica con los servicios. Muchos de los plugins que tienes instalados escriben en el algunas lineas para poder hacer esto precisamente, de modo que es imprescindible que antes de manipularlo hagas una copia de seguridad de tu web para prevenir futuros problemas. Si no te sientes cómodo con este método, espera a leer los otros que voy a explicarte ahora.
Filtros en Google Analytics
Como te podrás suponer, con el método anterior, tendrás que dejar un poco de tiempo hasta que desaparezcan completamente esas referencias de tu vista, ya que estaremos protegidos de aquí en adelante pero no desaparecerán referencias anteriores.
Para eso tenemos esta segunda opción crear vistas personalizadas en google analytics por medio de filtros.
Si eres usuario avanzado de GA no tendrás ningún tipo de problema ya que es probable que tengas implementados algunos filtros ya, pero para todos los demás, mi grupo jeje, que solo tenemos nociones a nivel usuario, lo mejor es hacerlo mediante este tutorial.
Por supuesto seguimos recibiendo visitas de los robots spam, pero no las veremos, al menos tendremos unas estadísticas limpias que nos dejarán ver con claridad qué es lo que realmente ocurre en nuestra página.
Plugins Wordpress para evitar el referral spam
¿Usuario de wordpress? pues si se cumplen las estadísticas uno de cada cuatro que leáis esto lo será, así que aquí os dejo un par de plugins para deshaceros de visitas no deseadas en vuestras webs.
Los que no uséis wordpress aún, sea cual sea el oscuro motivo que os empuja a ello, es coña, también os dejo este otro recurso.
Bien, vamos con el primero de ellos. WP-Ban, podréis «banear» usuarios por IP, rangos de IP, paises…, etc.
Se instala como cualquier otro y no hay que hacer ninguna modificación en el .htaccess, ideal para aquellos que esa opción le da algo de yuyu, en cualquier caso, ahora más que nunca, ¡¡copia de seguridad antes por favor!!.
El segundo, mi preferido, Blackhole for Bad Bots, del mismo autor que la lista negra de referral spam que os dejé antes, este tio sabe mucho.
Os decía antes que es mi preferido, y lo es por una razón.
Además de cumplir su misión, este plugin genera una trampa, de ahí su nombre, agujero negro, impidiendo más si cabe el acceso de estos bots a tu página web en el caso de que incumplan una regla que el plugin les obliga a cumplir mediante un enlace oculto que los spammers no ven.
¿Malébolo, verdad?
Para que esta regla se cumpla hay que hacer una pequeña modificación en el archivo robot.txt que se encuentra en tu instalación de wordpress.
Esta modificación no entraña tantos reparos el hacerla como la modificación del .htaccess.
caso práctico
Uno de mis clientes, al que, entre otras cosas, le llevamos el mantenimiento técnico de todas sus páginas, comenzó a tener problemas en una de ellas.
Concretamente daba un error 500 sin que se hubiesen hecho ni actualizaciones ni cambios estructurales grandes.
Además presentaba una gran cantidad de visitas de tiempo 0:00.
Así que comprobamos algunas cosas e instalamos el plugin que hemos comentado.
Cuando lo configuras puedes establecer un email para alertas de que ha trabajado bien y este fue el resultado solo en una semana (ojo, en la imagen no aparece la semana completa) pero como muestra creo que vale.
¿Qué te parece?
Fíjate que hay días de hasta 4 intervenciones del plugin y esta web tiene de media 250 visitas/día…
calcula lo que puede hacer con una de varios miles.
Conclusión
Ya ves como tendremos que estar bastante alerta en cuanto a seguridad wordpress se refiere a partir de ahora en adelante. El incremento brutal que está teniendo wordpress es bueno en muchos sentidos pero también los «malos» se ponen las pilas, así que no dejes de un lado el mantenimiento de tu web ni los distintos aspectos de seguridad para tener a raya a todos estos y que tu ocupes tu tiempo en lo que verdad te interesa en hacer crecer tu negocio o el de tu empresa.
Espero os haya resultado interesante y si es así, por favor, compartidlo con los enlaces que tenéis de bajo del post, así me ayudáis a mi y a los compañeros que se encuentren en esta situación. Saludos varios y hasta el próximo. 🙂