Me resulta apasionante la polémica que se ha levantado en torno a la forma tan peculiar que tiene Google Analytics de medir el origen del tráfico de aquellos sites que utilizan su forma de medición. Resumo las conclusiones de algunos de los blogueros que han protagonizado la diatriba:
Aunque no soy una persona de perfil técnico voy a intentar empezar con algunos conceptos básicos de la medición:
La identificación de los usuarios se realiza mediante cookies, la cookie es un pequeño fichero de texto que se guarda en el ordenador del usuario cuando este visita una página de un site que tiene algún tag de nuestro sistema de medición.
Las cookies se instalan en el disco duro del ordenador a través del navegador que visita la página mediante un tag presente en la misma. Un tag es un pequeño código, generalmente javascript, que se inserta en el código fuente de la página y que permite que cuando se cargue se realice una llamada a una base de datos alojada en un servidor y registrar en ella ciertos datos de la actividad del usuario en dicha página. La información más básica que podemos registrar es la visita del usuario identificado por esa cookie a la página.
Existen cookies de primera parte (1rst party) que son aquellas que se establecen desde el mismo dominio que está visitando el usuario, y de tercera parte (3rs party) son aquellas que establecen dominios diferentes al visitado. Por ejemplo las de tercera parte son la que usan los servidores de publicidad (AdServers) para la medición de usuarios impactados por una campaña y la frecuencia de dichos impactos (número de veces que un mismo usuario ha sido impactado por una pieza publicitaria de un determinado binomio anunciante/campaña)
El sistema de medición por cookies no está exento de limitaciones:
1. Los usuarios pueden borrar las cookies. Y no sólo los usuarios también los sistemas de protección tipo McAffe o Norton pueden, en función del nivel de seguridad que tengamos establecido, borrar e incluso no aceptar las cookies. Asi mismo los navegadores modernos incluyen opciones avanzadas para controlar las cookies que estamos dispuestos a aceptar (por ejemplo bloquear las de terceras partes).
2. Una cookie identifica al navegador desde el que se visitó el site no al usuario que lo estaba manejando. Un mismo usuario puede visitar un mismo site desde distintos navegadores en un mismo periodo de tiempo bien por que usa distintos ordenadores (un sobremesa en casa y un portátil en el trabajo) o bien por que usa varios navegadores (yo uso Firefox como principal pero tengo como secundarios Safari, Opera o en ocasiones Flock).
3. La cookie solo proporciona información de las páginas que tenemos tageadas aunque gracias a los referrers (la información de la última página que hemos visitado antes de llegar a nuestro site que se almacena en el histórico del navegador) podemos obtener cierta información de la actividad de nuestro usuario fuera de nuestro site, aunque es claramente insuficiente.
4. Los navegadores tienen una capacidad limitada para almacenar cookies. Generalmente se estima que deben poder soportar un número mínimo de cookies (300) o una cantidad mínima de memoria para almacenarlas (4 kilobytes cada una y al menos 20 cookies por servidor/dominio).
5. Las cookies tienen un tiempo de vida limitado, de manera estándar se suele usar 30 días. Existen cookies de sesión (desaparecen cuando cerramos una sesión de nuestro navegador) y cookies persistentes (que tiene una fecha de borrado y pueden cubrir varias sesiones de un mismo navegador)
Parece lógico pensar que las diferentes opciones que proporciona la cookie como base de medición tiene implicaciones importantes a la hora de realizar y valorar las diferentes métricas de un site: usuarios únicos, usuarios recurrentes, origen de las visitas, etc. Sin embargo me parece que, como profesionales de este medio, tenemos que hacer una defensa del sistema de medición por cookies.
No sólo es un sistema aceptablemente eficaz, a pesar de que albergue un margen razonable de errores, sino que es infinitamente más objetivo que cualquiera de los sistemas de medición basados en paneles online (site-centric) u offline (audímetros de Sofres). El problema reside mucho más en la falta de estandarización de las métricas y en como contabilizarlas que en el sistema de cookies. Y aqui es donde empieza la polémica de Google Analytics. (ver siguiente Post)
3 Respuestas for "Polémica de medición de audiencias: conceptos básicos"
Mamel, totalmente de acuerdo. El sistema de cookies, con todos sus defectos, es bastante más cercano a la realidad que todos los panels.
Mamel, para no ser un técnico de investigación creo que has hecho una diserción muy exacta. Dales caña ! un abrazo
Pequeño comentario amigo:
“No sólo es un sistema aceptablemente eficaz, a pesar de que albergue un margen razonable de errores, sino que es infinitamente más objetivo que cualquiera de los sistemas de medición basados en paneles online (site-centric) u offline (audímetros de Sofres).”
Los sistemas de paneles son considerados USER CENTRIC dado que el foco de la medición se realiza sobre un detreminado número de usuarios, a los cuales se les ha instalado un determinado programa (generalmente un pluging sobre su navegador) que va recolectando información acerca de su actividad. Estos usuarios son selecciondos (y normalmente retribuidos bien económicante, bien incentivados con regalos u obsequios) en base a los muestreos censales EGM de forma y manera que aporten información relevante del comportamiento de la población internet.
Aquí podríamos entrar en numerosas contradicciones acerca de si a la hora de realziar una muestra / panel de ususarios debemos o no replicar un muestreo censal de la población total española (es decir, que la muestra represente al total de la población) o bien realziar uno que sea representativo de la población internauta española. Lo primero significaría poder comparar medios horizontalmente asumiendo que en internet, la distribución de perfiles de forma global es similar a la distribución de perfiles del total de la población española. La segunda opción implciaría reconocer que en internet, la muestra es autónoma, es decir, que se toma como base referencial la poblacio internauta española y en base a ello se construye un panel que represente los comportamientos de este colectivo.
Es decir, la priemra fórmula nos compararía como se comporta la poblacion Española en internet sin tener en cuenta que el medio en si mismo estñá sesgado (mi abuela ve la TV pero jamás se conectará a un sitio web!) mientras que la segunda entendería que la poblacion internauta española contiene un sesgo en si misma y que es preciso generar una muestra representativa sobre ella, no sobre la primera.
En cualquier caso, llevamos años con el mismo debate y no acabamos de ponernos deacuerdo…
Abrazos!
Deja tu comentario