GA4 e IA: Evitar la pérdida de datos con Consent Mode
La Inteligencia Artificial ha irrumpido en todos los ámbitos del mundo digital como una revolución imparable, aportando nuevas maneras de entender y usar la tecnología. A pesar de su popularización en los últimos tiempos, la IA cuenta con recorrido en el sector de la analítica digital. Comenzó a dar sus…
La Inteligencia Artificial ha irrumpido en todos los ámbitos del mundo digital como una revolución imparable, aportando nuevas maneras de entender y usar la tecnología. A pesar de su popularización en los últimos tiempos, la IA cuenta con recorrido en el sector de la analítica digital. Comenzó a dar sus primeros pasos en el ya extinto Universal Analytics y es en Google Analytics 4 cuando sus máximas capacidades se ponen a nuestra disposición para enriquecer el análisis comportamental de una web o app.
GA4 es sinónimo de aventura. No sólo porque cada semana haya novedades (unas veces en forma de funcionalidades, otras en forma de inesperados bugs que por suerte no tardan en corregir) sino porque además supone un cambio conceptual respecto a cómo se había planteado la recolecta y explotación de datos hasta el momento.
La necesidad de adaptarse a la situación actual de la privacidad en los entornos digitales, con especial atención a la legislación europea, ha supuesto una disrupción respecto al modelo de trabajo anterior. La privacidad de los usuarios pasa a estar en primera línea en cuanto a las exigencias para cualquier tipo de tecnología y GA4 no es ajeno a ello.
Consent Mode: requisito base para poder utilizar Inteligencia Artificial en Google Analytics
La evolución de la normativa ha supuesto un cambio muy significativo en la recolección y uso de datos personales. Consent Mode es, sin duda, una de las apuestas más férreas por parte de Google de cara a emplearse a fondo en el nuevo escenario digital al que nos estamos dirigiendo, donde cobran vital importancia las estrategias de mejora de la experiencia de usuario con foco en el ratio de aceptación de los CMPs.
La visibilidad que se le ha dado al nuevo botón de rechazar cookies ha supuesto, para muchos activos digitales, un impacto significativo en la recogida de datos, materializándose en una pérdida de información muy relevante (que alcanza volúmenes del 30%, dependiendo del contexto).
Desde su aparición en 2021 hasta el día de hoy, Consent Mode ha evolucionado notablemente, llegando en su última versión a ofrecer un modo avanzado de configuración que permite la recolección de datos anonimizados para que, en caso de que el usuario no dé su consentimiento a ser identificado por herramientas de analítica, igualmente se puedan seguir enviando datos de navegación a GA.
El modelado de datos en GA4
Toda la información recopilada de los visitantes pasa por un sistema de procesamiento antes de estar disponible en la interfaz (de manera oficial el período de procesado dura entre 24 y 48h, aunque habitualmente a la mañana siguiente a la recogida la información suele estar disponible).
Es en este punto donde la IA de GA4 entra en juego.
Un algoritmo de machine learning aprende de los datos observados, es decir, de aquella información recopilada de los usuarios que sí aceptan cookies. Durante la fase de entrenamiento el algoritmo analiza cuáles son los patrones de comportamiento de los usuarios. Gracias a eso, cuando se produce el procesado de los eventos recibidos con el valor 100 en el parámetro GCS, es capaz de inferir cuántos usuarios han realizado determinadas acciones, cómo ha sido su navegación a través del funnel o cuál ha sido el total de usuarios que han convertido.
Al no recopilar identificadores, sino sólo eventos inconexos entre sí, el algoritmo tiene la misión de estimar el total de usuarios que han visitado el site sin aceptar consentimiento. Esos datos modelados se incluirán en los informes junto a los datos observados con el objetivo de que el analista cuente con la información más completa y precisa posible.
Por un lado es práctico, ya que la propia herramienta presenta los datos listos para ser consumidos sin necesidad de preparación previa del conjunto de datos. Sin embargo, actualmente GA4 no cuenta con la capacidad de discriminar entre usuarios observados y usuarios modelados. Es decir, que la información sólo puede verse agregada y no es posible conocer qué porcentaje de usuarios son fruto del cálculo del algoritmo.
Activar los datos modelados en GA4
Tal y como ya hemos comentado, es esencial que el primer paso para explotar las capacidades de inteligencia artificial que Google Analytics pone a nuestra disposición sea la activación de Consent Mode en su función Advanced. Gracias a ella será posible enviar a nuestra herramienta de analítica información anonimizada de la navegación de aquellos usuarios que no acepten el seguimiento.
Desde la interfaz es muy sencillo validar que se están recibiendo las señales de consentimiento.
Sólo es necesario navegar hasta el apartado Admin > Data Streams > Seleccionamos el flujo de datos a revisar > Consent Settings.
Si Consent Mode no está configurado correctamente, la interfaz se mostrará de esta manera:
Sin embargo, si la ejecución de la funcionalidad es correcta, esta será la apariencia de la pantalla:
Una vez se haya validado que GA está recibiendo datos anonimizados, el algoritmo tendrá vía libre para trabajar en el modelado (siempre y cuando se cumpla otro requisito que trataremos en el siguiente artículo artículo de IA y GA4 sobre el modelado de eventos).
Finalmente hará falta realizar un último ajuste para que esa información se integre en la interfaz:
En el apartado Data Display > Reporting identity se podrá elegir de qué manera Google Analytics identifica a los usuarios. Para explotar los datos de usuarios observados y anonimizados optaremos por la versión “Blended”. En caso de que sólo queramos usar datos de usuarios que acepten el consentimiento, seleccionaremos “Observed”.
Un punto relevante a la hora de elegir el modelo de identidad es que puede cambiarse en cualquier momento sin que ello suponga un impacto irreversible en el procesamiento de datos. GA4 recalcula la identificación de usuarios de manera dinámica en base a la elección realizada, lo que permite realizar un análisis de los datos recogidos desde diferentes perspectivas.
En el siguiente capítulo hablaremos de cómo Google Analytics, tras procesar los datos anonimizados, los aplica a varios niveles. Trataremos el Behavioral Modeling y el Key Event Modeling y sus requisitos, capacidades y limitaciones. GA4 abre la puerta a un nuevo concepto de analítica. Ha llegado el momento de sumergirse de lleno en su propuesta y descubrir una nueva manera de analizar los datos.