Metodología

Sección 1

Nuestro enfoque

Rascasse ocupa una posición distintiva en el panorama de la investigación: Behavioral Audience Intelligence. No somos ni un proveedor de escucha social ni un proveedor de estudios de mercado. En su lugar, analizamos sistemáticamente el comportamiento digital observable a través de múltiples fuentes para construir perfiles de audiencia basados en lo que las personas hacen, no en lo que dicen.

Esta distinción es importante. La brecha entre las actitudes declaradas y el comportamiento real —la brecha entre lo que se dice y lo que se hace— está bien documentada tanto en la literatura académica como en la práctica del sector. Choi y Varian demostraron que el comportamiento de búsqueda digital predice la actividad económica del mundo real con mayor precisión que los instrumentos de encuesta tradicionales.1 Kosinski et al. demostraron que los registros digitales del comportamiento humano pueden predecir atributos personales con una precisión notable.2

El propio sector de la investigación de mercados reconoce cada vez más este desafío. En IIeX North America 2025, Qrious Insights presentó hallazgos que sugieren tasas de error de aproximadamente el 80 % en los datos de consumo de medios declarados por los propios encuestados.{{methodology.toc_item_14}} El informe «State of Survey Fraud 2025» de Rep Data analizó 4100 millones de intentos de encuesta y determinó que el 33 % eran fraudulentos y el 27 % se realizaron sin atención, lo que deja aproximadamente la mitad de las respuestas recopiladas como realmente utilizables.{{methodology.toc_item_15}}

Tres paradigmas de la investigación de audiencias

Tradicional

Investigación mediante encuestas

Pregunta a las personas qué piensan, qué compran y qué ven. Sujeta a sesgos de recuerdo, deseabilidad social y tasas de respuesta decrecientes.

Rascasse

Inteligencia conductual

Observa lo que las personas hacen realmente en las fuentes digitales. Triangulación de datos de comportamiento a partir de múltiples fuentes.

Escucha social

Supervisa las conversaciones en los canales sociales. Se limita a minorías vocales y a poblaciones específicas de cada canal.

Nuestro enfoque se ajusta a lo que el Código Internacional ICC/ESOMAR (5.ª edición, 2025) reconoce ahora formalmente: el papel legítimo del «investigador como curador de datos», es decir, profesionales que obtienen conocimientos a partir de fuentes de datos existentes en lugar de generar datos primarios mediante el contacto directo con los participantes.5

En ESOMAR Reimagine 2025, Heineken presentó un marco de riesgos para los datos sintéticos e imputados. En este marco, la metodología de Rascasse se clasifica como «Paso 1: Imputación de datos», la categoría de menor riesgo, ya que extrae inferencias de señales de comportamiento reales en lugar de generar datos sintéticos.{{methodology.toc_item_17}}

Principios clave

Triangulación de múltiples fuentes: cada punto de datos se valida con fuentes independientes. Ninguna fuente individual domina el resultado.
Datos agregados y no personales: procesamos patrones de comportamiento a nivel de población. Sin seguimiento individual, sin procesamiento de datos personales: cumplimiento del RGPD desde el diseño.
Comportamiento observable frente a preferencias declaradas: las consultas de búsqueda, los patrones de interacción y el comportamiento de consumo proporcionan datos de mayor fiabilidad que las respuestas a encuestas autoinformadas.
Transparencia sobre la incertidumbre: cuando los datos son escasos, informamos de la insuficiencia de datos en lugar de proporcionar valores imputados.

Sección 2

Arquitectura de datos e independencia

La arquitectura de datos de Rascasse es deliberadamente conservadora. Hemos operado sin que se haya producido ni una sola prohibición de fuentes, revocación de API, carta de cese y desistimiento o incumplimiento de los términos de servicio. Esto no es casualidad, sino que es intencionado. Nuestra arquitectura se basa en un comportamiento observable públicamente que no requiere acceso privilegiado a la API, autenticación de usuario ni colaboraciones con terceros que puedan ser revocadas.

Sin dependencia de cookies de terceros

Mientras que gran parte del ecosistema de la publicidad digital se enfrenta a la disrupción provocada por la obsolescencia de las cookies —Privacy Sandbox de Google, ITP de Safari, ETP de Firefox—, la metodología de Rascasse es totalmente independiente de las cookies. No realizamos un seguimiento de usuarios individuales a través de sitios web. Nuestros puntos de datos son patrones de comportamiento agregados: volúmenes de búsqueda, métricas de interacción y datos de interacción pública. Ninguno de ellos depende de mecanismos de seguimiento a nivel del navegador.

No se requieren datos de clientes

Rascasse no requiere acceso a los sistemas de eCRM de los clientes, a datos propios, a bases de datos de clientes ni a ninguna información confidencial. Nuestra inteligencia se deriva íntegramente de datos de comportamiento disponibles públicamente. Esto significa que no hay acuerdos de tratamiento de datos (DPA) más allá de los términos estándar de SaaS, no hay riesgo de mezclar datos de clientes con fuentes de terceros, no hay retrasos en la incorporación para la integración de datos y se cumple plenamente con el RGPD desde el diseño.

Independencia de fuentes

A diferencia de los competidores que dependen de la API de una única fuente —como Twitter/X Decahose o la API de marketing de Meta—, la arquitectura multisource de Rascasse garantiza que ningún cambio en una sola fuente pueda interrumpir nuestro flujo de datos. Cuando los servicios de terceros restringen el acceso a la API, como hizo Twitter/X en 2023 o como Meta ajusta periódicamente su API de marketing, nuestra metodología no se ve afectada.

Factor de riesgo	Basado en encuestas	Gráfico social	Comportamental (Rascasse)
Dependencia de la API de origen	Proveedores de paneles	Twitter/X Decahose	Ninguna (datos públicos)
Dependencia de cookies	Píxeles de seguimiento	Ninguno	Ninguna
Se requieren datos del cliente	Ninguno	Ninguno	Ninguno
Riesgo de prohibición de fuentes	Riesgo de fraude en el panel	Riesgo de revocación de la API	Ninguno (sin incumplimiento de los Términos de Servicio)
Tratamiento de datos conforme al RGPD	Se requiere el consentimiento del panel	Consentimiento sobre datos sociales	No se tratan datos personales

La Guía de ESOMAR sobre la recopilación, observación y registro de datos pasivos reconoce explícitamente la legitimidad de la investigación basada en datos observables públicamente, siempre que se respeten los principios de transparencia y proporcionalidad —ambos cumplidos por diseño por la arquitectura de Rascasse.7

Sección 3

Fuentes de datos

Rascasse recoge datos de comportamiento de múltiples categorías independientes. Cada categoría capta una faceta distinta del comportamiento digital, y ninguna fuente concreta predomina en el resultado final. Este enfoque multisource sigue los principios de la fusión de datos descritos por Ipsos MediaCT: combinar flujos de datos independientes para producir estimaciones que ninguna fuente podría ofrecer por sí sola.8

Categoría	Lo que capturamos	Tipo de datos
Comportamiento de búsqueda	Volúmenes de consultas, patrones estacionales, distribución regional	Datos de intención
Canales sociales	Gráficos de seguidores, tasas de interacción, interacción con el contenido	Datos de interés
Vídeo y streaming	Recuento de visualizaciones, comportamiento de las listas de reproducción, suscripciones a canales	Datos de consumo
Registros públicos	Índices de audiencia televisiva, listas de ventas, bases de datos de premios, Wikipedia	Datos de validación
Investigación primaria publicada	Resultados de encuestas publicadas, datos censales, estudios del Pew Research Center	Datos de calibración
Datos de ubicación	Bases de datos de puntos de interés, patrones de registro, datos de localizadores de tiendas	Datos espaciales

Canal de datos de múltiples fuentes

Ingesta

Datos sin procesar

→

Normalización

Alineación entre fuentes

→

Validación

Verificación cruzada entre múltiples fuentes

→

Resultado

Puntos de datos y perfiles de audiencia

Principio

Cada perfil se elabora a partir de múltiples fuentes de datos independientes. Los puntos de datos que no pueden corroborarse en al menos dos fuentes independientes se marcan con puntuaciones de fiabilidad reducidas.

Sección 4

Perfilado de puntos de datos

En el sistema de Rascasse, un punto de datos es cualquier objeto cultural, comercial o social discreto que genera un comportamiento digital cuantificable. Actualmente, el sistema perfila más de 500 000 puntos de datos en cinco categorías: marcas, personas, eventos, medios de comunicación y temas.

Creación de puntos de datos

Cada punto de datos se define mediante un conjunto seleccionado de palabras clave de búsqueda, alias y asignaciones de categorías. Esta selección es esencial: una misma consulta superficial puede referirse a diferentes puntos de datos (por ejemplo, «Jaguar» como marca de automóviles frente a «Jaguar» como animal), y la desambiguación requiere conocimientos especializados en la materia combinados con validación algorítmica.

Tamaño del punto de datos

El tamaño del punto de datos es una métrica normalizada que combina el volumen de búsqueda con los datos de interacción en redes sociales. Proporciona una medida comparable de la huella digital global de un punto de datos, lo que permite realizar comparaciones entre categorías y entre países. El tamaño del punto de datos es específico para cada tipo: una marca se pondera de forma diferente a una persona o un evento, lo que refleja los distintos patrones de comportamiento que genera cada tipo.

Factor de calidad (QualFactor)

Cada punto de datos lleva una puntuación QualFactor derivada de la validación cruzada entre datos de comportamiento basados en búsquedas y en interacción. Un QualFactor alto indica patrones consistentes en fuentes independientes; un QualFactor bajo desencadena una revisión manual o el enriquecimiento de datos.

Ámbito

La elaboración de perfiles de puntos de datos abarca 200+ países. Se pueden incorporar nuevos puntos de datos en cuestión de días, no de meses, lo que supone una ventaja significativa frente a los sistemas basados en encuestas, que requieren el diseño de nuevos cuestionarios y trabajo de campo para cada incorporación.

Sección 5

Creación de audiencias

En Rascasse, las audiencias se crean a partir de puntos de datos mediante la selección de expertos en la materia, y no mediante agrupaciones algorítmicas. Esta elección de diseño deliberada garantiza la coherencia semántica: una audiencia de «Entusiastas de la automoción de gama alta» es creada por expertos que comprenden qué marcas, medios de comunicación, eventos e influencers definen ese segmento.

Audiencias basadas en un único punto de datos

El tipo de audiencia más sencillo se centra en un único punto de datos. «Fans de Club América» recoge todo el comportamiento digital asociado a Club América: patrones de búsqueda, interacción en redes sociales, consumo de contenido y afinidades de marca relacionadas.

Audiencias de múltiples puntos de datos

Las audiencias complejas combinan múltiples puntos de datos mediante combinaciones lógicas (Y, O, NO). Por ejemplo, una audiencia de «Moda sostenible» podría combinar marcas centradas en la sostenibilidad, medios de comunicación de moda ética e influencers relevantes, al tiempo que excluye las marcas de moda rápida.

Agregación ponderada

Al construir audiencias de múltiples puntos de datos, los puntos de datos que las componen se ponderan según su relevancia. Una audiencia de «Fans del hip-hop estadounidense» podría dar más peso a los artistas que a los medios de comunicación, reflejando el patrón de comportamiento más marcado que proporciona la interacción con los artistas.

Diferenciación

A diferencia de los proveedores basados en encuestas, en los que los investigadores deben definir las audiencias mediante la lógica de los cuestionarios, o de las herramientas de escucha social que se basan en la coincidencia de palabras clave en las conversaciones, las audiencias de Rascasse son creadas por expertos en la materia que comprenden las relaciones semánticas entre marcas, personas y propiedades. Esto da lugar a segmentos más matizados y culturalmente precisos.

Sección 6

Modelización demográfica

Los datos demográficos no se pueden observar directamente a partir de los datos de búsqueda. En su lugar, empleamos un enfoque de estimación de múltiples fuentes que combina varios indicadores demográficos independientes en una estimación compuesta. Cada indicador aporta un dato; el perfil demográfico final surge de la convergencia de estas aportaciones independientes.

Indicador 1

Composición de la audiencia específica de cada canal

Cada canal social presenta distribuciones demográficas documentadas (Pew Research, 2025). TikTok se inclina hacia el grupo de 18 a 29 años, LinkedIn hacia la educación superior y Facebook hacia los mayores de 30 años. La fuerza relativa de un dato en estos canales determina su perfil demográfico.

Indicador 2

Transferencia de afinidad del influencer

Cuando un influencer con un perfil de audiencia conocido muestra afinidad con una marca, una parte de esa evidencia demográfica se transfiere mediante la actualización bayesiana: a priori (perfil de la marca) + probabilidad (audiencia del influencer) = estimación a posteriori.

Indicador 3

Análisis demográfico visual

La visión artificial aplicada a imágenes de perfil de acceso público proporciona estimaciones de la distribución por edad y género a nivel agregado, siguiendo los métodos establecidos por Rothe, Timofte y Van Gool (2018) y Cesare et al. (2017).

Indicador 4

Calibración de la investigación primaria pública

Los estudios publicados (Pew, Eurostat, oficinas nacionales de estadística), los índices de audiencia televisiva con distribuciones de edad conocidas, las listas de ventas con datos demográficos por categoría y los estudios de mercado disponibles públicamente sirven como puntos de calibración de referencia.

Indicador 5

Combinación bayesiana a través de patrones de búsqueda regionales

Las regiones tienen perfiles demográficos conocidos. Cuando una marca es buscada de forma desproporcionada en ciudades universitarias, esto sugiere una audiencia más joven. La actualización bayesiana combina los datos previos nacionales con los patrones de volumen de búsqueda regionales.

El marco bayesiano en el que se basan los indicadores 2 y 5 sigue métodos establecidos en la ciencia del marketing, tal y como describen Rossi, Allenby y McCulloch (2005)9 y se aplica al modelado de la combinación de medios por parte de Google Research (2017).10

El componente de análisis demográfico visual se basa en la arquitectura DEX (Deep EXpectation) para la estimación de la edad aparente a partir de imágenes faciales¹¹ y en trabajos más amplios sobre la detección demográfica basada en el aprendizaje automático a partir de las redes sociales.¹²

Las distribuciones demográficas específicas de cada canal se calibran con respecto a los estudios en curso del Pew Research Center sobre los patrones de uso de las redes sociales en los distintos grupos demográficos.13

Advertencia honesta

Las estimaciones demográficas conllevan una incertidumbre inherente. Presentamos intervalos de confianza y señalamos los puntos de datos en los que las señales demográficas son escasas. Cuando no hay datos suficientes para producir una estimación fiable, mostramos «datos insuficientes» en lugar de valores imputados. Esta transparencia es fundamental para nuestra metodología: preferimos la precisión a la cobertura.

Sección 7

Modelización de afinidad y psicográfica

Puntuaciones de afinidad

La afinidad mide la fuerza relativa de la conexión entre una audiencia y una marca, una persona o una propiedad. El valor de referencia es 1,0, que representa la media del mercado. Una puntuación de afinidad superior a 1,0 indica un interés superior a la media; inferior a 1,0 indica un interés inferior a la media. Este enfoque basado en índices —habitual en la planificación de medios— permite la comparación directa entre puntos de datos y audiencias.

El cálculo de la afinidad se basa en técnicas de filtrado colaborativo y factorización de matrices, tal y como describen Koren, Bell y Volinsky (2009) en el contexto de los sistemas de recomendación.14 La idea central es que los patrones de coocurrencia en los datos de comportamiento revelan preferencias latentes que los puntos de datos individuales por sí solos no pueden captar.

Perfil psicográfico (28 rasgos)

Rascasse estima 28 rasgos psicográficos para cada audiencia, organizados en torno a dimensiones como la orientación hacia la sostenibilidad, la adopción de tecnología, la afinidad por el lujo, la conciencia sobre la salud y el compromiso cultural.

Cada rasgo se puntúa a través de puntos de datos marcadores: marcas, personas y propiedades que sirven como indicadores sólidos de una dimensión psicográfica concreta. Por ejemplo, el rasgo «Sostenibilidad» se basa en patrones de interacción con marcas como Patagonia, medios de comunicación sobre el cambio climático y eventos centrados en temas medioambientales. La puntuación del rasgo representa en qué medida una audiencia supera o queda por debajo del índice en estos puntos de datos marcadores en relación con la población general.

Este enfoque se basa en investigaciones sobre la predicción de rasgos psicológicos a partir del comportamiento digital² y en el Marco de Valores de Schwartz, que proporciona una taxonomía de los valores humanos con base teórica.¹⁵ Boyd et al. (2015) demostraron que las orientaciones de valores pueden inferirse de forma fiable a partir de los patrones de comportamiento digital.¹⁶

Nota metodológica

Todas las puntuaciones psicográficas se normalizan con respecto a la media del mercado. Una audiencia con una puntuación de sostenibilidad de 1,4 está un 40 % más orientada a la sostenibilidad que la población general, pero no es «altamente sostenible» en términos absolutos. Este enfoque relativo evita afirmaciones exageradas.

Sección 8

Inteligencia de ubicación

Rascasse proporciona inteligencia a nivel de ubicación en 200+ países, más de 100 000 ciudades y más de 250 000 códigos postales. Los datos de ubicación se obtienen a partir de la distribución geográfica del comportamiento de búsqueda, combinada con el análisis espacial de los puntos de interés (PDI).

Afinidad de ubicación

La afinidad de ubicación mide el grado de resonancia de una marca o propiedad en una zona geográfica específica en relación con la media nacional. Combina la distribución del volumen de búsquedas con los patrones de interés, siguiendo la metodología de análisis regional descrita por primera vez por Choi y Varian (2012).1

Base de datos de puntos de interés (POI)

El sistema mantiene una base de datos de más de 8 millones de puntos de interés procedentes de bases de datos geográficas abiertas, que incluyen ubicaciones de recintos, tiendas minoristas, instituciones culturales e instalaciones deportivas. Los POI se asignan a la taxonomía de ciudades y regiones de Rascasse, lo que permite un análisis espacial que conecta el comportamiento digital con la presencia en el mundo físico.

Detección de valores atípicos

No todos los puntos de datos geográficos son significativos. El sistema emplea la validación de vecindad para distinguir las tendencias locales genuinas de los artefactos de datos: una ciudad que muestre una afinidad inusualmente alta se valida comparándola con sus ciudades vecinas y con los patrones a nivel regional. Los picos aislados sin corroboración regional se marcan como posibles artefactos en lugar de presentarse como información relevante.

Sección 9

Cuota de búsqueda

La cuota de búsqueda mide la proporción de una marca respecto al volumen total de búsquedas de marca dentro de un conjunto competitivo definido. Propuesta formalmente por primera vez por Les Binet en IPA EffWorks Global en 202017, esta métrica ha sido validada desde entonces como un indicador fiable de la cuota de mercado.

El Think Tank de la IPA, dirigido por James Hankins, analizó 30 estudios en 12 categorías y 7 países, y concluyó que la cuota de búsqueda representa aproximadamente el 83 % de la variación de la cuota de mercado.18 Es fundamental destacar que los cambios en la cuota de búsqueda tienden a preceder a los cambios en la cuota de mercado real, lo que la convierte en un indicador adelantado de la dinámica competitiva.

Rascasse Implementación

Definición flexible de categorías: los conjuntos competitivos se definen por caso de uso, sin limitarse a taxonomías predefinidas. Un conjunto de «automóviles de gama alta» en Alemania puede diferir del mismo concepto en Estados Unidos.
Seguimiento mensual: La cuota de búsqueda se calcula mensualmente con comparaciones interanuales, lo que permite detectar tendencias más allá de las fluctuaciones estacionales.
Granularidad a nivel de país: cada mercado se analiza de forma independiente, reflejando que la dinámica competitiva varía según la geografía.
Normalización: Los volúmenes de búsqueda brutos se normalizan para tener en cuenta las fluctuaciones estacionales y el crecimiento o declive a nivel de categoría.

Validación académica

La cuota de búsqueda se basa en la visión más amplia de Choi y Varian (2012) de que los volúmenes de consultas de búsqueda contienen información predictiva sobre la actividad económica del mundo real. La contribución de Binet consistió en formalizar esto para el análisis competitivo a nivel de marca, trasladándolo de la previsión económica a la estrategia de marketing.

Sección 10

Validación y limitaciones

Marco de validación

Rascasse utiliza múltiples mecanismos de validación para garantizar la calidad de los resultados:

Coherencia entre fuentes: los puntos de datos deben confirmarse en al menos dos fuentes independientes antes de ser comunicados con un alto grado de fiabilidad. Los puntos de datos procedentes de una sola fuente se marcan como tales.
Estabilidad temporal: Los resultados se validan a lo largo de series temporales para filtrar el ruido de un solo mes. Los cambios repentinos y no corroborados dan lugar a una revisión en lugar de a un informe automático.
Benchmark Comparación con datos públicos: los perfiles se comparan periódicamente con datos disponibles externamente —índices de audiencia televisiva, cifras de ventas publicadas, datos demográficos del censo y resultados de estudios de mercado disponibles públicamente—.
Puntuación del factor de calidad: Cada dato lleva asociado un factor de calidad (QualFactor) que refleja la coherencia y la amplitud de los datos subyacentes. Los datos con un factor de calidad bajo se marcan en la interfaz de usuario.

Limitaciones conocidas

Creemos que la transparencia sobre las limitaciones es esencial para la credibilidad metodológica. Las siguientes son las limitaciones conocidas de nuestro enfoque:

Brecha digital

Nuestros datos reflejan las poblaciones en línea. Los segmentos demográficos con baja presencia digital —poblaciones de mayor edad en mercados en desarrollo, comunidades con acceso limitado a Internet— pueden estar infrarrepresentados en nuestros perfiles. No extrapolamos a poblaciones fuera de línea sin una advertencia explícita.

Cobertura de las fuentes

No todas las fuentes digitales proporcionan el mismo acceso a los datos. La cobertura varía según la fuente y la región. En mercados donde los servicios dominantes restringen el acceso a los datos públicos, nuestra diversidad de fuentes se ve reducida y los intervalos de confianza se amplían en consecuencia.

Estimación demográfica

Los datos demográficos se deducen, no se observan directamente. La fiabilidad varía según el tipo de dato y la disponibilidad de los mismos. Los datos con patrones de interacción específicos de cada canal bien definidos proporcionan estimaciones demográficas más fiables que aquellos con una presencia limitada o uniforme en los canales.

Resolución temporal

La mayoría de los puntos de datos se actualizan mensualmente o trimestralmente, no en tiempo real. Este diseño es intencionado: prioriza la estabilidad y la validación frente a la inmediatez. Para casos de uso que requieran actualizaciones en tiempo real, recomendamos complementar los datos de Rascasse con herramientas de monitorización específicas de cada canal.

Para obtener una lista completa de las referencias académicas en las que se basa esta metodología, consulte nuestra bibliografía.