Metodología para la encuestación digital
«Rutas digitales con el rigor metodológico tradicional»
RESUMEN
La juventud española está en internet. Y su forma nativa de relacionarse es digital. Lo digital es, por tanto, el medio natural en el que hacer investigación social sobre ella.
La encuesta on-line cuenta con múltiples ventajas, pero se han de adoptar aspectos de las metodologías tradicionales para garantizar una muestra representativa y que sus resultados tengan rigor.
Este artículo aborda los fundamentos básicos de la metodología que hay tras las encuestas y la teoría muestral, expone cuáles son las ventajas y los riesgos de los estudios tradicionales (presenciales o telefónicos) frente a los on-line, para, por último, ofrece una metodología específica para una encuesta on-line a la juventud española.
INVESTIGACIÓN SOCIAL EN LA ERA DIGITAL
En el siglo XIX confluyen las revoluciones del conocimiento y del trabajo, y el mundo cambia, con una nueva manera de entender el Estado, la política, la economía, la religión, aparecen la conciencia de clase y sus conflictos… el viejo mundo se rompe, se hace necesario construir otro, y para ello nace la sociología.
La sociología es una disciplina científica porque se basa en el método y requiere de unas técnicas de investigación definidas y procedimentadas, siendo las encuestas el claro ejemplo de técnica que ha sido bien definida, bien procedimentada, y que ha contado con el respaldo científico más evidente: la estadística.
Alrededor de las encuestas, se han desarrollado una serie de metodologías que han permitido contar con una significación estadística de los resultados obtenidos. Estas metodologías se crearon en una sociedad, la analógica o pre-digital, que ofrecía unas oportunidades y limitaciones determinadas. En la era digital, donde también confluyen las revoluciones del conocimiento y del trabajo, es obligatorio replantearse las metodologías.
La sociedad digital ofrece nuevas oportunidades y retos a las encuestas como herramienta de investigación social .
Sin embargo, la encuesta sigue siendo una herramienta básica en la medición de opiniones y tendencias. Y la transformación digital, la universalización del uso de Redes Sociales, sobre todo entre jóvenes, permiten unas altísimas participaciones y segmentaciones en las muestras a estudiar que la sociología tradicional pre-digital no contemplaba.
La transformación digital y la universalización de las Redes Sociales hacen necesario actualizar, o trasladar, a la era digital las técnicas de investigación social y sus metodologías.
LA IMPORTANCIA DEL (BUEN) MUESTREO
Para conocer un hecho social lo ideal es disponer del dato real. Pero cuando no es posible analizar a todos los elementos de una población, se selecciona una muestra, una parte representativa de dicha población.
Ejemplo: unas elecciones ofrecen el dato real de todo el universo. Un sondeo electoral es el intento de aproximarse al dato real a través de la encuesta a una muestra, a una parte, de ese universo.
La muestra ha de garantizar que, efectivamente, se trata de una parte representativa del conjunto del universo a estudiar y reproduce, de la mejor manera, los rasgos esenciales de dicho universo que son importantes para la investigación.
Las muestras son siempre imperfectas. Se acercan a la realidad, pero no son la realidad. Y se acercan a ella con un margen de error cuya magnitud a veces puede determinar por la estadística, siempre que se siga una metodología rigurosa y, obviamente, en condiciones de laboratorio.
¿Cómo garantizar que la muestra sea representativa del conjunto del universo a estudiar? Para responder a esta pregunta, la sociología tradicional ha ofrecido diferentes tipos de muestreo, clasificados en dos grandes grupos: el probabilístico y el no-probabilístico.
MUESTREO PROBABILÍSTICO
El muestreo probabilístico es el único que, tradicionalmente y según el consenso académico, permite llevar a cabo extrapolaciones al conjunto del universo con una significación estadística determinada, es decir, con unos errores muestrales determinados, y permite así afirmar hipótesis con una seguridad determinada.
Este muestreo probabilístico parte de un censo real y trata que todas las unidades o individuos se seleccionen respetando una probabilidad conocida. Básicamente, son muestreos usados por las grandes operaciones estadísticas de la administración. A partir del censo del que disponen, van fijando la muestra a través de diferentes operaciones (estratificaciones, afijaciones, sorteos y equilibrios) para garantizar que dicha muestra representa al conjunto del universo que se quiere estudiar. Se emplean diferentes métodos, como el Método del Cubo (Deville and Tillé, 2004), para mantener las proporciones de la población original en la muestra.
Una forma de aterrizar una operativa con muestreo probabilístico es a través de rutas aleatorias que el entrevistador debe seguir: pueblos, calles, portales, pisos, manos… normas, excepciones… perfiles determinados a buscar… Y hay variantes. A veces, la metodología indica que si no se logra entrevistar a una persona concreta, ha de buscarse una sustituta tras un determinado número de intentos. En otras ocasiones, la metodología indica que no ha de haber sustituciones. En este punto, es subrayable que hay estudios que señalan que dependiendo de la política a seguir con las sustituciones, los resultados cambian (Díaz de Rada y Martínez, 2020). El sistema más académico y más reconocido no es perfecto.
Ejemplo: En un campo de fútbol tenemos datos de las 40.000 personas que se sientan en cada localidad. A partir de aquí podemos realizar una muestra probabilística.
Pero en la realidad, el muestreo probabilístico puro no se suele poder aplicar debido a la magnitud de la información que se necesita para llevarlo a cabo (numeración exhaustiva de todas las unidades sin duplicidades) (Scheaffer et al., 2007). Es un procedimiento costoso y es complicado el acceso a datos censales.
Así, surgen otras variantes: muestreos probabilísticos “menos puros” en aquellas operaciones en las que no se estima como prioritario la realización de la entrevista en un hogar determinado, sino en una zona concreta.
El muestreo probabilístico es costoso de hacer, no es perfecto en su aplicación práctica, y cuenta con variantes que le confieren mayor o menor exhaustividad.
MUESTREO NO-PROBABILÍSTICO
De este modo, en la mayoría de ocasiones la investigación social se apoya en muestras no-probabilísticas. A diferencia del muestreo probabilístico, la muestra no-probabilística no es consecuencia de un proceso de absoluta selección aleatoria, sino que los sujetos generalmente son seleccionados en función de su accesibilidad o a criterio del investigador.
Ejemplo: En un campo de fútbol tenemos 40.000 personas, pero no sabemos nada de ellas. A partir de aquí podemos realizar una muestra no-probabilística.
El gran peligro de estas muestras es que no sean representativas y que a partir de ellas se realicen generalizaciones sin el fundamento adecuado (estimaciones inferenciales sobre la población).
¿Cómo garantizar, en un muestreo no-probabilístico, que los individuos de una población tienen (casi) la misma probabilidad de ser elegidos y formar parte de la muestra? ¿Cómo garantizar la (casi) aleatoriedad de una muestra que no parte de un censo? La respuesta que existe viene de la mano de métodos estadísticos y epidemiológicos, como por ejemplo los estudios de caso-control (donde los casos no son seleccionados aleatoriamente de la población) y con el “Muestreo por cuotas”.
El “Muestreo por cuotas”, muy empleado en encuestas de opinión, parte de un buen conocimiento de los estratos de la población que son más interesantes para los fines de la investigación, y a partir de este conocimiento se fijan unas «cuotas», un número de individuos que reúnen unas determinadas condiciones.
Sin embargo, no existe consenso académico suficiente como para poder decir que los resultados de las muestras no-probabilísticas cuentan con una determinada significación estadística, o sea, que son fiables-fiables a un tanto por ciento… pese a que puedan conseguir una alta aleatoriedad, pese a que la realidad demuestra que sus resultados, con rigor y volumen, son equiparables a los de las muestras de operaciones estadísticas que parten de datos censales.
En cualquier caso, un buen muestreo (probabilístico o no) será aquel cuyo resultados se podrán extrapolar al conjunto del universo, pasa por seleccionar de forma correcta a los miembros del estudio… y que se presten a realizar la encuesta.
El grado de aceptación de una encuesta condiciona los resultados, ya que las personas con opiniones más definidas y extremas pueden mostrarse más proclives a contestar una encuesta que las personas con opiniones menos extremas (Utzeta y Martin, 2019).
Sea una muestra probabilística o no, si no responden las personas que forman la muestra en primera instancia, el sesgo irá aumentando. Es clave el grado de aceptación.
LOS SESGOS NO DE MUESTRA
Una mala muestra no es la única causa que produce resultados incorrectos, o sesgados. Tanto en estudios con muestras probabilísticas como en no-probabilísticas, puede haber malos diseños o malas ejecuciones en la investigación.
Las muestras, aunque sean perfectas, no garantizan estudios perfectos, porque nunca se dan las condiciones perfectas en la realización de los estudios. Y estas condiciones, o la ausencia de ellas, son cosas que no recogen ni los errores muestrales ni las significaciones estadísticas de laboratorio.
Algunos ejemplos de sesgos en encuestas presenciales son, en la propia redacción del cuestionario, preguntas ordenadas de tal manera que condicionen las respuestas (sesgo de primacía o inmediatez).
El propio entrevistador puede, consciente o inconscientemente, condicionar las respuestas con lenguaje no verbal o directamente con observaciones.
Aún hoy, existen operativas basadas en exclusivamente llamadas a teléfonos fijos… en una sociedad, sobre todo la joven, cada vez más desprendida de ellos.
Existen rechazos a hacer las encuestas por las horas en las que se pregunta, la falta de disposición o no de la gente a abrir la puerta de sus casas a desconocidos… o porque sí, rechazo a la llamada al teléfono móvil incluso producidos por filtros anti-spam
También la realidad (aunque sobre esto no hay literatura) demuestra que, en ocasiones, los cuestionarios no son veraces, son parcialmente manipulados o falseados para llegar a cumplir cuotas u objetivos. ¿Cómo comprobar que efectivamente la encuesta se ha realizado y es veraz? Ante eso, existen mecanismos de control: controles visuales (ver a ojo que la encuesta parece coherente), controles físicos (llamadas telefónicas o incluso re-encuestas) a una parte de la muestra, y controles informáticos sobre las respuestas para descubrir incoherencias. Pero son mecanismos de alcance limitado.
Y, por último, otro de los sesgos presentes en mayore medida en las encuestas presenciales es el de la falta de sinceridad en las respuestas.
Ejemplo: el “voto oculto” es la intención de voto que, por impopular o mal vista, los encuestados no revelan y a las encuestas les cuesta detectar.
Las personas afirman ser más sinceras en encuestas on-line que en las físicas (Opinea, 2014). Y, por otra parte, también se apunta a que las respuestas on-line están más radicalizadas que las que se dan en encuestas telefónicas (Utzeta y Martin, 2019).
Las muestras son imperfectas… y las operativas también. Siempre hay sesgos, algunos asumibles y otros no.
ENCUESTA ANALÓGICA VS ENCUESTA ON-LINE
El futuro es digital. Y el futuro es ahora. El mundo digital ofrece recursos y ventajas respecto a la encuesta tradicional, como poder trabajar con gran volumen de casos, la reducción de sesgos (por encuestador u orden de preguntas), el abaratamiento de las operativas, respuestas más sinceras, flexibilidad en las metodologías, disponibilidad de las personas encuestadas, la naturalidad del medio digital para una generación entera, la inmediatez o la ubicuidad.
La encuesta on-line cuenta con múltiples ventajas, pero se han de adoptar aspectos de las metodologías de la sociología tradicional para garantizar para garantizar una muestra representativa y que sus resultados tengan rigor.
Con todo lo visto. ¿Cuáles son las ventajas y desventajas de hacer un estudio presencial o telefónico frente a uno on-line? ¿Cuáles son los riesgos más presentes en ambos mundos?
El gran reto de la encuesta on-line es garantizar la representatividad de la muestra y obtener una mayor aceptación (menos rechazo a responder).
METODOLOGÍA PARA LA ENCUESTACIÓN DIGITAL DE PERSONAS JÓVENES
“RUTAS DIGITALES CON EL RIGOR METODOLÓGICO TRADICIONAL”
La juventud española está en internet. Y su forma nativa de relacionarse es digital. Es, por tanto, el medio natural en el que hacer investigación social sobre ella.
Una investigación social sobre la juventud en España puede considerar que su universo de estudio, además de en sus hogares físicos (como contempla la sociología tradicional), también se encuentra presente en Internet y en las redes sociales. Así lo certifican diversos estudios (We are Social y Hootsuite, 2022) (INE, 2020).
Si en la metodología tradicional se trazan rutas para los encuestadores con el objetivo de garantizar la aleatoriedad y representatividad de la muestra (hogares o personas), ¿no pueden diseñarse “rutas digitales” a través de redes, perfiles, canales de comunicación… para lograr la aleatoriedad y representatividad de los perfiles que conformarán la muestra digital?
Estas “rutas digitales” pueden diseñarse en combinación con los recursos metodológicos tradicionales para garantizar que muestra representativa. Concretamente:
- Muestra por cuotas. Diseño de la muestra con cuotas preestablecidas para garantizar una alta representación. Hoy los recursos que hay en internet para la segmentación de la información, permiten dirigir las encuestas on-line hacia perfiles determinados, incluso hacia aquellos que son difíciles de captar por métodos tradicionales (como personas en riesgo de exclusión o poblaciones dispersas).
- Grupo de control. Contar con un número de casos bien identificados y fidelizados, presentes en el conjunto de series, para observar tendencias y detectar posibles sesgos en el conjunto de respuestas en una serie concreta (panelizarlos).
- Ponderación de resultados. En caso de desviaciones de muestra real sobre la teórica (por exceso o defecto de casos en una cuota dada), ponderar los resultados (con coeficientes de corrección) para equilibrar la muestra.
Con una muestra por cuotas bien segmentada y dirigida, con un grupo de control, con un tratamiento estadístico de la información obtenida y, por otra parte, con un alto grado de aceptación para hacer la encuesta y con una alta participación, el estudio podrá extrapolar sus resultados al conjunto de la juventud española o incluso a la realidad de la juventud en cada Comunidad Autónoma.
Aún teniendo la posibilidad de hacer una encuesta tradicional (muestra probabilística), una operativa digital con estas condiciones presenta más ventajas que limitaciones.
BIBLIOGRAFÍA
- Belzunegui, Ángel (2021). “Comprobando la calidad de las encuestas del CIS”. Artículo.
https://www.nuevatribuna.es/articulo/sociedad/comprobando-calidad-encuestas-cis/20210919204802191201.html - Díaz de Rada, Vidal y Martínez, Valentín (2020). “Diseños muestrales en hogares: diferencias y similitudes entre muestras probabilísticas y muestras con rutas y cuotas”. Revista Española de Investigaciones Sociológicas, 171: 23-42.
http://dx.doi.org/10.5477/cis/reis.171.23 - García González, Luis Ángel (2017). “Muestreo probabilístico y no probabilístico”. Artículo.
https://www.gestiopolis.com/muestreo-probabilistico-no-probabilistico-teoria - INE (2020). “Equipamiento y uso de TIC en los hogares”.
https://www.ine.es/prensa/tich_2020.pdf - Ochoa, Díaz (2015). “Margen de error en muestras no probabilísticas”.
https://www.netquest.com/blog/es/blog/es/margen-de-error-muestras-no-probabilisticas - Opinea (2014). “Access Panel Online de consumidores”.
https://www.panelopinea.es/ - Scheaffer, Richard; Mendenhall, William y Ott, Lyman (2007). “Elementos de muestreo”.
https://www.marcialpons.es/libros/elementos-de-muestreo/9788497324939/ - Tillé, Yves. “Muestreo Equilibrado Eficiente. El Método del Cubo”.
https://www.eustat.eus/productosServicios/datos/Seminario_52.pdf - Utzeta, Mireia y Martin, Unai (2019). “Las encuestas online y la falsa ilusión de la n grande. A propósito de una encuesta sobre la eutanasia en profesionales médicos”. Artículo.
https://www.sciencedirect.com/science/article/pii/S0213911119302213 - We are Social y Hootsuite (2022). “Global Overview Report”.
https://datareportal.com/reports/digital-2022-spain
© Santi Pisonero 2022.