Los estudios por muestreo o... ¿cuántas encuestas debo hacer
 para tener resultados adecuados?

Imprimir este Artículo


Uno de los aspectos más importantes y discutidos de la investigación de marketing es aquel referido a la determinación del tamaño de la muestra, es decir, de la cantidad de encuestas o entrevistas que se deben hacer en un estudio. Este punto, que es el elemento fundamental de la estadística, es muy mal comprendido y muy mal utilizado. 

Debido a esa mala comprensión muchas veces se hacen mucho más encuestas que lo que es estrictamente necesario o, en caso contrario, se hacen tan pocas que sus resultados no son estadísticamente significativos. 

Es por ello que hemos querido dedicar esta Carta sobre Consumidores y Mercados a un tema tan poco atractivo pero a la vez tan importante.

1. ¿Qué es un estudio por muestreo?

2. ¿Un estudio por muestreo puede dar resultados "exactos"?

3. Si es así, ¿siempre es mejor hacer un censo que un muestreo?

4. ¿Cuándo es el muestreo mejor que el censo?

5. Sin embargo, ¿un tamaño grande de muestra es siempre mejor que uno más pequeño?

6. ¿De qué depende entonces el tamaño de una muestra?

7. ¿Por qué el tamaño depende de la necesidad de precisión del cliente?

8. ¿Qué tiene que ver alli el tamaño de la población?

9. ¿También influye si la población es variada?

10. ¿Y que tiene que ver alli la talla de la más pequeña de las partes?

11. ¿En qué influye la existencia o no de datos completos sobre el universo?

12. ¿El presupuesto del estudio?

13. ¿Por qué influye la calidad de la recolección de datos?

14. ¿Qué quiere decir eso de "nivel de significación" y "nivel de precisión"?

15. ¿Se puede hablar de significación y de precisión para estudios con múltiples preguntas?

16. ¿La forma en que se realiza el muestreo influye en la precisión de los resultados?

17. ¿Cual es el tamaño ideal de la muestra?

18. Finalmente, ¿qué podemos decir sobre los precios de las encuestas?



1. ¿Qué es un estudio por muestreo?

Un estudio por muestreo es aquella investigación que se realiza estudiando solo una parte del total de casos (individuos, objetos, situaciones) que nos interesa conocer. Es decir, en lugar de estudiar a cada uno de los miembros de la población (por ejemplo a todas las consumidoras de cosméticos), estudiamos solo a unas cuantas con el fin de, a partir de ellas, tener una idea de lo que piensan todas.


2. ¿Un estudio por muestreo puede dar resultados "exactos"?

No, si por exacto se entiende "absolutamente iguales a la población". Es por ello necesario enfatizar en la última frase del párrafo anterior: "tener una idea". La única forma de estar completamente seguro de que tenemos el conocimiento exacto de la población es estudiando a todos y cada uno de los miembros de la misma. Ese estudio exhaustivo se llama Censo. Cuando se usa solo una parte de la población, es decir una muestra, siempre se va a tener solamente una aproximación de la realidad total, nunca la verdad exacta.

La diferencia entre el buen investigador y el menos bueno no está entonces en que uno dá resultados exactos y el otro no, sino en que uno minimiza la distancia entre el resultado dado por la muestra y la realidad. Es una cuestión relativa pero de máxima importancia.


3. Si es así, ¿siempre es mejor hacer un censo que un muestreo?

De manera general un censo es mejor que un muestreo cuando se trata de poblaciones pequeñas y cuando el investigador está dispuesto a incurrir en el costo evidentemente mayor del estudio. Sin embargo existen muchos casos en que un censo no es mejor sino por el contrario menos exacto que un estudio por muestreo.


4. ¿Cuándo es el muestreo mejor que el censo?

Uno de los casos es cuando la realización de un censo implica mucho tiempo de trabajo, lo cual aumenta los riesgos de interferencias durante el periodo de estudio (por ejemplo una campaña publicitaria de un competidor al medio del estudio). La validez del trabajo se verá entonces disminuida. Lo mismo sucede si el tiempo de estudio permite que los que todavía no han sido encuestados se enteren de que en otro lugar se está realizando un estudio y que por lo tanto se preparen para cuando les toque (su respuesta no será entonces espontánea).

Otro de los casos es cuando se necesita demasiado personal calificado para encuestar, con lo cual las variaciones debidas a la capacidad de los encuestadores se amplian. Es más fácil entrenar y controlar a 20 encuestadores que a 100. El trabajo hecho con menor cantidad de personas será más uniforme y por lo tanto más certero.

Finalmente hay casos en que es imposible hacer un censo por razones de tipo físico. Imaginemos que queremos conocer exactamente la calidad de un envío de fósforos. Tendríamos que abrir todas las cajas y encender todos los fósforos para estar seguros que sí encienden. Al final nos quedaríamos sin fósforos útiles. En estos casos evidentemente se debe hacer un muestreo y no un censo.


5. Sin embargo, ¿un tamaño grande de muestra es siempre mejor que uno más pequeño?

Evidentemente no siempre. Ya el lector habrá pensado que los mismos problemas señalados para un censo frente a una muestra se aplican en el caso de una muestra grande frente a una más pequeña. Nuevamente, una muestra mayor es en general mejor pero no siempre es asi.

6. ¿De qué depende entonces el tamaño de una muestra?

El tamaño de la muestra depende de muchos aspectos entrelazados, siendo los más importantes los siguientes:

De la necesidad de precisión del investigador

Del tamaño de la población

De la variedad al interior de la población

De la talla de la más pequeña de las partes

De la existencia de datos completos sobre el universo

Del presupuesto destinado al estudio

De la calidad de la colecta de datos


7. ¿Por qué el tamaño depende de la necesidad de precisión del cliente?

Como decíamos antes, a mayor tamaño de muestra en general mayor precisión de resultados. Por lo tanto si el cliente necesita tomar decisiones sumamente riesgosas (como el lanzamiento de un nuevo producto vital para la empresa) tendrá que usar una muestra grande. Si lo que quiere es de menor importancia (como probar un nuevo afiche publicitario) podrá permitirse muestras más pequeñas. El cliente decide.

En este aspecto debe señalarse que para que aumente la precisión del resultado en una unidad, deberá aumentar el tamaño de la muestra en el cuadrado de la misma. Es decir que si se quiere que el resultado de una encuesta sea tres veces más preciso, deberá aumentarse el tamaño de la muestra en 9 veces (32).


8. ¿Qué tiene que ver allí el tamaño de la población?

El tamaño de la población tiene una importancia relativa pues, de manera general, a mayor población se necesita mayor tamaño de muestra. Sin embargo, como se puede inferir del párrafo anterior, desde un punto de vista práctico la precisión varía muy poco para tamaños de población diferente. Por ejemplo en Estados Unidos o en Francia (200 y 50 millones de habitantes respectivamente) se pueden estimar adecuadamente los resultados de una votación nacional con una muestra igual de 300 personas.


9. ¿También influye si la población es variada?

Mucho más importante que el tamaño es la variedad de la población con respecto al tema a estudiar. Cuanto más variada la población, más grande el tamaño de la muestra necesaria. 

Pensemos que para catar un barril de vino es suficiente tomar una copita. Eso se debe a que normalmente el vino está distribuido de manera uniforme en el barril. Por el contrario si quisieramos conocer el contenido de un costal lleno de varios tipos de frejoles, seguramente tendriamos que tomar varias muestras. 

Es así que si queremos saber qué piensan sobre la disciplina los alumnos de un colegio militar (solo para hombres entre 13 y 18 años) tendremos que hacer menos encuestas que si se tratara de un colegio mixto de primaria y secundaria (hombres y mujeres de una diversidad mucho mayor de edades).


10. ¿Y que tiene que ver allí la talla de la más pequeña de las partes?

Tiene mucho que ver pues si queremos tener resultados válidos para todos los subgrupos de una población debemos pensar en el tamaño del subgrupo más pequeño. 

Por ejemplo, si sólo el 3% de personas de una población son los ricos y queremos saber qué opinan éstos, la muestra aleatoria (es decir al azar) debe ser de al menos 1000 personas (para que toquen 30 ricos). Si los ricos fueran 6%, con una muestra de 500 personas bastaría para tener 30 personas. El lector habrá comprendido que 30 es el número más pequeño a partir del cual se pueden tener conclusiones estadísticas válidas.

Ahora bien, es posible disminuir el tamaño de la muestra usando esquemas no-proporcionales, es decir buscando específicamente más ricos que lo que el azar nos daría (por ejemplo asignando mayor cantidad de encuestas a las zonas en donde viven los ricos). Debe señalarse sin embargo que en ese caso se pierde un poco de precisión estadística dado que se está usando técnicas orientadas no resultantes del azar.


11. ¿En qué influye la existencia o no de datos completos sobre el universo?

Teóricamente, una muestra estadísticamente adecuada debe ser sacada al azar de una lista completa de los integrantes del universo. De esta manera se obtiene una representanción exacta de todos los miembros de éste. Sin embargo, cuando no se tiene una lista exhaustiva del universo (o una muestra sacada aleatoriamente de éste), es necesario ampliar el número de encuestados para disminuir el error probable de trabajar con información menos exacta.

Este es desgraciadamente el caso de América Latina: no existen bases de datos completas. Ello obliga a utilizar muestras más grandes que las que se pueden usar en países más desarrollados en donde es usual encontrar mucha información para la preparación de muestras estadísticamente adecuadas.

12. ¿El presupuesto del estudio?

Evidentemente el presupuesto destinado al estudio influye mucho. A igualdad de calidad, un tamaño mayor de muestra es más caro y el cliente debe estar dispuesto a pagarlo. Ahora bien, es posible disminuir el tamaño de las muestras aumentando la calidad de la recolección de datos. En ese caso, el cliente debe considerar qué es lo más económico: aumentar la muestra o incrementar el costo de la recolección de datos.


13. ¿Por qué influye la calidad de la recolección de datos?

Estadísticamente se supone que toda recolección de datos es óptima, por lo cual la calidad no se discute. Sin embargo, en la práctica sabemos que es posible hacer recolecciones rápidas y sin mayor control o hacer recolecciones muy cuidadosas. En el caso de éstas últimas es evidente que la calidad de los resultados se vé fuertemente mejorada.

Diversos estudios muestran que los errores de investigación más grandes se derivan de:

Que la muestra no represente adecuadamente a la población.

Que las personas contactadas (la muestra inicial menos los rechazos de participación) no correspondan a la muestra escogida.

Que las preguntas hechas no correspondan a lo que se quiere conocer.

Que las respuestas de los encuestados no correspondan a la verdad.

Se observa entonces que de los 4 errores señalados arriba, solo el primero se deriva de un muestreo mal efectuado. Los otros tres corresponden a problemas de calidad en la recolección de datos. Se nota entonces la importancia de la calidad de la recolección para el logro de mejores resultados. Es probable que lo que diga ahora sea considerado una falasia desde el punto de vista estadístico. Sin embargo en la práctica eso funciona así.


14. ¿Qué quiere decir eso de "nivel de significación" y "nivel de precisión"?

La estadística es "la ciencia exacta de lo aproximado". Es por ello que cuando se dice que "el índice de aceptación de un producto es de 36% con un nivel de significación de 95% y un nivel de precisión de 2%" se nos está diciendo lo siguiente:

Que el 36% de los encuestados contestó que aceptaría el producto.

Que la respuesta en la población no es exactamente 36% sino que podría estar entre 34% y 38% (es decir 2% más o menos de la cifra dada). A esta variación se le denomina también "intervalo de confianza"

Que si se tomaran al azar 20 muestras diferentes de la misma población, la respuesta estaría entre 34 y 38% en 19 de las 20 muestras (95% = 19/20).

Como se verá, no hay nada exacto, sino solamente aproximaciones. Lo bueno de todo esto es que las aproximaciones son mejores que el olfato de muchos gerentes pues lo más probable es que éstos se equivoquen mucho más de una vez cada veinte que imaginan algo sobre el mercado.


15. ¿Se puede hablar de significación y de precisión para estudios con múltiples preguntas?

De manera general no. Los informes que señalan un nivel de significación XX y una precisión XY para todo el estudio sin duda presentan un problema conceptual: La significación y la precisión corresponden a una sola pregunta -probablemente la pregunta central- pero no a todas las preguntas pues en cada caso los datos son distintos.

Por ejemplo si se encuentra que "el índice de aceptación del detergente XYZ es de 36% con un nivel de significación de 95% y un nivel de precisión de 2%", no podría decirse que esos mismos valores (95 y 2) son válidos para la pregunta sobre cuántos kilos de detergentes compra al mes que se hiciera en la misma encuesta. 

El nivel de significación en este último caso depende de la variedad de montos de compra de los miembros de la población (la variedad de la población, como vimos anteriormente), y la precisión se expresaría en kilos y no en porcentajes como en el caso de la aceptación. El lector se dará cuenta que este es un error muy común en nuestro medio.


16. ¿La forma en que se realiza el muestreo influye en la precisión de los resultados?

Por supuesto, aunque raramente se toma en cuenta el tema para aspectos prácticos. Un muestreo no estrictamente al azar (por ejem. estratificado, por conglomerados o por racimos) disminuye la precisión estadística de los resultados aunque a veces es inevitable hacerlo. 

En el caso del Perú la falta de bases de datos a partir de los cuales se saque la muestra estadística hace que se deba recurrir con mucha frecuencia a muestreos no estrictamente aleatorios pues de otra manera la muestra seria demasiado grande.


17. ¿Cual es el tamaño ideal de la muestra?

Casi para terminar queda la pregunta clásica: ¿Cual es el tamaño de muestra más adecuado? Tal como se ha visto anteriormente, depende de muchas variables. 

Ahora bien, es posible definir algunos tamaños usuales tales como cuando se quiere conocer un dato binario (si o no) con un nivel de significación de 95% y un margen de error de +-4%. Para este caso la muestra debería ser de 400 personas (suponiendo que la dispersión de la población es máxima, es decir que la mitad dice asi y la otra no). 

Si se quiere un nivel de significación de 99% el tamaño deberá aumentar a XXX. Con el mismo nivel de significación una muestra de 2500 personas permitirá un margen de error de +- 2%, una de 625 permitirá uno de +- 4% y una muestra de 100 nos dará márgenes de +- 10%.


18. Finalmente, ¿qué podemos decir sobre los precios de las encuestas?

Es usual que los clientes decidan por una u otra empresa de investigación basándose casi exclusivamente en el precio por encuesta realizada. Eso es, luego de haber visto la gran complejidad del tema, evidentemente un error. 

Es como comprar las naranjas por su precio unitario sin considerar su tamaño, sabor o cantidad de jugo. La investigación no es un producto estandarizado y por lo tanto se deben analizar los diferentes aspectos de la calidad del producto antes de decidir por uno u otro proveedor. 

Se debe entonce considerar el tipo de problema, las características de la población, la calidad de la muestra, la manera de escogerla y la calidad de la recolección de datos. No deben desconocerse tampoco los temas adicionales de la investigación que son la calidad del tratamiento de los datos y la interpretación de los resultados. Esto último es evidentemente tema de otra Carta sobre Consumidores y Mercados.

Rolando Arellano C.

Centrum Católica

Arellano Investigación de Marketing