Uno
de los aspectos más importantes y discutidos de la investigación de marketing
es aquel referido a la determinación del tamaño de la muestra, es decir, de la
cantidad de encuestas o entrevistas que se deben hacer en un estudio. Este
punto, que es el elemento fundamental de la estadística, es muy mal comprendido
y muy mal utilizado.
Debido a esa mala comprensión muchas veces se hacen mucho más encuestas que lo
que es estrictamente necesario o, en caso contrario, se hacen tan pocas que sus
resultados no son estadísticamente significativos.
Es por ello que hemos querido dedicar esta Carta sobre Consumidores y Mercados a
un tema tan poco atractivo pero a la vez tan importante.
1. ¿Qué es un estudio por muestreo?
2. ¿Un estudio por muestreo puede dar resultados
"exactos"?
3. Si es así, ¿siempre es mejor hacer un censo que un
muestreo?
4. ¿Cuándo es el muestreo mejor que el censo?
5. Sin embargo, ¿un tamaño grande de muestra es
siempre mejor que uno más pequeño?
6. ¿De qué depende entonces el tamaño de una muestra?
7. ¿Por qué el tamaño depende de la necesidad de
precisión del cliente?
8. ¿Qué tiene que ver alli el tamaño de la población?
9. ¿También influye si la población es variada?
10. ¿Y que tiene que ver alli la talla de la más
pequeña de las partes?
11. ¿En qué influye la existencia o no de datos
completos sobre el universo?
12. ¿El presupuesto del estudio?
13. ¿Por qué influye la calidad de la recolección de
datos?
14. ¿Qué quiere decir eso de "nivel de
significación" y "nivel de precisión"?
15. ¿Se puede hablar de
significación y de precisión para estudios con múltiples preguntas?
16. ¿La forma en que se realiza el muestreo influye en
la precisión de los resultados?
17.
¿Cual es el tamaño ideal de la muestra?
18. Finalmente, ¿qué podemos decir sobre los precios
de las encuestas?
1. ¿Qué es un estudio por muestreo?
Un estudio por muestreo es aquella investigación que se realiza estudiando solo
una parte del total de casos (individuos, objetos, situaciones) que nos interesa
conocer. Es decir, en lugar de estudiar a cada uno de los miembros de la población
(por ejemplo a todas las consumidoras de cosméticos), estudiamos solo a unas
cuantas con el fin de, a partir de ellas, tener una idea de lo que piensan
todas.
2. ¿Un estudio por muestreo puede dar resultados
"exactos"?
No, si por exacto se entiende "absolutamente iguales a la población".
Es por ello necesario enfatizar en la última frase del párrafo anterior:
"tener una idea". La única forma de estar completamente seguro de que
tenemos el conocimiento exacto de la población es estudiando a todos y cada uno
de los miembros de la misma. Ese estudio exhaustivo se llama Censo. Cuando se
usa solo una parte de la población, es decir una muestra, siempre se va a tener
solamente una aproximación de la realidad total, nunca la verdad exacta.
La diferencia entre el buen investigador y el menos bueno no está entonces en
que uno dá resultados exactos y el otro no, sino en que uno minimiza la
distancia entre el resultado dado por la muestra y la realidad. Es una cuestión
relativa pero de máxima importancia.
3. Si es así, ¿siempre es mejor hacer un censo que un
muestreo?
De manera general un censo es mejor que un muestreo cuando se trata de
poblaciones pequeñas y cuando el investigador está dispuesto a incurrir en el
costo evidentemente mayor del estudio. Sin embargo existen muchos casos en que
un censo no es mejor sino por el contrario menos exacto que un estudio por
muestreo.
4. ¿Cuándo es el muestreo mejor que el censo?
Uno de los casos es cuando la realización de un censo implica mucho tiempo de
trabajo, lo cual aumenta los riesgos de interferencias durante el periodo de
estudio (por ejemplo una campaña publicitaria de un competidor al medio del
estudio). La validez del trabajo se verá entonces disminuida. Lo mismo sucede
si el tiempo de estudio permite que los que todavía no han sido encuestados se
enteren de que en otro lugar se está realizando un estudio y que por lo tanto
se preparen para cuando les toque (su respuesta no será entonces espontánea).
Otro de los casos es cuando se necesita demasiado personal calificado para
encuestar, con lo cual las variaciones debidas a la capacidad de los
encuestadores se amplian. Es más fácil entrenar y controlar a 20 encuestadores
que a 100. El trabajo hecho con menor cantidad de personas será más uniforme y
por lo tanto más certero.
Finalmente hay casos en que es imposible hacer un censo por razones de tipo físico.
Imaginemos que queremos conocer exactamente la calidad de un envío de fósforos.
Tendríamos que abrir todas las cajas y encender todos los fósforos para estar
seguros que sí encienden. Al final nos quedaríamos sin fósforos útiles. En
estos casos evidentemente se debe hacer un muestreo y no un censo.
5. Sin embargo, ¿un tamaño grande de muestra es siempre
mejor que uno más pequeño?
Evidentemente no siempre. Ya el lector habrá pensado que los mismos problemas
señalados para un censo frente a una muestra se aplican en el caso de una
muestra grande frente a una más pequeña. Nuevamente, una muestra mayor es en
general mejor pero no siempre es asi.
6. ¿De qué depende entonces el tamaño de una muestra?
El tamaño de la muestra depende de muchos aspectos entrelazados, siendo los más
importantes los siguientes:
De la necesidad de precisión del investigador
Del tamaño de la población
De la variedad al interior de la población
De la talla de la más pequeña de las partes
De la existencia de datos completos sobre el universo
Del presupuesto destinado al estudio
De la calidad de la colecta de datos
7. ¿Por qué el tamaño depende de la necesidad de precisión
del cliente?
Como decíamos antes, a mayor tamaño de muestra en general mayor precisión de
resultados. Por lo tanto si el cliente necesita tomar decisiones sumamente
riesgosas (como el lanzamiento de un nuevo producto vital para la empresa) tendrá
que usar una muestra grande. Si lo que quiere es de menor importancia (como
probar un nuevo afiche publicitario) podrá permitirse muestras más pequeñas.
El cliente decide.
En este aspecto debe señalarse que para que aumente la precisión del resultado
en una unidad, deberá aumentar el tamaño de la muestra en el cuadrado de la
misma. Es decir que si se quiere que el resultado de una encuesta sea tres veces
más preciso, deberá aumentarse el tamaño de la muestra en 9 veces (32).
8. ¿Qué tiene que ver allí el tamaño de la población?
El tamaño de la población tiene una importancia relativa pues, de manera
general, a mayor población se necesita mayor tamaño de muestra. Sin embargo,
como se puede inferir del párrafo anterior, desde un punto de vista práctico
la precisión varía muy poco para tamaños de población diferente. Por ejemplo
en Estados Unidos o en Francia (200 y 50 millones de habitantes respectivamente)
se pueden estimar adecuadamente los resultados de una votación nacional con una
muestra igual de 300 personas.
9. ¿También influye si la población es variada?
Mucho más importante que el tamaño es la variedad de la población con
respecto al tema a estudiar. Cuanto más variada la población, más grande el
tamaño de la muestra necesaria.
Pensemos que para catar un barril de vino es suficiente tomar una copita. Eso se
debe a que normalmente el vino está distribuido de manera uniforme en el
barril. Por el contrario si quisieramos conocer el contenido de un costal lleno
de varios tipos de frejoles, seguramente tendriamos que tomar varias muestras.
Es así que si queremos saber qué piensan sobre la disciplina los alumnos de un
colegio militar (solo para hombres entre 13 y 18 años) tendremos que hacer
menos encuestas que si se tratara de un colegio mixto de primaria y secundaria
(hombres y mujeres de una diversidad mucho mayor de edades).
10. ¿Y que tiene que ver allí la talla de la más pequeña
de las partes?
Tiene mucho que ver pues si queremos tener resultados válidos para todos los
subgrupos de una población debemos pensar en el tamaño del subgrupo más pequeño.
Por ejemplo, si sólo el 3% de personas de una población son los ricos y
queremos saber qué opinan éstos, la muestra aleatoria (es decir al azar) debe
ser de al menos 1000 personas (para que toquen 30 ricos). Si los ricos fueran
6%, con una muestra de 500 personas bastaría para tener 30 personas. El lector
habrá comprendido que 30 es el número más pequeño a partir del cual se
pueden tener conclusiones estadísticas válidas.
Ahora bien, es posible disminuir el tamaño de la muestra usando esquemas
no-proporcionales, es decir buscando específicamente más ricos que lo que el
azar nos daría (por ejemplo asignando mayor cantidad de encuestas a las zonas
en donde viven los ricos). Debe señalarse sin embargo que en ese caso se pierde
un poco de precisión estadística dado que se está usando técnicas orientadas
no resultantes del azar.
11. ¿En qué influye la existencia o no de datos completos
sobre el universo?
Teóricamente, una muestra estadísticamente adecuada debe ser sacada al azar de
una lista completa de los integrantes del universo. De esta manera se obtiene
una representanción exacta de todos los miembros de éste. Sin embargo, cuando
no se tiene una lista exhaustiva del universo (o una muestra sacada
aleatoriamente de éste), es necesario ampliar el número de encuestados para
disminuir el error probable de trabajar con información menos exacta.
Este es desgraciadamente el caso de América Latina: no existen bases de datos
completas. Ello obliga a utilizar muestras más grandes que las que se pueden
usar en países más desarrollados en donde es usual encontrar mucha información
para la preparación de muestras estadísticamente adecuadas.
12. ¿El presupuesto del estudio?
Evidentemente el presupuesto destinado al estudio influye mucho. A igualdad de
calidad, un tamaño mayor de muestra es más caro y el cliente debe estar
dispuesto a pagarlo. Ahora bien, es posible disminuir el tamaño de las muestras
aumentando la calidad de la recolección de datos. En ese caso, el cliente debe
considerar qué es lo más económico: aumentar la muestra o incrementar el
costo de la recolección de datos.
13. ¿Por qué influye la calidad de la recolección de
datos?
Estadísticamente se supone que toda recolección de datos es óptima, por lo
cual la calidad no se discute. Sin embargo, en la práctica sabemos que es
posible hacer recolecciones rápidas y sin mayor control o hacer recolecciones
muy cuidadosas. En el caso de éstas últimas es evidente que la calidad de los
resultados se vé fuertemente mejorada.
Diversos estudios muestran que los errores de investigación más grandes se
derivan de:
Que la muestra no represente adecuadamente a la población.
Que las personas contactadas (la muestra inicial menos los rechazos de
participación) no correspondan a la muestra escogida.
Que las preguntas hechas no correspondan a lo que se quiere conocer.
Que las respuestas de los encuestados no correspondan a la verdad.
Se observa entonces que de los 4 errores señalados arriba, solo el primero se
deriva de un muestreo mal efectuado. Los otros tres corresponden a problemas de
calidad en la recolección de datos. Se nota entonces la importancia de la
calidad de la recolección para el logro de mejores resultados. Es probable que
lo que diga ahora sea considerado una falasia desde el punto de vista estadístico.
Sin embargo en la práctica eso funciona así.
14. ¿Qué quiere decir eso de "nivel de significación"
y "nivel de precisión"?
La estadística es "la ciencia exacta de lo aproximado". Es por ello
que cuando se dice que "el índice de aceptación de un producto es de 36%
con un nivel de significación de 95% y un nivel de precisión de 2%" se
nos está diciendo lo siguiente:
Que el 36% de los encuestados contestó que aceptaría el producto.
Que la respuesta en la población no es exactamente 36% sino que podría estar
entre 34% y 38% (es decir 2% más o menos de la cifra dada). A esta variación
se le denomina también "intervalo de confianza"
Que si se tomaran al azar 20 muestras diferentes de la misma población, la
respuesta estaría entre 34 y 38% en 19 de las 20 muestras (95% = 19/20).
Como se verá, no hay nada exacto, sino solamente aproximaciones. Lo bueno de
todo esto es que las aproximaciones son mejores que el olfato de muchos gerentes
pues lo más probable es que éstos se equivoquen mucho más de una vez cada
veinte que imaginan algo sobre el mercado.
15. ¿Se puede hablar de significación y de precisión para
estudios con múltiples preguntas?
De manera general no. Los informes que señalan un nivel de significación XX y
una precisión XY para todo el estudio sin duda presentan un problema
conceptual: La significación y la precisión corresponden a una sola pregunta
-probablemente la pregunta central- pero no a todas las preguntas pues en cada
caso los datos son distintos.
Por ejemplo si se encuentra que "el índice de aceptación del detergente
XYZ es de 36% con un nivel de significación de 95% y un nivel de precisión de
2%", no podría decirse que esos mismos valores (95 y 2) son válidos para
la pregunta sobre cuántos kilos de detergentes compra al mes que se hiciera en
la misma encuesta.
El nivel de significación en este último caso depende de la variedad de montos
de compra de los miembros de la población (la variedad de la población, como
vimos anteriormente), y la precisión se expresaría en kilos y no en
porcentajes como en el caso de la aceptación. El lector se dará cuenta que
este es un error muy común en nuestro medio.
16. ¿La forma en que se realiza el muestreo influye en la
precisión de los resultados?
Por supuesto, aunque raramente se toma en cuenta el tema para aspectos prácticos.
Un muestreo no estrictamente al azar (por ejem. estratificado, por conglomerados
o por racimos) disminuye la precisión estadística de los resultados aunque a
veces es inevitable hacerlo.
En el caso del Perú la falta de bases de datos a partir de los cuales se saque
la muestra estadística hace que se deba recurrir con mucha frecuencia a
muestreos no estrictamente aleatorios pues de otra manera la muestra seria
demasiado grande.
17. ¿Cual es el tamaño ideal de la muestra?
Casi para terminar queda la pregunta clásica: ¿Cual es el tamaño de muestra más
adecuado? Tal como se ha visto anteriormente, depende de muchas variables.
Ahora bien, es posible definir algunos tamaños usuales tales como cuando se
quiere conocer un dato binario (si o no) con un nivel de significación de 95% y
un margen de error de +-4%. Para este caso la muestra debería ser de 400
personas (suponiendo que la dispersión de la población es máxima, es decir
que la mitad dice asi y la otra no).
Si se quiere un nivel de significación de 99% el tamaño deberá aumentar a
XXX. Con el mismo nivel de significación una muestra de 2500 personas permitirá
un margen de error de +- 2%, una de 625 permitirá uno de +- 4% y una muestra de
100 nos dará márgenes de +- 10%.
18. Finalmente, ¿qué podemos decir sobre los precios de
las encuestas?
Es usual que los clientes decidan por una u otra empresa de investigación basándose
casi exclusivamente en el precio por encuesta realizada. Eso es, luego de haber
visto la gran complejidad del tema, evidentemente un error.
Es como comprar las naranjas por su precio unitario sin considerar su tamaño,
sabor o cantidad de jugo. La investigación no es un producto estandarizado y
por lo tanto se deben analizar los diferentes aspectos de la calidad del
producto antes de decidir por uno u otro proveedor.
Se debe entonce considerar el tipo de problema, las características de la
población, la calidad de la muestra, la manera de escogerla y la calidad de la
recolección de datos. No deben desconocerse tampoco los temas adicionales de la
investigación que son la calidad del tratamiento de los datos y la interpretación
de los resultados. Esto último es evidentemente tema de otra Carta sobre
Consumidores y Mercados.