TEORÍA DE LA
ESTIMACIÓN
ESTIMADORES E INTERVALOS DE CONFIANZA.
La elección de un estimador particular
depende de factores estadísticos (tales como fiabilidad del proceso de
muestreo, validez del modelo asumido, etc.) y de factores no estadísticos(implicaciones
económicas, razones prácticas y facilidad de ejecución).
Una estimación puntual tiene poco significado
por si sola, ya que generalmente difiere del verdadero valor del parámetro. Es
además necesario medir la precisión del estimador puntual y tener información
sobre el posible error de estimación asociado a la estimación puntual. Para
proporcionar esta información adicional, la estimación puntual se suele acompañar de un
intervalo de estimación que indica un rango de valores del parámetro y una medida
del grado de confianza que tenemos en que el intervalo de estimación incluya el
valor verdadero del parámetro.
La
estimación por intervalo: es aquella que calcula un intervalo que contenga
entre sus límites, con cierta probabilidad, el verdadero valor del parámetro
poblacional. Este intervalo se llama INTERVALO DE CONFIANZA.
ESTIMACIÓN POR INTERVALOS
Hemos visto que la media muestral es un buen
estimador puntual de la media poblacional. El inconveniente principal es que un
único valor observado generalmente no es exactamente igual
a µ; habrá cierta diferencia. Sería conveniente tener idea
de lo cerca que está nuestra estimación del verdadero valor de la media
poblacional. También sería bueno poder dar información de lo seguros o confiados
que estamos de la precisión de la estimación.
Para tener una idea, no solo del valor de la media,
sino también de la precisión de la estimación, los investigadores optan por el
método de estimación por intervalo o intervalos de confianza. Un intervalo estimador
es lo que su propio nombre indica, un intervalo aleatorio, cuyos puntos
extremos L 1 y L 2 son estadísticos. Esto se utiliza para determinar un
intervalo numérico a partir de la muestra. Se espera que este contenga el
parámetro de la población que está siendo estimado. Si se amplía el intervalo,
se gana error, se pierde confianza. Un intervalo de confianza de µ del 95% es
tal que: .
Decir que un intervalo es un
intervalo de confianza del 95% de µ significa que, cuando se utiliza un
muestreo repetido de la población, el 95% de los intervalos resultantes deberá
contener a µ; debido al azar, el 5% no incluirá la verdadera media poblacional.
El grado de confianza deseado es controlado por el investigador.
ERROR DE ESTIMACIÓN Y LA CONFIABILIDAD.
Confiabilidad de las estimaciones: Las encuestas por
muestreo, al igual que cualquier investigación exhaustiva, se ven afectadas por
un tipo de error conocido como errores ajenos al muestreo; los mismos ocurren
antes, durante y después de toda investigación estadística; pudiendo ser
controlados o disminuidos razonablemente mediante una adecuada planificación,
ya sea en la fase de diseño de cuestionario, instrucciones o capacitación,
selección óptima del recurso humano, en la organización de campo y en otras actividades
vinculadas.
Otro tipo de error que influye en los
resultados de las investigaciones por muestreo, lo constituyen los errores
muestrales, los que están estrechamente relacionados con el diseño estadístico
utilizado para la selección de la muestra; y que mediante un buen esquema de
muestreo y proceso de estimación, es posible reducirlos considerablemente.
En este sentido, el fundamento básico de los
estudios por muestra, es el de proporcionar, a partir de una muestra única,
resultados o estimaciones que se acerquen a los valores poblacionales o
parámetros verdaderos. La diferencia entre el valor de la variable poblacional
y el valor estimado de la variable de la muestra, se conoce como error de
muestreo.
Metodología: El cálculo de los indicadores de calidad del muestreo
estadístico, referidas a las estimaciones de las variables
principales de la encuesta de arroz, maíz y frijol de bejuco en marzo de
2010, se realizó mediante el modelo
del muestreo estratificado
con afijación óptima.
Mediante los resultados de la encuesta se
logra obtener dos tipos de
estimaciones:
Estimación puntual: Representa cualquier estadística (sean estas, totales,
promedios, razones y otros) que nos permitan a partir de los datos muestrales,
obtener valores aproximados o estimados de los valores poblacionales o
parámetros.
El error de muestreo o variabilidad que
contiene la estimación puntual, puede ser medida mediante el error estándar del
estimador, proporcionando los resultados en términos absolutos.
La variabilidad de la estimación con respecto
al valor verdadero o parámetro poblacional se puede interpretar de mejor forma
a través del coeficiente de variación del estimador; debido a que el resultado
es una medida relativa, es decir, un porcentaje.
INTERVALOS DE CONFIANZA
Intervalos de
confianza para una media
Intervalos de
confianza para proporción
Los intervalos de confianza para las medias y
las diferencias entre medias se calculan directamente con programas
estadísticos comerciales, tales como el Statistica (StatSoft, 1995) o el Minitab
(Minitab, 2000). Desafortunadamente, la mayoría de los métodos para calcular
las proporciones y sus diferencias tienen serias deficiencias (Newcombe, 1998a,
1998b, 1998c). El objetivo del presente es mostrar cómo calcular intervalos de
confianza para proporciones y diferencias entre proporciones, aplicando métodos
óptimos y explicar con ejemplos cómo se pueden interpretar.
Muchas variables existentes en todas las
áreas de investigación con sujetos humanos son binarias, es decir que tienen
dos posibles valores, como por ejemplo, el género (varón o mujer), estatus del
cliente (afectado o no afectado), respuesta al tratamiento (positivo o
negativo), etc. Cuando se registra una variable binaria para cada individuo o
unidad de la muestra, usual-mente se reporta la proporción de casos que contiene
cada grupo en particular y frecuentemente es expresada en términos de
porcentaje. Por ejemplo, de 32 familias que tienen hijos jóvenes con
esquizofrenia, 25 son calificadas con altos niveles de la expresividad
emocional en el registro de línea base (Santos et al., 2001), aquí la
proporción es .781 ó 78.1%. Las restantes siete familias tienen una baja
expresividad emocional de 100 - 78.1 = 21.9%.
INTERVALOS DE CONFIANZA PARA
PROPORCIONES
Aunque el intervalo de confianza de esta
simple proporción se puede calcular fácilmente con una calculadora electrónica,
sería más útil disponer de una computadora con el software apropiado.
Generalmente se observa que las opciones por defecto de los programas de
análisis estadísticos más difundidos tienen limitaciones para ayudar al usuario
en esta área, así que la elaboración de una hoja de cálculo para calcular los
intervalos de con- fianza para las proporciones y sus diferencias resultaría un
elemento útil y accesible para los usuarios.
INTERVALO DE CONFIANZA PARA UNA SIMPLE
PROPORCIÓN
Se supone que de n individuos o unidades, r son positivos, es decir, que tienen una característica de
interés. Entonces la proporción de respuestas positivas es: p = r/n. Debido a ciertas necesidades
analíticas y descriptivas, se quiere calcular un intervalo de confianza (IC)
para tal proporción en la población de la cual se ha extraído la muestra.
Un IC para p se calcula comúnmente como:
(1)donde EE es el error estándar y queda
definido como: y z toma el valor usual de 1.96 para el 95% IC.
Por ejemplo, con n = 32 y r = 25, p = .781, y el intervalo de confianza construido
con la ecuación (1) va desde .638 a .924, es decir, desde 63.8% hasta 92.4%.
ESTIMACIÓN
DE UNA PROPORCION
El mejor estimador de la proporción (p) de
una característica de una población es la proporción observada (p o
) en una muestra, que se corresponde con la frecuencia
relativa de una característica en la muestra.
Si obtenemos distintas muestras de tamaño “n” de
una población con una proporción “p” de una determinada característica, los
distintos valores de las proporciones observadas no son todos ellos iguales y
es necesario, por lo tanto, averiguar qué distribución siguen. Se puede afirmar
que la distribución de este estimador es una distribución normal de media “p” y
varianza “pxq/n”, cuando el tamaño de la muestra es suficientemente grande.
Donde q al ser el complementario de p, vale 1-p .
INTERVALO DE CONFIANZA DE UNA PROPORCION
Al seguir esta variable p una distribución normal,
se puede calcular un intervalo que contenga entre sus límites una gran
proporción de los valores de la variable p :
Distribución de intervalos de proporciones
DIFERENCIA DE MEDIAS
Suponga que se tienen dos poblaciones
distintas, la primera con media 1 y desviación estándar 1, y la segunda con media 2 y
desviación estándar 2. Más
aún, se elige una muestra aleatoria de tamaño n1 de la primera población y una muestra
independiente aleatoria de tamaño n2 de la segunda población; se calcula la
media muestral para cada muestra y la diferencia entre dichas medias.
La
colección de todas esas diferencias se llama distribución
muestral de las diferencias entre medias o
la distribución muestral del
estadístico
La distribución es aproximadamente normal
para n130 y n230. Si las poblaciones son normales, entonces
la distribución muestral de medias es normal sin importar los tamaños de las
muestras.
La fórmula que se utilizará para el calculo
de probabilidad del estadístico de diferencia de medias es:
Diferencia
de proporciones.
Muchas aplicaciones involucran poblaciones de datos
cualitativos que deben compararse utilizando proporciones o porcentajes. A
continuación se citan algunos ejemplos:
Educación.- ¿Es mayor la proporción de los
estudiantes que aprueban matemáticas que las de los que aprueban inglés?
Medicina.- ¿Es menor el porcentaje de los usuarios
del medicamento A que presentan una reacción adversa que el de los usuarios del
fármaco B que también presentan una reacción de ese tipo?
Administración.- ¿Hay diferencia entre los
porcentajes de hombres y mujeres en posiciones gerenciales.
Ingeniería.- ¿Existe diferencia entre la proporción
de artículos defectuosos que genera la máquina A a los que genera la máquina B?
Cuando el muestreo procede de dos poblaciones
binomiales y se trabaja con dos proporciones muestrales, la distribución
muestral de diferencia de proporciones es aproximadamente normal para tamaños
de muestra grande (n1p15, n1q15,n2p25 y n2q25). Entonces p1 y p2 tienen
distribuciones muestrales aproximadamente normales, así que su diferencia p1-p2 también
tiene una distribución muestral aproximadamente normal.
La fórmula que se utilizará para el calculo de
probabilidad del estadístico de diferencia de proporciones es:
By: Agulló Candela, José; Carratalá Pastor,
Vicente; Gimeno Aranda, Joaquín. In: Textos docentes. [Alicante] : Universidad
de Alicante. 1999. eBook. Language: Spanish , Base de
datos: eBook Academic Collection (EBSCOhost)
Materias: MATHEMATICS / Probability & Statistics / General; Commercial
statistics
Publicación académica
By: Newcombe, Robert G.; Soto, Cesar Merino. Interdisciplinaria:
Revista de Psicología y Ciencias
Afines. 2006, Vol. 23 Issue 2, p141-154. 14p. Language:
Spanish. , Base de datos: Academic Search Premier
It's nowadays accepted by many journals in diverse
areas of health and social sciences, that confidence intervals give more
descriptive information and they are better than hypothesis tests to ex...
Materias: CONFIDENCE
intervals; STATISTICAL hypothesis testing; SAMPLE size (Statistics); SOCIAL
sciences; CALCULUS; ELECTRONIC spreadsheets; STATISTICS; Research and
Development in the Social Sciences and Humanities
Imágenes
obtenidas de:
http://www.itch.edu.mx/academic/industrial/estadistica1/cap01c.html