martes, 2 de septiembre de 2014

TEORÍA DE LA ESTIMACIÓN

ESTIMADORES E INTERVALOS DE CONFIANZA.

La elección de un estimador particular depende de factores estadísticos (tales como fiabilidad del proceso de muestreo, validez del modelo asumido, etc.) y de factores no estadísticos(implicaciones económicas, razones prácticas y facilidad de ejecución).

Una estimación puntual tiene poco significado por si sola, ya que generalmente difiere del verdadero valor del parámetro. Es además necesario medir la precisión del estimador puntual y tener información sobre el posible error de estimación asociado a la estimación puntual. Para proporcionar esta información adicional, la estimación puntual se suele acompañar de un intervalo de estimación que indica un rango de valores del parámetro y una medida del grado de confianza que tenemos en que el intervalo de estimación incluya el valor verdadero del parámetro.

La estimación por intervalo: es aquella que calcula un intervalo que contenga entre sus límites, con cierta probabilidad, el verdadero valor del parámetro poblacional. Este intervalo se llama INTERVALO DE CONFIANZA.

ESTIMACIÓN POR INTERVALOS
Hemos visto que la media muestral es un buen estimador puntual de la media poblacional. El inconveniente principal es que un único valor observado generalmente no es exactamente igual a µ; habrá cierta diferencia. Sería conveniente tener idea de lo cerca que está nuestra estimación del verdadero valor de la media poblacional. También sería bueno poder dar información de lo seguros o confiados que estamos de la precisión de la estimación.


Para tener una idea, no solo del valor de la media, sino también de la precisión de la estimación, los investigadores optan por el método de estimación por intervalo o intervalos de confianza. Un intervalo estimador es lo que su propio nombre indica, un intervalo aleatorio, cuyos puntos extremos L 1 y L 2 son estadísticos. Esto se utiliza para determinar un intervalo numérico a partir de la muestra. Se espera que este contenga el parámetro de la población que está siendo estimado. Si se amplía el intervalo, se gana error, se pierde confianza. Un intervalo de confianza de µ del 95% es tal que:                            


Decir que un intervalo es un intervalo de confianza del 95% de µ significa que, cuando se utiliza un muestreo repetido de la población, el 95% de los intervalos resultantes deberá contener a µ; debido al azar, el 5% no incluirá la verdadera media poblacional. El grado de confianza deseado es controlado por el investigador.

ERROR DE ESTIMACIÓN Y LA CONFIABILIDAD.

Confiabilidad de las estimaciones: Las encuestas por muestreo, al igual que cualquier investigación exhaustiva, se ven afectadas por un tipo de error conocido como errores ajenos al muestreo; los mismos ocurren antes, durante y después de toda investigación estadística; pudiendo ser controlados o disminuidos razonablemente mediante una adecuada planificación, ya sea en la fase de diseño de cuestionario, instrucciones o capacitación, selección óptima del recurso humano, en la organización de campo y en otras actividades vinculadas.

Otro tipo de error que influye en los resultados de las investigaciones por muestreo, lo constituyen los errores muestrales, los que están estrechamente relacionados con el diseño estadístico utilizado para la selección de la muestra; y que mediante un buen esquema de muestreo y proceso de estimación, es posible reducirlos considerablemente.

En este sentido, el fundamento básico de los estudios por muestra, es el de proporcionar, a partir de una muestra única, resultados o estimaciones que se acerquen a los valores poblacionales o parámetros verdaderos. La diferencia entre el valor de la variable poblacional y el valor estimado de la variable de la muestra, se conoce como error de muestreo.

Metodología: El cálculo de los indicadores de calidad del muestreo estadístico, referidas a las estimaciones de las variables principales de la encuesta de arroz, maíz y frijol de bejuco en marzo de 2010, se realizó mediante el modelo del muestreo estratificado con afijación óptima.

Mediante los resultados de la encuesta se logra obtener dos tipos de
estimaciones:

Estimación puntual: Representa cualquier estadística (sean estas, totales, promedios, razones y otros) que nos permitan a partir de los datos muestrales, obtener valores aproximados o estimados de los valores poblacionales o parámetros.
El error de muestreo o variabilidad que contiene la estimación puntual, puede ser medida mediante el error estándar del estimador, proporcionando los resultados en términos absolutos.
La variabilidad de la estimación con respecto al valor verdadero o parámetro poblacional se puede interpretar de mejor forma a través del coeficiente de variación del estimador; debido a que el resultado es una medida relativa, es decir, un porcentaje.

INTERVALOS DE CONFIANZA

Intervalos de confianza para una media

Intervalos de confianza para proporción
Los intervalos de confianza para las medias y las diferencias entre medias se calculan directamente con programas estadísticos comerciales, tales como el Statistica (StatSoft, 1995) o el Minitab (Minitab, 2000). Desafortunadamente, la mayoría de los métodos para calcular las proporciones y sus diferencias tienen serias deficiencias (Newcombe, 1998a, 1998b, 1998c). El objetivo del presente es mostrar cómo calcular intervalos de confianza para proporciones y diferencias entre proporciones, aplicando métodos óptimos y explicar con ejemplos cómo se pueden interpretar.

Muchas variables existentes en todas las áreas de investigación con sujetos humanos son binarias, es decir que tienen dos posibles valores, como por ejemplo, el género (varón o mujer), estatus del cliente (afectado o no afectado), respuesta al tratamiento (positivo o negativo), etc. Cuando se registra una variable binaria para cada individuo o unidad de la muestra, usual-mente se reporta la proporción de casos que contiene cada grupo en particular y frecuentemente es expresada en términos de porcentaje. Por ejemplo, de 32 familias que tienen hijos jóvenes con esquizofrenia, 25 son calificadas con altos niveles de la expresividad emocional en el registro de línea base (Santos et al., 2001), aquí la proporción es .781 ó 78.1%. Las restantes siete familias tienen una baja expresividad emocional de 100 - 78.1 = 21.9%.

INTERVALOS DE CONFIANZA PARA PROPORCIONES

Aunque el intervalo de confianza de esta simple proporción se puede calcular fácilmente con una calculadora electrónica, sería más útil disponer de una computadora con el software apropiado. Generalmente se observa que las opciones por defecto de los programas de análisis estadísticos más difundidos tienen limitaciones para ayudar al usuario en esta área, así que la elaboración de una hoja de cálculo para calcular los intervalos de con- fianza para las proporciones y sus diferencias resultaría un elemento útil y accesible para los usuarios.

INTERVALO DE CONFIANZA PARA UNA SIMPLE PROPORCIÓN
Se supone que de n individuos o unidades, r son positivos, es decir, que tienen una característica de interés. Entonces la proporción de respuestas positivas es: p = r/n. Debido a ciertas necesidades analíticas y descriptivas, se quiere calcular un intervalo de confianza (IC) para tal proporción en la población de la cual se ha extraído la muestra.

Un IC para p se calcula comúnmente como:
(1)donde EE es el error estándar y queda definido como: y z toma el valor usual de 1.96 para el 95% IC.
Por ejemplo, con n = 32 y r = 25, p =  .781, y el intervalo de confianza construido con la ecuación (1) va desde .638 a .924, es decir, desde 63.8% hasta 92.4%.

ESTIMACIÓN DE UNA PROPORCION
El mejor estimador de la proporción (p) de una característica de una población es la proporción observada (p o ) en una muestra, que se corresponde con la frecuencia relativa de una característica en la muestra.
Si obtenemos distintas muestras de tamaño “n” de una población con una proporción “p” de una determinada característica, los distintos valores de las proporciones observadas no son todos ellos iguales y es necesario, por lo tanto, averiguar qué distribución siguen. Se puede afirmar que la distribución de este estimador es una distribución normal de media “p” y varianza “pxq/n”, cuando el tamaño de la muestra es suficientemente grande. Donde q al ser el complementario de p, vale 1-p .




 INTERVALO DE CONFIANZA DE UNA PROPORCION
Al seguir esta variable p una distribución normal, se puede calcular un intervalo que contenga entre sus límites una gran proporción de los valores de la variable p :






Distribución de intervalos de proporciones

DIFERENCIA DE MEDIAS 
Suponga que se tienen dos poblaciones distintas, la primera con media 1 y desviación estándar 1, y la segunda con media 2 y desviación estándar 2. Más aún, se elige una muestra aleatoria de tamaño n1 de la primera población y una muestra independiente aleatoria de tamaño n2 de la segunda población; se calcula la media muestral para cada muestra y la diferencia entre dichas medias. 


La colección de todas esas diferencias se llama distribución muestral de las diferencias entre medias o la distribución muestral del estadístico 

La distribución es aproximadamente normal para n130 y n230. Si las poblaciones son normales, entonces la distribución muestral de medias es normal sin importar los tamaños de las muestras.

La fórmula que se utilizará para el calculo de probabilidad del estadístico de diferencia de medias es:




Diferencia de proporciones.

Muchas aplicaciones involucran poblaciones de datos cualitativos que deben compararse utilizando proporciones o porcentajes. A continuación se citan algunos ejemplos:

Educación.- ¿Es mayor la proporción de los estudiantes que aprueban matemáticas que las de los que aprueban inglés?

Medicina.- ¿Es menor el porcentaje de los usuarios del medicamento A que presentan una reacción adversa que el de los usuarios del fármaco B que también presentan una reacción de ese tipo?

Administración.- ¿Hay diferencia entre los porcentajes de hombres y mujeres en posiciones gerenciales.
Ingeniería.- ¿Existe diferencia entre la proporción de artículos defectuosos que genera la máquina A a los que genera la máquina B?


Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos proporciones muestrales, la distribución muestral de diferencia de proporciones es aproximadamente normal para tamaños de muestra grande (n1p15, n1q15,n2p25 y n2q25). Entonces p1 y p2 tienen distribuciones muestrales aproximadamente normales, así que su diferencia p1-p2 también tiene una distribución muestral aproximadamente normal.



La fórmula que se utilizará para el calculo de probabilidad del estadístico de diferencia de proporciones es:
By: Agulló Candela, José; Carratalá Pastor, Vicente; Gimeno Aranda, Joaquín. In: Textos docentes. [Alicante] : Universidad de Alicante. 1999. eBook. Language: Spanish , Base de datos: eBook Academic Collection (EBSCOhost)
Materias: MATHEMATICS / Probability & Statistics / General; Commercial statistics

Publicación académica
By: Newcombe, Robert G.; Soto, Cesar Merino. Interdisciplinaria: Revista de Psicología y Ciencias Afines. 2006, Vol. 23 Issue 2, p141-154. 14p. Language: Spanish. , Base de datos: Academic Search Premier
It's nowadays accepted by many journals in diverse areas of health and social sciences, that confidence intervals give more descriptive information and they are better than hypothesis tests to ex...
Materias: CONFIDENCE intervals; STATISTICAL hypothesis testing; SAMPLE size (Statistics); SOCIAL sciences; CALCULUS; ELECTRONIC spreadsheets; STATISTICS; Research and Development in the Social Sciences and Humanities
Imágenes obtenidas de:

http://www.itch.edu.mx/academic/industrial/estadistica1/cap01c.html


No hay comentarios:

Publicar un comentario