viernes, 12 de septiembre de 2014

PRUEBA PILOTO

Como parte de un proyecto de estudio se realizó una encuesta a un grupo de estudiantes participantes del Programa de Educación Básica Telesecundaria, en el departamento de Santa Rosa, ciudad de Guatemala.

Parte de la muestra de los estudiantes (10 estudiantes) respondió la siguiente encuesta, como parte de la realización de la prueba piloto para previo a ejecutar el estudio general.

ENCUESTA

PROGRAMA DE EDUCACIÓN BÁSICA TELESECUNDARIA

La siguiente encuesta ha sido realizada por estudiantes de la Facultad de Educación de La Universidad  del Valle de Guatemala, con fines didácticos para el curso de Estadística Inferencial, será respondida por estudiantes participantes del programa educativo anteriormente mencionado, Guatemala, agosto 2014.

·       Lea atentamente las siguientes preguntas y marque con una X en el espacio correspondiente SI o NO según sea su respuesta.

No.
PREGUNTA
SI
NO

1

¿Tiene libro de ejercicios?



2

¿Tiene libro de conceptos básicos?



3

¿En su clase tienen cañonera para proyectar los videos?



4

¿Tienen televisión y reproductor de DVD en su clase?



5

¿Funcionan la cañonera, televisión y DVD?



6

¿Sus maestros le explican cómo usar sus libros de ejercicios?



7

¿Los libros, videos y recursos que le han dado en clase le han ayudado a aprender más fácilmente?



  • Lea y responda:
  1. ¿Cómo se ha sentido estudiando con el programa de Telesecundaria?
____________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________

  1. ¿Participar en éste programa le ayuda en su vida diaria?
____________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________

RESULTADOS

Los resultados obtenidos de la prueba piloto realizada a los estudiantes podemos observarlos en la siguiente gráfica:


CONCLUSIONES

Por lo presentado anteriormente, después de la recolección, comparación y análisis de los datos obtenidos, observaremos las siguientes conclusiones:





jueves, 11 de septiembre de 2014

PARA REÍR UN POCO...

Las personas son tan felices como decidan serlo.
Abraham Lincoln








viernes, 5 de septiembre de 2014

MUESTREO

En estadística se conoce como muestreo a la técnica para la selección de una muestra a partir de una población.
Al elegir una muestra aleatoria se espera conseguir que sus propiedades sean extrapolables a la población. Este proceso permite ahorrar recursos, y a la vez obtener resultados parecidos a los que se alcanzarían si se realizase un estudio de toda la población.

Cabe mencionar que para que el muestreo sea válido y se pueda realizar un estudio adecuado (que consienta no solo hacer estimaciones de la población sino estimar también los márgenes de error correspondientes a dichas estimaciones), debe cumplir ciertos requisitos. Nunca podremos estar enteramente seguros de que el resultado sea una muestra representativa, pero sí podemos actuar de manera que esta condición se alcance con una probabilidad alta.


En el muestreo, si el tamaño de la muestra es más pequeño que el tamaño de la población, se puede extraer dos o más muestras de la misma población. Al conjunto de muestras que se pueden obtener de la población se denomina espacio muestral. La variable que asocia a cada muestra su probabilidad de extracción, sigue la llamada distribución muestral.

    En cierto barrio se quiere hacer un estudio para conocer mejor el tipo de actividades de ocio que gustan más a sus habitantes. Para ello van a ser encuestados 100 individuos elegidos al azar.

Explicar qué procedimiento de selección sería más adecuado utilizar: muestreo con o sin reposición. ¿Por qué?

Todas las fórmulas que hemos estudiado de teoría del muestreo y de inferencia estadística presuponen que las poblaciones son infinitas o que, si no lo son, el muestreo aleatorio se realiza con reposición.

Como los gustos cambian con la edad y se sabe que en el barrio viven 2.500 niños, 7.000 adultos y 500 ancianos, posteriormente se decide elegir la muestra anterior utilizando un muestreo estratificado.

Determinar el tamaño muestral correspondiente a cada estrato.

Para efectuar un muestreo aleatorio estratificado, será necesario que la muestra refleje fielmente los estratos existentes en la población; deben considerarse los estratos formados por: niños, adultos y ancianos.


El tamaño muestral de cada estrato deberá ser proporcional a la presencia del mismo en la población original:



    Se ha tomado una muestra de los precios de un mismo producto alimenticio en 16 comercios, elegidos al azar en un barrio de una ciudad, y se han encontrado los siguientes precios:

95, 108, 97, 112, 99, 106, 105, 100, 99, 98, 104, 110, 107, 111, 103, 110.

Suponiendo que los precios de este producto se distribuyen según una ley normal de varianza 25 y media desconocida:



Fuente:
EBSCO UVG

martes, 2 de septiembre de 2014

TEORÍA DE LA ESTIMACIÓN

ESTIMADORES E INTERVALOS DE CONFIANZA.

La elección de un estimador particular depende de factores estadísticos (tales como fiabilidad del proceso de muestreo, validez del modelo asumido, etc.) y de factores no estadísticos(implicaciones económicas, razones prácticas y facilidad de ejecución).

Una estimación puntual tiene poco significado por si sola, ya que generalmente difiere del verdadero valor del parámetro. Es además necesario medir la precisión del estimador puntual y tener información sobre el posible error de estimación asociado a la estimación puntual. Para proporcionar esta información adicional, la estimación puntual se suele acompañar de un intervalo de estimación que indica un rango de valores del parámetro y una medida del grado de confianza que tenemos en que el intervalo de estimación incluya el valor verdadero del parámetro.

La estimación por intervalo: es aquella que calcula un intervalo que contenga entre sus límites, con cierta probabilidad, el verdadero valor del parámetro poblacional. Este intervalo se llama INTERVALO DE CONFIANZA.

ESTIMACIÓN POR INTERVALOS
Hemos visto que la media muestral es un buen estimador puntual de la media poblacional. El inconveniente principal es que un único valor observado generalmente no es exactamente igual a µ; habrá cierta diferencia. Sería conveniente tener idea de lo cerca que está nuestra estimación del verdadero valor de la media poblacional. También sería bueno poder dar información de lo seguros o confiados que estamos de la precisión de la estimación.


Para tener una idea, no solo del valor de la media, sino también de la precisión de la estimación, los investigadores optan por el método de estimación por intervalo o intervalos de confianza. Un intervalo estimador es lo que su propio nombre indica, un intervalo aleatorio, cuyos puntos extremos L 1 y L 2 son estadísticos. Esto se utiliza para determinar un intervalo numérico a partir de la muestra. Se espera que este contenga el parámetro de la población que está siendo estimado. Si se amplía el intervalo, se gana error, se pierde confianza. Un intervalo de confianza de µ del 95% es tal que:                            


Decir que un intervalo es un intervalo de confianza del 95% de µ significa que, cuando se utiliza un muestreo repetido de la población, el 95% de los intervalos resultantes deberá contener a µ; debido al azar, el 5% no incluirá la verdadera media poblacional. El grado de confianza deseado es controlado por el investigador.

ERROR DE ESTIMACIÓN Y LA CONFIABILIDAD.

Confiabilidad de las estimaciones: Las encuestas por muestreo, al igual que cualquier investigación exhaustiva, se ven afectadas por un tipo de error conocido como errores ajenos al muestreo; los mismos ocurren antes, durante y después de toda investigación estadística; pudiendo ser controlados o disminuidos razonablemente mediante una adecuada planificación, ya sea en la fase de diseño de cuestionario, instrucciones o capacitación, selección óptima del recurso humano, en la organización de campo y en otras actividades vinculadas.

Otro tipo de error que influye en los resultados de las investigaciones por muestreo, lo constituyen los errores muestrales, los que están estrechamente relacionados con el diseño estadístico utilizado para la selección de la muestra; y que mediante un buen esquema de muestreo y proceso de estimación, es posible reducirlos considerablemente.

En este sentido, el fundamento básico de los estudios por muestra, es el de proporcionar, a partir de una muestra única, resultados o estimaciones que se acerquen a los valores poblacionales o parámetros verdaderos. La diferencia entre el valor de la variable poblacional y el valor estimado de la variable de la muestra, se conoce como error de muestreo.

Metodología: El cálculo de los indicadores de calidad del muestreo estadístico, referidas a las estimaciones de las variables principales de la encuesta de arroz, maíz y frijol de bejuco en marzo de 2010, se realizó mediante el modelo del muestreo estratificado con afijación óptima.

Mediante los resultados de la encuesta se logra obtener dos tipos de
estimaciones:

Estimación puntual: Representa cualquier estadística (sean estas, totales, promedios, razones y otros) que nos permitan a partir de los datos muestrales, obtener valores aproximados o estimados de los valores poblacionales o parámetros.
El error de muestreo o variabilidad que contiene la estimación puntual, puede ser medida mediante el error estándar del estimador, proporcionando los resultados en términos absolutos.
La variabilidad de la estimación con respecto al valor verdadero o parámetro poblacional se puede interpretar de mejor forma a través del coeficiente de variación del estimador; debido a que el resultado es una medida relativa, es decir, un porcentaje.

INTERVALOS DE CONFIANZA

Intervalos de confianza para una media

Intervalos de confianza para proporción
Los intervalos de confianza para las medias y las diferencias entre medias se calculan directamente con programas estadísticos comerciales, tales como el Statistica (StatSoft, 1995) o el Minitab (Minitab, 2000). Desafortunadamente, la mayoría de los métodos para calcular las proporciones y sus diferencias tienen serias deficiencias (Newcombe, 1998a, 1998b, 1998c). El objetivo del presente es mostrar cómo calcular intervalos de confianza para proporciones y diferencias entre proporciones, aplicando métodos óptimos y explicar con ejemplos cómo se pueden interpretar.

Muchas variables existentes en todas las áreas de investigación con sujetos humanos son binarias, es decir que tienen dos posibles valores, como por ejemplo, el género (varón o mujer), estatus del cliente (afectado o no afectado), respuesta al tratamiento (positivo o negativo), etc. Cuando se registra una variable binaria para cada individuo o unidad de la muestra, usual-mente se reporta la proporción de casos que contiene cada grupo en particular y frecuentemente es expresada en términos de porcentaje. Por ejemplo, de 32 familias que tienen hijos jóvenes con esquizofrenia, 25 son calificadas con altos niveles de la expresividad emocional en el registro de línea base (Santos et al., 2001), aquí la proporción es .781 ó 78.1%. Las restantes siete familias tienen una baja expresividad emocional de 100 - 78.1 = 21.9%.

INTERVALOS DE CONFIANZA PARA PROPORCIONES

Aunque el intervalo de confianza de esta simple proporción se puede calcular fácilmente con una calculadora electrónica, sería más útil disponer de una computadora con el software apropiado. Generalmente se observa que las opciones por defecto de los programas de análisis estadísticos más difundidos tienen limitaciones para ayudar al usuario en esta área, así que la elaboración de una hoja de cálculo para calcular los intervalos de con- fianza para las proporciones y sus diferencias resultaría un elemento útil y accesible para los usuarios.

INTERVALO DE CONFIANZA PARA UNA SIMPLE PROPORCIÓN
Se supone que de n individuos o unidades, r son positivos, es decir, que tienen una característica de interés. Entonces la proporción de respuestas positivas es: p = r/n. Debido a ciertas necesidades analíticas y descriptivas, se quiere calcular un intervalo de confianza (IC) para tal proporción en la población de la cual se ha extraído la muestra.

Un IC para p se calcula comúnmente como:
(1)donde EE es el error estándar y queda definido como: y z toma el valor usual de 1.96 para el 95% IC.
Por ejemplo, con n = 32 y r = 25, p =  .781, y el intervalo de confianza construido con la ecuación (1) va desde .638 a .924, es decir, desde 63.8% hasta 92.4%.

ESTIMACIÓN DE UNA PROPORCION
El mejor estimador de la proporción (p) de una característica de una población es la proporción observada (p o ) en una muestra, que se corresponde con la frecuencia relativa de una característica en la muestra.
Si obtenemos distintas muestras de tamaño “n” de una población con una proporción “p” de una determinada característica, los distintos valores de las proporciones observadas no son todos ellos iguales y es necesario, por lo tanto, averiguar qué distribución siguen. Se puede afirmar que la distribución de este estimador es una distribución normal de media “p” y varianza “pxq/n”, cuando el tamaño de la muestra es suficientemente grande. Donde q al ser el complementario de p, vale 1-p .




 INTERVALO DE CONFIANZA DE UNA PROPORCION
Al seguir esta variable p una distribución normal, se puede calcular un intervalo que contenga entre sus límites una gran proporción de los valores de la variable p :






Distribución de intervalos de proporciones

DIFERENCIA DE MEDIAS 
Suponga que se tienen dos poblaciones distintas, la primera con media 1 y desviación estándar 1, y la segunda con media 2 y desviación estándar 2. Más aún, se elige una muestra aleatoria de tamaño n1 de la primera población y una muestra independiente aleatoria de tamaño n2 de la segunda población; se calcula la media muestral para cada muestra y la diferencia entre dichas medias. 


La colección de todas esas diferencias se llama distribución muestral de las diferencias entre medias o la distribución muestral del estadístico 

La distribución es aproximadamente normal para n130 y n230. Si las poblaciones son normales, entonces la distribución muestral de medias es normal sin importar los tamaños de las muestras.

La fórmula que se utilizará para el calculo de probabilidad del estadístico de diferencia de medias es:




Diferencia de proporciones.

Muchas aplicaciones involucran poblaciones de datos cualitativos que deben compararse utilizando proporciones o porcentajes. A continuación se citan algunos ejemplos:

Educación.- ¿Es mayor la proporción de los estudiantes que aprueban matemáticas que las de los que aprueban inglés?

Medicina.- ¿Es menor el porcentaje de los usuarios del medicamento A que presentan una reacción adversa que el de los usuarios del fármaco B que también presentan una reacción de ese tipo?

Administración.- ¿Hay diferencia entre los porcentajes de hombres y mujeres en posiciones gerenciales.
Ingeniería.- ¿Existe diferencia entre la proporción de artículos defectuosos que genera la máquina A a los que genera la máquina B?


Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos proporciones muestrales, la distribución muestral de diferencia de proporciones es aproximadamente normal para tamaños de muestra grande (n1p15, n1q15,n2p25 y n2q25). Entonces p1 y p2 tienen distribuciones muestrales aproximadamente normales, así que su diferencia p1-p2 también tiene una distribución muestral aproximadamente normal.



La fórmula que se utilizará para el calculo de probabilidad del estadístico de diferencia de proporciones es:
By: Agulló Candela, José; Carratalá Pastor, Vicente; Gimeno Aranda, Joaquín. In: Textos docentes. [Alicante] : Universidad de Alicante. 1999. eBook. Language: Spanish , Base de datos: eBook Academic Collection (EBSCOhost)
Materias: MATHEMATICS / Probability & Statistics / General; Commercial statistics

Publicación académica
By: Newcombe, Robert G.; Soto, Cesar Merino. Interdisciplinaria: Revista de Psicología y Ciencias Afines. 2006, Vol. 23 Issue 2, p141-154. 14p. Language: Spanish. , Base de datos: Academic Search Premier
It's nowadays accepted by many journals in diverse areas of health and social sciences, that confidence intervals give more descriptive information and they are better than hypothesis tests to ex...
Materias: CONFIDENCE intervals; STATISTICAL hypothesis testing; SAMPLE size (Statistics); SOCIAL sciences; CALCULUS; ELECTRONIC spreadsheets; STATISTICS; Research and Development in the Social Sciences and Humanities
Imágenes obtenidas de:

http://www.itch.edu.mx/academic/industrial/estadistica1/cap01c.html