Érase una vez mis experiencias con la estadística…

La despedida


Hoy, 14 de Junio de 2013 el curso ha llegado a su fin.
Se ha pasado bastante rápido lo que indica que ha sido fluído e intenso. Muy intenso.
Esta asignatura, a la que al principio no le daba mucha importancia, ha sido clave este cuatrimestre y siempre la he tenido presente pues, al igual que todas las ciencias empíricas (matemáticas e incluso la música) es algo que una vez aprendida nos acompaña el resto de nuestra vida de manera intensa y es la base de un buen conocimiento científico y la base para avanzar en nuestra carrera y en el mundo en general.
Ha sido un trabajo en equipo (profesor-alumnos) que ha ido mejorando con el paso de los días. La asignatura, a mi parecer tiene mucha dificultad pues partes de cero y en cuestión de nada tienes que tener conceptos importantísimos en tu mente que deberás recordar como tu propio nombre.  Quitando las clases caóticas (pues toda asignatura empírica frecuenta dudas a cada minuto), han sido unas clases muy dinámicas donde hemos aprendido bastante.
Da pena decir adiós cuando interiorizamos una rutina pero ahora queda lo peor: el examen final, donde tendremos que plasmar y demostrar todo lo aprendido
Me despido con una sonrisa aunque me haya causado algún que otro disgusto la asignatura pero en general, me ha transmitido mucho conocimiento y madurez.
Ahora toca interiorizar y entender absolutamente todos los conceptos.
La suerte está echada y el curso terminado.
Gracias a mis compañeros y a mis profesores por amenizarme este camino tan intenso.
La estadística somos todos y todos nos ayudamos mutuamente para entenderla. Así todo irá siempre cuesta arriba. ¡Ánimo a todos! Si quieres, puedes.

Presentación de nuestro primer proyecto de investigación



El día de la presentación de nuestro primer proyecto de investigación lo recuerdo como algo...fatídico.
Mi grupo compuesto por Julia, Carlos, Sara y yo quisimos enfocar nuestro trabajo de la siguiente forma:
Quisimos comparar la alimentación que seguían los estudiantes universitarios en función del lugar de residencia: en sus hogares familiares o en pisos o residencias de estudiantes. Luego queríamos describir la percepción de cada uno de ellos.
Ambos profesores, tanto Ponce como Sergio, nos dijeron que teníamos un buen marco teórico y un protocolo en general consistente. Sin embargo nuestro trabajo fue decayendo a medida que avanzábamos. Quizás influyó la falta de tiempo e incluso la poca comprensión sobre el tema 9 y 10, muy recientemente dados. Tuvimos que pedir varias tutorías con el profesor Sergio para que nos guíara y he de decir que sin su ayuda nuestro trabajo hubiera sido un fracaso. Tampoco fue un éxito pues los resultados estaban más (realizamos la T de Student y nos equivocamos en el grado de significación) y como dijo Ponce: "habíamos condenado al inocente".
Al final la evaluación de ambos profesores yo me veía en Agosto pasando cuestionarios pero finalmente llegaron las palabras más esperadas: "Aunque haya ido cuesta abajo, la teoría es bastante sólida. Estáis aprobados". Creo que ha sido el mayor alivio que he sentido en todo el curso (sin exagerar).

Tras la realización de este trabajo he podido comprobar que el campo de la investigación es un campo muy duro, el cuál requiere mucho tiempo y muchísimo esfuerzo y capacidad.
No estoy descontenta para ser el primer trabajo que hicimos contando con que el tiempo se nos echó encima.

A lo largo de esta asignatura hemos total el total apoyo de Sergio directamente y el seguimiento de Ponce indirectamente y hoy mismo, el último día de clase, he tenido una tutoría con Sergio para repasar errores del primer parcial. Me transmite seguridad y me ha aclarado bastantes conceptos.
Espero que el examen final esté más asentada y no cometas errores garrafales. Ya contamos con el factor experiencia tras la elaboración del trabajo de investigación y múltiples ejercicios resueltos en clase.


El segundo correspondía al tema 10.
1.- Predeterminar el tamaño de la muestra necesaria para estudiar los niveles de glucosa plasmática de la población de una zona básica de salud. Aceptamos un riesgo de error del 1% y pretendemos una precisión de 5 mg. En una muestra reducida, la desviación típica es de 15.

Daba como resultado: n=60

2.- A partir de ciertos estudios se tiene la idea de que, operando inmediatamente a enfermos que ingresan en estado de shock en un determinado servicio de un hospital, existe mayor posibilidad de que el enfermo reaccione favorablemente. Para comprobar esta hipótesis, se toman dos grupos de pacientes, a uno de los cuales se le opera inmediatamente y al otro se espera a que se recupere del shock, obteniéndose los  siguientes resultados:


Recuperación completa
Mejoría
Muerte
Operado inmediatamente
10
7
3
Operado después de recuperación
5
3
2


A la vista del experimento ¿qué se puede decir respecto a la hipótesis inicial? Identifica para ello la hipótesis, las variables en estudio, el test adecuado y su resultado y conclusión final.

El resultado fue: chi cuadrado=0.12 y grado de significación para nivel de confianza de 0.05 de 5.99.
Por lo tanto se acepta la hipótesis nula.


3.- Un investigador pretende saber si las condiciones socioeconómicas influyen sobre la talla infantil. Para ello, ha obtenido la talla de 20 niños de 5 años de edad, de dos condiciones socioeconómicas contrastantes (alta y baja), que se exponen en la siguiente tabla. Plantea la hipótesis pertinente, realiza la elección del test oportuno y toma la decisión que proceda respecto a la hipótesis planteada.

Nivel socioeconómico bajo
Nivel socioeconómico alto
(x1- x‾1)
(x1- x‾1)2
(x2- x‾2)
(x2- x‾2)2
101
103
0.1
0.01
-2
4
102
105
11,1
1,21
0
0
100
104
-0,9
0,81
-1
1
104
106
3,1
9,61
1
1
102
108
1,1
1,21
3
9
99
100
-1,9
3,61
-5
25
102
108
1,1
1,21
3
9
103
104
2,1
4,41
-1
1
97
105
-3,9
15,21
0
0
99
107
-1,9
3,61
2
4
x‾1=100,9
x‾1=105

Σ (x1- x‾1)2 = 40,9

Σ(x2 - x‾2)2 = 54



 La T de Student dió como resultado 3.95 y la signifiación con un grado de libertad de 18 y nivel de confianza de 0.05 era igual a 1.73, Por lo tanto se rechaza la hipótesis nula.

Ejercicios del campus

Durante las últimas clases, para apoyar nuestro estudio de una forma práctica y que nos ayude a la hora de la evaluación final, Sergio colgó dos ejercicios en el campus de la universidad.
El primero correspondía al tema 9.
EJERCICIOS ESTADÍSTICA INFERENCIAL

1.
Estamos interesados en conocer el consumo diario medio de cigarrillos entre los alumnos de Centros de Bachillerato de nuestra localidad. Seleccionada una muestra aleatoria de 100 alumnos se observó que fumaban una media de 8 cigarrillos diarios. Si admitimos que la varianza de dicho consumo es de 16 cigarrillos en el colectivo total, estime dicho consumo medio con un nivel de confianza del 95 %.

Solución: IC (95%) = (7.22, 8.78)

2. Se desea hacer una estimación sobre la edad media de una determinada población. Calcula el tamaño de la muestra necesario para poder realizar dicha estimación con un error menor de medio año a un nivel de confianza del 99,73%. Se conoce de estudios previos que la edad media de dicha población tiene una desviación típica igual a 3.

Solución: De 324 personas, al menos, debe estar compuesta la muestra.
  
3. Tomada, al azar, una muestra de 120 estudiantes de una Universidad, se encontró que 54 de ellos hablaban inglés. Halle, con un nivel de confianza del 95%, un intervalo de confianza para estimar la proporción de estudiantes que hablan el idioma inglés entre los estudiantes de esa Universidad.

Solución: IC (95%) = (0.54, 0.36)

Seminario 3



En el último seminario comprobamos cuál era el alimento que produjo el brote de gastroenteritis entre los invitados de la fiesta parroquial americana. Lo hicimos gracias a la aplicación tal efetiva "Epi info" y a los conocimientos adquiridos en las clases anteriores. Calculamos el intervalo de confianza, la mediana, la moda, la desviación típica y la T de Student (al ser una variable cuantitativa (número de casos de gastroenteritis) y variable cualitativa (distintos alimentos consumidos)). Como teníamos la plantilla de los cuestionarios en Epi Info solo debíamos relacionar estas dos variables y Epi Info automáticamente nos calcula los resultados.
Cada miembro del seminario comparó un alimento diferente con el total de afectados y no afectados y observamos una gráfica que ya nos decía mucho de lo que podía ocurrir.
Al final el alimento que yo elegí comparar (helado de vainilla) era el causante de la gastroenteritis pues daba una p menor a 0.05 y un valor de T significante.
Así finalizamos nuestras prácticas con esta aplicación y conocimos la incógnita del problama.



Sinceramente, estos tres seminarios me han parecido muy amenos e interesante y hemos aprendido mucho. Además añadir que Sergio, nuestro profesor, influye para que sean seminarios agradables y dinámicos, así como divertidos.

Tema 10. Hipótesis estadística. Test de hipótesis.

Bueno queridos amigos, compañeros, conocidos, desconocidos, investigadores todos, hemos llegado al final del curso, de este largo curso que me ha parecido un suspiro. Miro atrás y me veo el primer día de clase sin conocer a nadie preguntando si ésta era la clase de primero de enfermería. Y ahora hemos vivido millones de cosas juntos, buenas y malas, pero de todo hemos aprendido y en esta asignatura impartida desde el primer día del segundo cuatrimestre he aprendido bastante. Se nota la evolución de la asignatura. No es rectilínea. Tiene cuestas que subir. Cuestas que bajar. Parciales desastrosos. Ejercicios de clase infumables. Pero al fin y al cabo se trata de eso, de aprender. Nos ha ayudado además para afrontar nuestro proyecto de investigación, ese que me hizo temblar y del que más adelante os hablaré.


En este último tema vimos los contrastes de hipótesis, los cuales se utilizan para controlar los errores aleatorios. Una herramienta super útil para el proceso de inferencia estadística.

Con los intervalos de confianza del tema anterior nos hacemos una idea de un parámetro de una población dados un par de número entre los que confiamos que esté el valor desconocido.

Con los test o contrastes de hipótesis la estrategia cambia. Establece en principio una hipótesis acerca del valor del parámetro. Tras la recogida de datos analizamos la coherencia entre la hipótesis previamente establecida y los resultados obtenidos.
Con estos test podemos responder a preguntas de investigación porque permite cuantificar la contabilidad entre una hipótesis previa y los resultados.
Con esta herramienta siempre podemos contrastar la hipótesis nula (la que establece igualdad entre los grupos a comparar, es decir, la que no establece relación entre las variables de estudios.
Controlar los errores aleatorios con los cálculos de intervalos de confianza.
  • Si la probabilidad es mayor de 0.5 aceptamos la hipótesis nula. Hipótesis alternativa mas plausible.
En función de las variables podemos trabajar con dos tipos de análisis estadístico:
Test chi cuadrado: Compara dos variables cualitativas dicotómicas. 
T de Student: Tenemos una variable continua y variable predictora dicotómica.

Errores de hipótesis:
El test de hipótesis mide la probabilidad de error que cometo si rechazo la hipótesis nula. Con una misma muestra podemos aceptar o rechazar la hipótesis nula. Todo depende del error alfa, que es la probabilidad de equivocarnos al rechazar la hipótesis nula (Ho).
El error alfa más pequeño con el que podemos rechazar la hipótesis nula se denomina error p. Lo más frecuente es rechazar la hipótesis nula con un grado de significación del 0.5.
A veces puede ocurrir que el test rechace la hipótesis nula y que la realidad diga lo contrario. A esto le denominamos errores alfa y pueden ser de tipo 1 (cuando la realidad acepta la Ho y el resultado del test la acepta) y error tipo 2 (la realidad rechaza la Ho y el test la acepta).

Estudiamos a fondo a continuación el test de chi cuadrado:
Se supone la hipótesis cierta y estudiamos cómo es de probable que siendo iguales dos grupos a comparar se obtengan resultados como los obtenidos o haber encontrado diferencias más grandes por grupos.
Ejercicio práctico:
Nos dan la siguiente tabla y tenemos que hallar las hipótesis y los resultados (si aceptamos o rechazamos la hipótesis nula planteada):

Positiva
Negativa
Total
Silvedema
11
15
26 (a)
Blastoestimulina
16
10
26 (b)
Total
27 (c)
25 (d)
52 (T)

Hipótesis nula: Silvedema y blastoestimulina no tienen relación en cuanto a la efectividad.
Hipótesis alternativa 1: Silvedema es más efectiva que blastoestimulina.
Hipótesis alternativa 2: Blastoestimulina es más efectiva que silvedema.
Total de sujetos con silvedema (nS): 26
Total de sujetos con blastoestimulina (nB): 26

A continuación hacemos una tabla con frecuencias esperadas (fe):
Fe1: a x c/ T = 26 x 27/ 52= 13.5
Fe2: a x d/T= 26 x 25/52 = 12.5
Fe3: b x c/T = 26 x 27/52= 13.5
Fe4: b x d/T= 26 x 26/52 = 12.5
Así:

Positiva
Negativa
Total
Silvedema
13.5
12.5
26
Blastoestimulina
13.5
12.5
26
Total
27
25
52

Aplicamos la formula de chi cuadrado:
 donde, O son los valores observados y E los valores esperados.
X² =(11-13.5)²/13.5 + (15-12.5)²/12.5 + (16-13.5)²/13.5 + (10-12.5)²/12.5 = 1.92

Ahora calculamos el grado de libertad: (número de filas -1)x(número de filas -1)=(2-1)x(2-1)=1.
Siempre que la tabla sea 2x2 el grado de libertad será igual a 1.
Tomamos el nivel alfa p< 0.05 (probabilidad estándar del 99%) y nos dirigimos a la tabla de chi cuadrado para obtener el valor de significación teniendo en cuenta el grado de libertad y el nivel alfa. Observamos que dicho valor es 3.84, por lo tanto para rechazar la hipótesis nula, el valor de chi cuadrado deber ser mayor a 3.84. Como en este caso el valor de chi cuadrado es de 1.92, aceptamos la hipótesis nula que dice que silvedema y blastoestimulina no tienen relación en cuanto a la efectividad.

Ahora estudiamos a fondo el T de Student:
Ésta, como hemos dicho, se estudia cuando la variable independiente es cualitativa dicotómica y la variable dependiente es cuantitativa continua.
El grado de libertad se obtienen así: n1(columna 1)+(columna 2) -2
Para hallar la T realizamos la siguiente fórmula:
, donde x1 es la media de la muestra 1 y la x2 la media de la muestra 2.
La varianza común estimada (desviación típica al cuadrado) es:
Ejercicio resuelto:
Obtenemos dos grupos (cualitativos) con datos cuantitativos. En el primer grupo la media es 8 y en el segundo es 12:
1 (grupo 1)      2 (grupo 2)





    
        X1                   X2
       n1: 8             n2:12
Hipótesis nula: La variable independiente no tiene relación con la variable dependiente.
El grado de libertad es: 8+12-2=18
Aplicamos la ecuación T de Student y el valor nos sale = 4.
El nivel alfa, al igual que en chi cuadrado es 0.05.
Nos vamos a la tabla de T de student teniendo en cuenta el grado de libertad y el nivel alfa y observamos que para que exista significación la T debe ser mayor a 1.73.
En este caso es mayor por lo que rechazaríamos la hipótesis nula que hubiéramos previsto.