Érase una vez
mis experiencias con la estadística…
EL BLOG DE ANAPÍ. ESTADÍSTICA Y TIC
Soy una estudiante de enfermería que piensa que no solo hay que marcarse metas sino que debemos sobrepasarlas. Las estadísticas somos todos; ayuda a cambiarlas pero siempre A MEJOR.
La despedida
Hoy, 14 de Junio de 2013 el curso ha llegado a su fin.
Se ha pasado bastante rápido lo que indica que ha sido fluído e intenso. Muy intenso.

Ha sido un trabajo en equipo (profesor-alumnos) que ha ido mejorando con el paso de los días. La asignatura, a mi parecer tiene mucha dificultad pues partes de cero y en cuestión de nada tienes que tener conceptos importantísimos en tu mente que deberás recordar como tu propio nombre. Quitando las clases caóticas (pues toda asignatura empírica frecuenta dudas a cada minuto), han sido unas clases muy dinámicas donde hemos aprendido bastante.
Da pena decir adiós cuando interiorizamos una rutina pero ahora queda lo peor: el examen final, donde tendremos que plasmar y demostrar todo lo aprendido
Me despido con una sonrisa aunque me haya causado algún que otro disgusto la asignatura pero en general, me ha transmitido mucho conocimiento y madurez.
Ahora toca interiorizar y entender absolutamente todos los conceptos.
La suerte está echada y el curso terminado.
Gracias a mis compañeros y a mis profesores por amenizarme este camino tan intenso.
La estadística somos todos y todos nos ayudamos mutuamente para entenderla. Así todo irá siempre cuesta arriba. ¡Ánimo a todos! Si quieres, puedes.

Presentación de nuestro primer proyecto de investigación
El día de la presentación de nuestro primer proyecto de investigación lo recuerdo como algo...fatídico.
Mi grupo compuesto por Julia, Carlos, Sara y yo quisimos enfocar nuestro trabajo de la siguiente forma:
Quisimos comparar la alimentación que seguían los estudiantes universitarios en función del lugar de residencia: en sus hogares familiares o en pisos o residencias de estudiantes. Luego queríamos describir la percepción de cada uno de ellos.

Al final la evaluación de ambos profesores yo me veía en Agosto pasando cuestionarios pero finalmente llegaron las palabras más esperadas: "Aunque haya ido cuesta abajo, la teoría es bastante sólida. Estáis aprobados". Creo que ha sido el mayor alivio que he sentido en todo el curso (sin exagerar).
Tras la realización de este trabajo he podido comprobar que el campo de la investigación es un campo muy duro, el cuál requiere mucho tiempo y muchísimo esfuerzo y capacidad.
No estoy descontenta para ser el primer trabajo que hicimos contando con que el tiempo se nos echó encima.
A lo largo de esta asignatura hemos total el total apoyo de Sergio directamente y el seguimiento de Ponce indirectamente y hoy mismo, el último día de clase, he tenido una tutoría con Sergio para repasar errores del primer parcial. Me transmite seguridad y me ha aclarado bastantes conceptos.
Espero que el examen final esté más asentada y no cometas errores garrafales. Ya contamos con el factor experiencia tras la elaboración del trabajo de investigación y múltiples ejercicios resueltos en clase.


El segundo correspondía al tema 10.
1.- Predeterminar el tamaño de la
muestra necesaria para estudiar los niveles de glucosa plasmática de la
población de una zona básica de salud. Aceptamos un riesgo de error del 1% y
pretendemos una precisión de 5 mg. En una muestra reducida, la desviación
típica es de 15.
Daba como resultado: n=60
2.- A partir de ciertos estudios
se tiene la idea de que, operando inmediatamente a enfermos que ingresan en
estado de shock en un determinado servicio de un hospital, existe mayor
posibilidad de que el enfermo reaccione favorablemente. Para comprobar esta
hipótesis, se toman dos grupos de pacientes, a uno de los cuales se le opera
inmediatamente y al otro se espera a que se recupere del shock, obteniéndose
los siguientes resultados:
|
Recuperación
completa
|
Mejoría
|
Muerte
|
Operado
inmediatamente
|
10
|
7
|
3
|
Operado después de recuperación
|
5
|
3
|
2
|
A la vista del experimento ¿qué
se puede decir respecto a la hipótesis inicial? Identifica para ello la
hipótesis, las variables en estudio, el test adecuado y su resultado y
conclusión final.
El resultado fue: chi cuadrado=0.12 y grado de significación para nivel de confianza de 0.05 de 5.99.
Por lo tanto se acepta la hipótesis nula.
3.- Un investigador pretende
saber si las condiciones socioeconómicas influyen sobre la talla infantil. Para
ello, ha obtenido la talla de 20 niños de 5 años de edad, de dos condiciones
socioeconómicas contrastantes (alta y baja), que se exponen en la siguiente
tabla. Plantea la hipótesis pertinente, realiza la elección del test oportuno y
toma la decisión que proceda respecto a la hipótesis planteada.
Nivel
socioeconómico bajo
|
Nivel socioeconómico
alto
|
(x1- x‾1)
|
(x1- x‾1)2
|
(x2- x‾2)
|
(x2- x‾2)2
|
101
|
103
|
0.1
|
0.01
|
-2
|
4
|
102
|
105
|
11,1
|
1,21
|
0
|
0
|
100
|
104
|
-0,9
|
0,81
|
-1
|
1
|
104
|
106
|
3,1
|
9,61
|
1
|
1
|
102
|
108
|
1,1
|
1,21
|
3
|
9
|
99
|
100
|
-1,9
|
3,61
|
-5
|
25
|
102
|
108
|
1,1
|
1,21
|
3
|
9
|
103
|
104
|
2,1
|
4,41
|
-1
|
1
|
97
|
105
|
-3,9
|
15,21
|
0
|
0
|
99
|
107
|
-1,9
|
3,61
|
2
|
4
|
x‾1=100,9
|
x‾1=105
|
|
Σ (x1-
x‾1)2 = 40,9
|
|
Σ(x2 -
x‾2)2 = 54
|
Ejercicios del campus
Durante las últimas clases, para apoyar nuestro estudio de una forma práctica y que nos ayude a la hora de la evaluación final, Sergio colgó dos ejercicios en el campus de la universidad.
El primero correspondía al tema 9.
El primero correspondía al tema 9.
EJERCICIOS ESTADÍSTICA INFERENCIAL
1. Estamos interesados en conocer el consumo diario medio de cigarrillos entre los alumnos de Centros de Bachillerato de nuestra localidad. Seleccionada una muestra aleatoria de 100 alumnos se observó que fumaban una media de 8 cigarrillos diarios. Si admitimos que la varianza de dicho consumo es de 16 cigarrillos en el colectivo total, estime dicho consumo medio con un nivel de confianza del 95 %.
1. Estamos interesados en conocer el consumo diario medio de cigarrillos entre los alumnos de Centros de Bachillerato de nuestra localidad. Seleccionada una muestra aleatoria de 100 alumnos se observó que fumaban una media de 8 cigarrillos diarios. Si admitimos que la varianza de dicho consumo es de 16 cigarrillos en el colectivo total, estime dicho consumo medio con un nivel de confianza del 95 %.
Solución:
IC (95%) = (7.22, 8.78)
2. Se desea hacer una
estimación sobre la edad media de una determinada población. Calcula el tamaño
de la muestra necesario para poder realizar dicha estimación con un error menor
de medio año a un nivel de confianza del 99,73%. Se conoce de estudios previos
que la edad media de dicha población tiene una desviación típica igual a 3.
Solución:
De 324 personas, al menos, debe estar compuesta la muestra.
3. Tomada, al azar,
una muestra de 120 estudiantes de una Universidad, se encontró que 54 de ellos
hablaban inglés. Halle, con un nivel de confianza del 95%, un intervalo de
confianza para estimar la proporción de estudiantes que hablan el idioma inglés
entre los estudiantes de esa Universidad.
Solución:
IC (95%) = (0.54, 0.36)
Seminario 3


Al final el alimento que yo elegí comparar (helado de vainilla) era el causante de la gastroenteritis pues daba una p menor a 0.05 y un valor de T significante.
Así finalizamos nuestras prácticas con esta aplicación y conocimos la incógnita del problama.
Sinceramente, estos tres seminarios me han parecido muy amenos e interesante y hemos aprendido mucho. Además añadir que Sergio, nuestro profesor, influye para que sean seminarios agradables y dinámicos, así como divertidos.
Tema 10. Hipótesis estadística. Test de hipótesis.
Bueno queridos amigos, compañeros, conocidos, desconocidos, investigadores todos, hemos llegado al final del curso, de este largo curso que me ha parecido un suspiro. Miro atrás y me veo el primer día de clase sin conocer a nadie preguntando si ésta era la clase de primero de enfermería. Y ahora hemos vivido millones de cosas juntos, buenas y malas, pero de todo hemos aprendido y en esta asignatura impartida desde el primer día del segundo cuatrimestre he aprendido bastante. Se nota la evolución de la asignatura. No es rectilínea. Tiene cuestas que subir. Cuestas que bajar. Parciales desastrosos. Ejercicios de clase infumables. Pero al fin y al cabo se trata de eso, de aprender. Nos ha ayudado además para afrontar nuestro proyecto de investigación, ese que me hizo temblar y del que más adelante os hablaré.

En este último tema vimos los contrastes de hipótesis, los cuales se utilizan para controlar los errores aleatorios. Una herramienta super útil para el proceso de inferencia estadística.
Con los intervalos de confianza del tema anterior nos hacemos una idea de un parámetro de una población dados un par de número entre los que confiamos que esté el valor desconocido.
Con los test o contrastes de hipótesis la estrategia cambia. Establece en principio una hipótesis acerca del valor del parámetro. Tras la recogida de datos analizamos la coherencia entre la hipótesis previamente establecida y los resultados obtenidos.
Con estos test podemos responder a preguntas de investigación porque permite cuantificar la contabilidad entre una hipótesis previa y los resultados.
Con esta herramienta siempre podemos contrastar la hipótesis nula (la que establece igualdad entre los grupos a comparar, es decir, la que no establece relación entre las variables de estudios.
donde, O son los valores observados y E los
valores esperados.
, donde x1 es la media de la muestra 1 y la x2 la media de la muestra 2.

En este último tema vimos los contrastes de hipótesis, los cuales se utilizan para controlar los errores aleatorios. Una herramienta super útil para el proceso de inferencia estadística.
Con los intervalos de confianza del tema anterior nos hacemos una idea de un parámetro de una población dados un par de número entre los que confiamos que esté el valor desconocido.
Con los test o contrastes de hipótesis la estrategia cambia. Establece en principio una hipótesis acerca del valor del parámetro. Tras la recogida de datos analizamos la coherencia entre la hipótesis previamente establecida y los resultados obtenidos.
Con estos test podemos responder a preguntas de investigación porque permite cuantificar la contabilidad entre una hipótesis previa y los resultados.
Con esta herramienta siempre podemos contrastar la hipótesis nula (la que establece igualdad entre los grupos a comparar, es decir, la que no establece relación entre las variables de estudios.
Controlar los errores aleatorios con los cálculos de
intervalos de confianza.
- Si la probabilidad es mayor de 0.5 aceptamos la hipótesis nula. Hipótesis alternativa mas plausible.
Test chi cuadrado: Compara dos variables cualitativas dicotómicas.
T de Student: Tenemos una variable continua y variable predictora dicotómica.
Errores de hipótesis:
El test de hipótesis mide la probabilidad de error que cometo si rechazo la hipótesis nula. Con una misma muestra podemos aceptar o rechazar la hipótesis nula. Todo depende del error alfa, que es la probabilidad de equivocarnos al rechazar la hipótesis nula (Ho).
El error alfa más pequeño con el que podemos rechazar la hipótesis nula se denomina error p. Lo más frecuente es rechazar la hipótesis nula con un grado de significación del 0.5.
A veces puede ocurrir que el test rechace la hipótesis nula y que la realidad diga lo contrario. A esto le denominamos errores alfa y pueden ser de tipo 1 (cuando la realidad acepta la Ho y el resultado del test la acepta) y error tipo 2 (la realidad rechaza la Ho y el test la acepta).
Estudiamos a fondo a continuación el test de chi cuadrado:
Se supone la hipótesis cierta y estudiamos cómo es de probable que siendo iguales dos grupos a comparar se obtengan resultados como los obtenidos o haber encontrado diferencias más grandes por grupos.
Ejercicio práctico:
Nos dan la siguiente tabla y tenemos que hallar las hipótesis y los resultados (si aceptamos o rechazamos la hipótesis nula planteada):
|
Positiva
|
Negativa
|
Total
|
Silvedema
|
11
|
15
|
26 (a)
|
Blastoestimulina
|
16
|
10
|
26 (b)
|
Total
|
27 (c)
|
25 (d)
|
52 (T)
|
Hipótesis nula: Silvedema y blastoestimulina no tienen
relación en cuanto a la efectividad.
Hipótesis alternativa 1: Silvedema es más efectiva que
blastoestimulina.
Hipótesis alternativa 2: Blastoestimulina es más efectiva
que silvedema.
Total de sujetos con silvedema (nS): 26
Total de sujetos con blastoestimulina (nB): 26
A continuación hacemos una tabla con frecuencias
esperadas (fe):
Fe1: a x
c/ T = 26 x 27/ 52= 13.5
Fe2: a x
d/T= 26 x 25/52 = 12.5
Fe3: b x
c/T = 26 x 27/52= 13.5
Fe4: b x
d/T= 26 x 26/52 = 12.5
Así:
|
Positiva
|
Negativa
|
Total
|
Silvedema
|
13.5
|
12.5
|
26
|
Blastoestimulina
|
13.5
|
12.5
|
26
|
Total
|
27
|
25
|
52
|
Aplicamos la formula de chi cuadrado:

X² =(11-13.5)²/13.5 + (15-12.5)²/12.5 + (16-13.5)²/13.5 +
(10-12.5)²/12.5 = 1.92
Ahora calculamos el grado de libertad: (número de filas
-1)x(número de filas -1)=(2-1)x(2-1)=1.
Siempre que la tabla sea 2x2 el grado de libertad será
igual a 1.
Tomamos el nivel alfa p< 0.05 (probabilidad estándar
del 99%) y nos dirigimos a la tabla de chi cuadrado para obtener el valor de
significación teniendo en cuenta el grado de libertad y el nivel alfa.
Observamos que dicho valor es 3.84, por lo tanto para rechazar la hipótesis
nula, el valor de chi cuadrado deber ser mayor a 3.84. Como en este caso el
valor de chi cuadrado es de 1.92, aceptamos la hipótesis nula que dice que silvedema
y blastoestimulina no tienen relación en cuanto a la efectividad.
Ahora estudiamos a fondo el T de Student:
Ésta, como hemos dicho, se estudia cuando la variable independiente es cualitativa dicotómica y la variable dependiente es cuantitativa continua.
El grado de libertad se obtienen así: n1(columna 1)+(columna 2) -2
Para hallar la T realizamos la siguiente fórmula:

La varianza común estimada (desviación típica al cuadrado) es:

Ejercicio resuelto:
Obtenemos dos grupos (cualitativos) con datos
cuantitativos. En el primer grupo la media es 8 y en el segundo es 12:
1 (grupo 1) 2
(grupo 2)
|
|
|
X1 X2
n1: 8 n2:12
Hipótesis nula: La variable independiente no tiene
relación con la variable dependiente.
El grado de libertad es: 8+12-2=18
Aplicamos la ecuación T de Student y el valor nos sale =
4.
El nivel alfa, al igual que en chi cuadrado es 0.05.
Nos vamos a la tabla de T de student teniendo en cuenta
el grado de libertad y el nivel alfa y observamos que para que exista
significación la T debe ser mayor a 1.73.
En este caso es mayor por lo que rechazaríamos la
hipótesis nula que hubiéramos previsto.
Suscribirse a:
Entradas (Atom)