Aún recuerdo esta clase como si hubiera sido hoy mismo. Yo me dediqué a apuntar todo lo que el profesor decía porque lo que era razonar me daba bastante poco tiempo. Lo comprobé cuando en la siguiente clase no me acordaba de absolutamente nada, aún habiéndomelo leído. Cuando razoné me di cuenta de que era una tontería para todo lo que nos quedaba por ver.
Primero nos explicaron la diferencia entre parámetro y estadístico, que no es otra que:
El parámetro se refiere a la población y el estadístico
se refiere a la muestra. Diferentes signos (letras griegas para el parámetro y
letras latinas para el estadístico). Habrá veces que tengamos una muestra y una
población pero la fórmula es la misma.
Y aquí os dejo el "chute" de teoría que aprendimos ese día:
Medidas de
tendencia central:
·
Media aritmética o MEDIA, (x). ¿cómo se calcula?
Sumamos los valores que tenemos y los dividimos por la muestra total de
individuos. Se calcula para variables cuantitativas porque la media SON
NÚMEROS. Es el centro aritmético de nuestro dato.
El sumatorio de todas las
medidas (x) entre (n) toda la población.
Cuando los datos son agrupados
se usa la marca de clase, que es la media del intervalo pero en este caso se
multiplica por la frecuencia de ese intervalo. Se suma todo y se divide por la
población total.
·
Media ponderada: ejemplo: si tenemos un 8 en el
tipo test, un 7 en el magnitud y un 5 en el otro. Si hacemos la media
aritmética: 8+7+5/3=6.5.
El test vale 5 puntos y cada
uno de los problemas valía 2.5. O sea, el peso de cada nota no es lo mismo
porque el 8 en este caso vale más.
Multiplicamos el peso que tiene cada una: 8x0.5 +7x0.25+5x0.25/3=2.28
Problemas de la
media aritmética: Como utiliza todo los valores nos podremos encontrar
valores muy extremos. O sea, si estamos midiendo la edad media de una clase y
ronda los 18, 19 años y tenemos una persona con 70 años, este valor extremo
aislado hace que la media suba pero no es real. Los valores extremos desvirtúa
mucho la media.
Existe una desviación típica o estándar que se acompaña
de la media y es el +/-.
Alternativo a esto: la
mediana.
¿Qué es la
mediana?
Valores medio que agrupa la variable con un 50% a cada lado. Es
una medida mejor porque si tenemos 50 valores de la edad, 47 se engloban en 18
y 3 que se engloban en 40, la mediana esá entre los 47 valores porque lo
ordenamos de mayor a menor.
La mediana es siempre el valor del medio. Si lo ordenamos
de menor a mayor (0 a 50) los datos extremos aislados nos van a quedar en un
extremo y no se contaría con el mismo peso. No nos interfiere porque nosotros
nos fijamos solo en el punto medio
Hay dos formas de medirlo:
1. Si el número de observaciones que tenemos es impar, se
le suma 1 a la medida.
Dada esta serie de datos 2, 4, 6, 8, 10, 12,13,14,20
(11+1)/2=6. El numero que este en el puesto numero 6 es la mediana, o sea, el
10.
2. Si el número es par, la mediana corresponde a la media
de los valores centrales. ¿Cómo se calcula? Dividimos n/2 y n/2+1
Dada 3,6,8,12,17,28,32,34 (8). 8/2=4 + 1= 5. La mediana será el puesto 4 y el puesto 5 o
sea, 12 y 17. Y ahora se hace la media entre ellos=14.5
¿Qué es la moda?
El
valor que más se repite. SI hay dos
modas se llama muestra bimodal. Si hay mas de dos se llama multimodal.
Cuando hacíamos la tabla de frecuencia de las edades
veíamos que había 4 valores que mas se repetía. Esto sería la moda multimodal
con 4 valores.
Existe otro concepto que es la moda relativa:
un número que se repite mucho y hay otro que no
iguala esta repetición pero también destaca.
Uno destaca mas que el otro pero los dos destacan
respecto al resto. Si la muestra es homogénea se repetirán dos numero muchos
veces.
Ejemplo: 18 y 19 años se repiten mucho con respecto al
otro. Uno es la moda y el otro (que se
repite mucho pero menos que el otro) es la moda relativa.
La moda vale para cualquier tipo de variable porque son
frecuencias.
Si yo tengo una variable cualitativa y tenemos mucho
personal de enfermería mi moda es personal de enfermería.
Cuantiles o
n-tiles: solo tiene en cuenta la posición. Dividen la posiciones en un
numero determinado. N depende del numero en el que queramos cortar (cuartiles,
percentiles…)
Los cuantiles mas utilizados:
-Percentil: divide
entre 100. Se usan mucho en niños chicos cuando van adquiriendo peso hay una
curva de normalidad. Mientras mas alto el percentil esta por encima de lo
normal. Se parte siempre en 100 partes.
¿Cómo se calcula? Es aquel valor que ordenadas las
observaciones en forma creciente ocupa el lugar que queramos.
Percentil 15 sería el 15% de las 100 partes. Aglutina los
valores del 15 hacia abajo y lo que me queda es 100-15=85.
Son medidas de posición.
Frecuencia relativa acumulada. Frecuencia a medida que
vamos avanzando en la medida.
Percentil 50 siempre corresponde a la mediana porque
parte en dos partes los demás valores.
-Deciles:
dividen la muestra ordenada en 10 partes.
Es lo mismo que antes (3x100)10=30%. Si es 6, es el 60%.
Lo restante es 10 – el decil.
P50=decil 5 y corresponde a la mediana.
-Cuartiles: entre
4 partes (25-50-75 y 100)
Q1El 25%
Q2 corresponde al 50%.
Q3 al 75%
Q4 al 100%.
Se mide en la frecuencia acumulada: el Q3 estaría en
0.775 (77.5%). De ahí para arriba esta contemplada más del 75% de la muestra.
Diagrama de cajas
y biogotes
Representación gráfica para cuantitativas donde en medio
está la mediana donde reparte los valores (50% por arriba y 50% por abajo). El
limite de la caja superior e inferior representa Q3 Y Q1 (75-25=50). TAMBIÉN ENGLOBA LOS DATOS QUE ESTÁN MAS
CERCA DE LA MEDIANA Y COMO LIMITE SUPERIOR E INFERIOR LOS VALORES AISLADOS.
Medida de
dispersión
Existen porque la información aportada por la dependencia
central es limitada.
Ej-: dos series d números. Calculamos la mediana y media.
La serie de numero no son iguales pero la mediana y la
media es la misma.
Diferencia entre ambas series: es la dispersión (18-22 y
9-30) No se le llama recorrido porque el recorrido es una medida de dispersión.
Para poder contemplar la conclusión que limita la
tendencia central.
-Rango o
recorrido: diferencia entre el mayor valor de la muestra y menor valor de
la muestra.
Esto da poca información porque solo nos da el recorrido
pero no sabemos como se agrupan los datos.
-La desviación
media: cuanto se aleja de la media aritmética cada observación. Es muy
similar a la desviación típica. No es la mas importante.
-Desviación típica:
cuando usamos una media con el +/-. Aglutinamos un porcentaje de la
población. Habrá algunos que se me aíslen. Intervalo de confianza de 95% de la
muestra.
-También puede ser estándar (SD o DS sin es española). S
es estadístico y sigma es el parámetro. Raíz cuadrado del sumatorio de cada uno
d los valores al cuadrado entre todo los valores menos 1. Unidad: de la
variable que estemos midiendo (ej: años)

-Variancia: lo
mismo que la desviación típica pero en vez de hacer la raíz cuadrada se pasa al
cuadrado del sumatorio. S2 en vez de raíz cuadrada de x.
-recorrido
intercuartilico: diferencia entre el tercer y el primer cuartil. Si yo
tengo el valor ordenado de mayor a menor entre 100 valores, seria el 75 menos
el 25.
-coeficiente de
variación: no tiene unidad. Es adimensional. Medida de dispersión relativa
ya que todas las demás se expresan en la unidad de medida de la variable. No s
sirve para comparar la heterogeneidad de dos series numéricas con independencia
de las unidades de medida. Formula: desviación típica entre la media (c.v=s/x)
La x siempre lleva un palito horizontal encima.
No hay comentarios:
Publicar un comentario