jueves, 29 de marzo de 2018

SESIÓN TEÓRICA 6: REPRESENTACIÓN GRÁFICA DE LA INFORMACIÓN

Antes de mostrar los diferentes gráficos que podremos utilizar, os hablaré sobre sobre su utilidad. Y es que, las representaciones gráficas sirven para comunicar información numérica rápidamente, complementando de tal manera el análisis estadístico, aumentando así la información.
Sus normas básicas son:
  • Deben ser visualmente claros
  • Deben estar descritos en pie de figura y en texto
  • Hay que representar gráficamente las conclusiones
  • No podemos sobrecargar los gráficos

1. VARIABLES CUALITATIVAS (dicotómicas o pocas categorías)

   1.1 Gráfico de sectores: el área de cada sector es proporcional a la frecuencia de las variables. Solo podremos mostrar una variable a la vez, si queremos realizar comparaciones debemos hacer 2 diagramas. Entre los errores que se cometen es usarlo para variables ordinales y policotómicas.

   1.2 Diagrama de barras: las variables de todas las categorías se muestran fácilmente. Las barras deben ir separadas. Entre los errores que se cometen es utilizarlo para comparar frecuencias absolutas y variables cuantitativas.

   1.3 Pictogramas: es igual que el diagrama de barras, solo que en este caso utilizaremos figuras.

2. VARIABLES CUANTITATIVAS

   2.1 Histograma: se representa una sucesión de rectángulos sobre la recta, de tal manera que representa una variable continua con los datos agrupados en intervalos, donde cada intervalo está representado por un rectángulo.

   2.2 Gráfico de tronco y hojas: es un híbrido entre una tabla y un histograma. Cada dato de la variable se divide en 2 partes: el tronco (decenas) y las hojas (unidades). 

3. GRÁFICOS DATOS BIDIMENSIONALES Y MULTIDIMENSIONALES

   3.1 Tendencias temporales

   3.2 Diagrama de dispersión (bidimensionales): es utilizado para representar el comportamiento de 2 variables continuas. En el eje "x" representamos la variable independiente y en el eje "y" la dependiente. La imagen del diagrama nos da una idea sobre la correlación entre las 2 variables, que puede ser positiva o negativa.

   3.3. Diagrama de estrellas (multidimensionales): se usa para variables cuantitativas y comparamos de tal manera diferentes unidades de análisis. Cada variable representará un vértice del diagrama. El resultado nos dará una idea sobre el comportamiento conjunto de las variables. También podremos comparar usando la técnica del "gold standard". 

miércoles, 28 de marzo de 2018

SESIÓN TEÓRICA 5: MEDIDAS PARA VARIABLES CUANTITATIVAS

Existen 3 tipos de medidas estadísticas:

1. MEDIDAS DE TENDENCIA CENTRAL:
Son aquellas que informan de los valores alrededor del cual el resto de datos tienden a agruparse. Destacaremos:

-Media aritmética: se calcula para variables cuantitativas. Es la suma de todos los valores de la variable entre el total de observaciones:
Cuando los datos son agrupados para calcular la media utilizaremos la marca de clase: 
-Mediana: se corresponde con el valor donde el 50% de los datos es menor y el 50% son mayores. 
 *Si el nº de observaciones es par la mediana se corresponde a la media entre n/2 y (n/2) +1
 *Si el nº de observaciones es impar el valor es la observación que ocupa la posición 





-Moda: es el valor que más veces se repite. Si hay más de una, la muestra es bimodal (dos modas) o multimodal (más de 2 modas). Si los datos se encuentran agrupados se llama clase modal y se corresponde con el intervalo en el que el cociente entre la frecuencia relativa y amplitud es mayor:
2. MEDIDAS DE POSICIÓN:
Usaremos los cuantiles que son usados para variables cuantitativas. Los más usados son los percentiles, deciles y cuartiles. 

-Percentiles: dividen la muestra en 100 partes. Para buscar su valor buscamos el intervalo donde la frecuencia relativa acumulada sea mayor que el valor del percentil. P50=mediana.

-Deciles: dividen la muestra en 10 partes. 

-Cuartiles: dividen la muestra en 4 partes:
   *Q1: donde el 25% de las observaciones son menores y el 75% son mayores.
   *Q2: donde el 50% de las observaciones son menores y el 50% son mayores.
   *Q3: donde el 75% de las observaciones son menores y el 25% son mayores.
   *Q4: el mayor valor.

3. MEDIDAS DE DISPERSIÓN:

-Rango o recorrido: |Xn-X1|
-Desviación media: {|X1-X|/n
-Desviación típica (s): s= √(xi- 𝑥 )2/n-1
-Recorrido intercuantílico: |Q3-Q1|
-Coeficiente de variación: nos sirve para comparar la heterogeneidad de 2 series numéricas con independientes unidades de medida. C.V= s/x

4. ASIMETRÍA:
Para poder saber el lado donde se encuentra la asimetría, un método que nos servirá de ayuda será fijarnos en el lado bajo de la gráfica. Siempre va a adoptar valores entre -1 y +1. 
-Si el grado de asimetría es o tiene una distribución normal.
-Si el grado de asimetría es >0, es asimétrica positiva hacia la izquierda.
-Si el grado de asimetría es <0, es asimétrica negativa hacia la derecha.

5. CURTOSIS:
Sirve para medir la pronunciación de la gráfica. Se elige como referencia una distribución simétrica, de manera que el grado de curtosis es de 0.
-Si el grado de curtosis es 0, se llama distribución mesocúrtica,
-Si el grado de curtosis es de >0, se llama distribución leptocúrtica.
-Si el grado de curtosis es <0, se llama distribución platicúrtica



SESIÓN TEÓRICA 4: INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA

-DIFERENCIA ESTADÍSTICA DESCRIPTIVA DE INFERENCIAL

La estadística descriptiva es aquella que analiza una determinada población y no pretende sacar conclusiones a través de los métodos numéricos y gráficos empleados.

A diferencia, la estadística inferencial analiza el comportamiento de una población haciendo uso del análisis,  y por último procede a sacar conclusiones.

1. VARIABLES: presentación de datos.

1.1 Tablas de frecuencia: son autoexplicativas y de fácil comprensión, donde se indica lugar, fecha y fuente de información y además indican frecuencias relativas y absolutas.
 En las tablas de frecuencia para calcular el recorrido sería Re=Xn-X1 . También podremos calcular el número de intervalos mediante la raíz cuadrada del número de casos observados. Una vez que hemos obtenido el recorrido y el nº de intervalos, podremos calcular la amplitud de cada intervalo de la siguiente manera Amplitud=Recorrido/Nº intervalos 

fi=frecuencia absoluta
hi=frecuencia relativa. La podemos calcular dividiendo la frecuencia absoluta de cada intervalo entre el nº total de casos
{fi=frecuencia acumulada

2. INDICADORES. Concepto de indicador

La frecuencia absoluta no puede ser un indicador porque le falta un denominador el cual la relacione con el tamaño de la muestra. Por lo tanto podemos decir que un indicador es una medida de frecuencia de un determinado suceso en la población y están formados por un numerador y un denominador. Podemos afirmar que hay 4 indicadores:
  1. Proporciones: se utilizan para variables cualitativas y se calcula a través de una división. El resultado obtenido siempre va a tener un valor entre o y 1. En las proporciones el numerador está incluido en el denominador.
  2. Tasas: expresa el riesgo de que ocurra el evento estudiado. Para poder calcularlo lo haremos a través de la prevalencia y la incidencia acumulada, cuyas formulas indicaré al final de la publicación.
  3. Razones o "ratios": es utilizada para variables cualitativas. El numerados en este caso no está incluido en el denominados. 
  4. Odds o ventaja:hace referencia al cociente entre la probabilidad de ocurrencia de un evento y la probabilidad de no ocurrencia de dicho evento. Por lo tanto se calcularía así: O=p/1-p . Sus valores pueden ir desde 0(no ocurre nunca) hasta infinito (ocurre siempre)



miércoles, 7 de marzo de 2018

SESIÓN TEÓRICA 3: DESCRIPCIÓN Y ESTIMACIÓN DE DATOS. TÉORÍA DE LA PROBABILIDAD

¿QUÉ ES LA ESTADÍSTICA?
Es un cuerpo de conocimientos en el que introducimos una serie de variables y por lo tanto estudiaremos la variabilidad de los resultados que podemos obtener. 
Y para ello en la estadística utilizaremos una serie de parámetros. Un parámetro es una cantidad numérica calculada sobre una población que se expresa con N, con el objetivo de recoger toda la información existente en la población en parámetros. Suelen ser expresados con letras griegas: σ (desviación típica),  π (proporción),  µ (media)..

En un estudio estadístico podremos realizar dos tipos de mediciones:

-Mediciones directas: son aquellas realizadas a elementos concretos (temperatura, ritmo cardiaco, peso) y pueden ser recogidas por enfermería.

-Mediciones indirectas: el investigador lo que tiene que medir es una idea abstracta/subjetiva (estrés ,ansiedad, dolor) y es por ello que una estrategia raramente mida todos los aspectos relacionados con ese concepto.

Ahora bien, es importante saber que dependiendo del tipo de variable que vayamos a medir utilizaremos diferentes tipo de escalas de medición:
*ESCALA NOMINAL:es el mínimo nivel de medida, donde una variable solo se pueden comprobar si son iguales o diferentes y los números pueden ser sustituidos por símbolos, letras...
*ESCALA ORDINAL:se puede realizar si las variables son iguales o diferentes y en caso de que fueran distintas podremos determinar cual es mayor. En las variables tan solo podremos establecer una jerarquía entre ellas.
*ESCALA DE INTERVALO: presenta las características propias de las escalas anteriores, es decir, IDENTIDAD+ORDEN.
*ESCALA DE RAZÓN: es el nivel más alto a utilizar en una medición, cuyas características son identidad,orden y distancia equivalente entre los intervalos.

Por lo tanto, como conclusión podremos extraer que existen 2 tipos de variables, las cuáles se verán reflejadas en el siguiente esquema:
Y para finalizar, acabaré explicando la operativización de las variables lo cual es un proceso muy sencillo que consiste en descomponer las variables principales en otras más específicas llamadas dimensiones, a su vez estas dimensiones tienen que ser traducidas en indicadores los cuales permitan la observación directa. Para aclarar las ideas mencionadas anteriormente, en este esquema podremos visualizar un ejemplo: 


Y hasta aquí este post. Espero que os vaya siendo útil!!

SESIÓN TEÓRICA 2 (PARTE 3): ERRORES EN ESTUDIOS CUANTITATIVOS

Los errores que podemos cometer en los estudios cuantitativos pueden ser de 2 tipos:
  1. Errores aleatorios: son aquellos que se producen cuando el estudio se realiza sobre un muestra probabilística de la población. Para evitar estos errores, utilizaremos una medida de control la cual tiene 3 fases: 1) calculamos el mínimo tamaño de una muestra para poder detectar estadísticamente que significa una diferencia. 2)Uso de pruebas o tests de hipótesis (errores a o b). 3)cálculos de intervalos de confianza para las estimaciones obtenidas.
  2. Sesgos: son aquellos que desplazan las diferencias observadas en el estudio y a veces las exageran y otras las minimizan y por lo tanto, afectaran a la credibilidad de las conclusiones.
De esta manera podremos diferenciar 3 tipos de sesgos:
*Sesgo de selección: incluimos sujetos de estudio que difieren en alguna característica relevante sobre la población que pretendemos sacar la conclusión. Siempre que afecte al factor de exposición y al factor de riesgo, los hallazgos son extrapolables. EJ: abandonos que se producen durante el estudio.
*Sesgo de clasificación: se corresponde con una correcta medición de una variable, por lo tanto depende de la validez y fiabilidad del método utilizado para recoger la información, pudiendo afectar al efecto y por lo tanto a la conclusión. Puede ser no diferencial (disminuye las diferencias realmente existentes) y diferencial (exagera las diferencias existentes)
*Sesgo de confusión: es el único que podemos controlar en la fase de análisis y no en la de diseño y se corresponde con una distorsión en la estimación del estudio producida por la introducción de una tercera variable (variable confundente)