jueves, 26 de abril de 2012

Tema 7. Introducción a la Bioestadística. Organización de datos.

La estadística es la ciencia que estudia la variabilidad. Parte del supuesto de que las características clínicas que se observan cambian de un paciente a otro.

Hay diferentes escalas de medida:
Escala nominal. Con esta medida solo se puede comprobar si dos características son iguales o diferentes. Se mide por ejemplo, la raza, el género, la profesión, etc. Las categorías deben ser exhaustivas (los puedo clasificar a todos) y excluyentes (no puedo clasificar a un sujeto en dos grupos).
Escala ordinal. Ante dos modalidades distintas determina cuál de ellas es mayor. Los números expresan relaciones de igualdad, desigualdad y orden. Ejemplo: grado de dolor, 1. nulo, 2. leve, 3. medio, 4. máximo.
Escala de intervalo. Presentan las características propias de las dos escalas anteriores. Las distancias o intervalos representan distancias equivalentes. No se pueden sacar razones o proporciones.
Escala de razón. Nivel más alto de medición. Establece relaciones de identidad, orden, existencia de intervalos equivalentes y cuántas veces una modalidad es superior a otra.

También estudiamos los tipos de variables:
Cualitativas. Se refiere a propiedades que no pueden ser medidas, solo se pueden clasificar.
                  Nominales.
                     - Dicotómicas: 2 categorías (Ej: sexo).
                     - Policotómicas: más de 2 categorías (Ej: estado civil).
                  Ordinales. Ej: nivel de dolor.

 Cuantitativas. Se pueden medir en término numéricos.
                        Discretas. Sólo pueden tomar un número finito de valores. Son números aislados.
                                          Ej: número de hijos.
                        Continuas. El número está dentro de un rango. Ej: talla, peso.


                                           
Representación de datos.
Tablas de frecuencia. Son la imagen de los datos que muestran frecuencia en columnas y las categorías de las variables en filas.














  Para variables discretas.



Para variables continuas tenemos que construir intervalos. El número de intervalos se calcula haciendo la raíz cuadrada del número de datos. El recorrido se calcula restando el dato menor al mayor. Para obtener la amplitud del intervalo dividimos el recorrido por el número de intervalos.

La representación es sencilla pero entretenida cuando hay muchos datos y hay que ser cauteloso y tener paciencia a la hora de contar para no equivocarse.

En una tabla tienen que aparecer: intervalos, marcas de clase, frecuencia absoluta, frecuencia absoluta acumulada, frecuencia relativa y frecuencia relativa acumulada.








Gráfico de tronco y hojas. Forma híbrida entre tabla e histograma.
Gráfico para datos bidimensionales. Estudia el comportamiento de una variable en función de otra, haciendo una evolución histórica.
 


Gráfico de sectores. Para variables cualitatitavas dicotómicas.

 


Gráfico para datos multidimensionales: diagrama de estrellas.

Me ha resultado un tema sencillo, en el que hay que tener claro algunos conceptos y ponerlos en práctica para la elaboración de tablas y gráficos.