1. Observación de los datos.
Hay dos aspèctos básicos en un estudio estadístio:
- La observación de los datos (recogida de datos...)
- La presentación de los datos (en una tabla estadística)
La primera etapa de una estudio estadístico consiste en delimitar claramente los conceptos de:
- Población: Es el conjunto de individuos u objetos que son objeto de estudio.
- Elemento: Cada uno de los individuos y objetos que componen la población.
- Tamaño de la Población: Es el número de elementos que forman la población.
Características
Lo que estudiamos es una o varias características de interés. La naturaleza de estas características puede ser:
Cualitativas o atributos: aquellas no que se pueden cuantificar mediante una escala numéricas, y por tanto el resultado de su observación son modalidades o categorías (atributos)
- Nominales: no se pueden ordenar
- Ordinales: se pueden ordenar
Cuantitativas: aquellas que pueden ser medidas numéricamente (variables)
- Discretas: sólo pueden tomar un número finito de valores (enteros)
- Continuas: pueden tomar un número infinito de valores numéricos
Formas de observación
Atendiendo al número de elementos observados, se puede distinguir entre:
- Observación exhaustiva: estudio de todos y cada uno de los elementos de una población. (censos). Los resultados se pueden aplicar a toda la población: Estadística Descriptiva.
- Observación parcial: de un grupo o subconjunto de elementos de la población (muestra). Los resultados se pueden aplicar a toda la población mediante el empleo de técnicas probabilísticas: Estadistca Inferencial.
- Observación mixta: exhaustiva en una parte de la población y parcial en el resto.
Atendiendo a la referencia temporal de la observación, se puede distinguir entre:
- Observación longitudinal: observación repetida periódicamente en el tiempo (series temporales). Muestra la evolución a lo largo del tiempo de una o varias características. Las series temporales pueden clasificarse en:
- Variables flujo: expresan una magnitud que puede considerarse como un flugo o corriente. El valor observado corresponde a todo el periodo temporal que se toma como unidad.
- Variables stock: expresan magnitudes que pueden considerarse stocks o niveles y el valor observado corresponde a una medición en un instante del tiempo dentro del periodo temporal tomado como unidad (generalmente el último momento o el momento central).
- Observación transversal: observación en un instante del tiempo (corte transversal o "cross section").
- Observación mixta: se observa periódicamente un mismo conjunto de elementos en varios momentos del tiempo (panel de datos).
2. Presentación de los datos
El resultado de la observación (exhaustiva o parcial, temporal o atemporal) de las características de la población es un conjunto de datos que no están ni siquiera ordenados bajo ningún criterio.
El paso siguiente es presentar los datos de forma adecuada mediante una Tabla Estadística y/o mediante la Representación Gráfica.
Las tablas estádísticas
Deben incluir al menos dos columnas:
- Una para recoger los valores o modalidades observados. Solemos agrupar en intervalos los variables cuantitativas.
- La otra para recoger las frecuencias observadas.
Pueden mostar frecuencias no acumuladas o acumuladas, y estas a su vez pueden ser frecuencas absolutas, relativas o de porcentaje.
La representación gráfica
Variables cuantitativas
- Diagrama de barras (histograma): para representar frecuencias no acumuladas. Nos permite ver fácilmente el valor de la variable más frecuente.
- Diagrama escalonado: para representar frecuencias acumuladas. Nos permite ver el número de observaciones que hay por debajo de un valor de la variable.
Variables cualitativas
- Diagrama de barras.
- Diagrama de sectores (pie chart): circulo dividido en tantos sectores como modalidades tiene un atributo.
- Barras de componentes porcencuales: una columna con una escala de 0 a 100.
- Cartograma: un mapa donde cada modalidad corresponde a un área geográfica.
Datos agrupados en intervalos
Al agrupar la información en intervalos se pierde información primaria, originando errores de agrupamiento.
- Se suele elejir entre 5 y 15 intervalos para tablas estadísticas
- Los límites de los intervalos pueden ser: abiertos, semiabiertos o cerrados
- Los intervalos deben ser exhaustivos. Todos los elementos de la población deben identificarse con un intervalo
- Mutuamente excluyentes: un elemento de la población no puede pertenecer a más de un intervalo
(en este curso seguiremos el criterio del solapamiento, es decir semiabiertos por la derecha. El límite inferior del intervalo se incluye pero no el límite superior, cuyo valor coincide con el límite inferior del siguiente intervalo)
No comments:
Post a Comment