Técnicas Estadísticas para las Ciencias de la Documentación/Descripción/Tabulación

Tabulación de datos

editar

El proceso de tabulación consiste en el recuento de los datos que están contenidos en los cuestionarios. En este proceso incluimos todas aquellas operaciones encaminadas a la obtención de resultados numéricos relativos a los temas de estudio que se tratan en los cuestionarios. Se requiere una previa codificación de las respuestas obtenidas en los cuestionarios. Realizamos tabulación, codificación y diseño de gráficos con datos biográficos, de consumo o de opinión. Los resultados serán presentados en tablas y/o mapas gráficos que expliquen las relaciones existentes entre las diversas variables analizadas. Esta presentación se adecuará a la petición de nuestros clientes mediante análisis estadísticos de datos, grabados por nosotros o por terceros, análisis bivariantes, análisis multivariantes, test de contraste de hipótesis

Tras la recogida de información en una investigación, nos encontraremos con una serie de datos sobre diferentes variables de los individuos de una muestra. El primer paso para comenzar a analizar los datos es el de organizarlos de manera que podamos ver las características de los diferentes valores que han tomado las observaciones. El tipo de organización de los datos depende del tipo de variable. A continuación se describen las técnicas de organización más habituales para cada tipo de variable.

Variables cualitativas

editar

Las variables cualitativas (ordinales o no) toman valores no numéricos. Para tener una idea de los datos recogidos, pueden contabilizarse las diferentes ocurrencias de los distintos valores, dando lugar a los tres conceptos siguientes.

Frecuencia absoluta

editar

La frecuencia absoluta es el número de apariciones en una muestra de un determinado valor de una variable. Si la variable puede tomar valores en el conjunto  , la frecuencia absoluta del valor o categoría i se denota por  

La suma de las frecuencias de todos los valores de la variable equivale a una cuenta de los elementos en la muestra, por lo que esa suma debe ser igual al tamaño muestral.

 

Frecuencia relativa

editar

La frecuencia relativa nos indica las ocurrencias de un valor determinado, pero no nos indica la proporción o tamaño relativo respecto a los otros valores. Para esto se utilizan las frecuencias relativas, que no son otra cosa que la relación entre la frecuencia absoluta de cada valor y el tamaño muestral n. Estas frecuencias se denotan como  .

 

La suma de las frecuencias relativas de los valores de una muestra son tantos por uno, y en consecuencia su suma tiene que ser la unidad.

 

Porcentajes

editar

Otra forma de representar la misma información que proporciona la frecuencia relativa es utilizar porcentajes, es decir, tantos por cien en lugar de tantos por uno.

En este caso, la suma de los porcentajes deberá ser el 100%.

 

Variables cualitativas ordinales

editar

En las variables cualitativas ordinales se pueden utilizar los mismos conceptos de frecuencia absoluta, relativa o porcentajes, pero además se pueden utilizar tres conceptos relacionados que incluyen una acumulación.

La frecuencia absoluta acumulada para una variable con valores   se define para cada valor i de la variable de la siguiente forma:

 

Es decir, para el valor de posición i, se consideran (se suman) las frecuencias de todos los valores menores, además de la del propio valor. La frecuencia absoluta acumulada del mayor valor coincide con el tamaño muestral n, ya que se consideran las frecuencias de todos los valores.

De manera similar, la frecuencia relativa acumulada para una variable con valores   se define para cada valor i de la variable de la siguiente forma:

 

Las frecuencias relativas acumuladas se pueden calcular alternativamente a partir de las frecuencias absolutas acumuladas:

 


Este tipo de medidas no tiene una interpretación clara si no hay un orden en los valores de la variable.

Variables cuantitativas discretas

Para las variables cuantitativas discretas se pueden utilizar las mismas técnicas de tebulación de las variables cualitativas ordinales. No obstante, cuando el número de valores numéricos de la variable es muy grande, pueden agruparse las medidas en intervalos, tal y como se hace con las variables cuantitativas continuas, que se ven a continuación.

Variables cuantitativas continuas

editar

Aunque los datos de las variables cuantitativas continuas se pueden tabular al igual que en los casos anteriores, el gran número de valores posibles que suelen tener aconseja agruparlas en intervalos contiguos denominados intervalos de clase. Cada intervalo de clase tiene un valor representativo, que es el valor intermedio, al que se denomina marca de clase.

Los intervalos deben cumplir las siguientes normas:

  • Cada dato debe pertenecer solo a un intervalo.
  • Todos los datos deben estar incluidos en algún intervalo.

NOTA: La tabulación en intervalos es útil para la representación y comprensión de los datos. No obstante, a la hora de hacer cálculos de medidas como medias o varianzas y en general para análisis de tipo matemático, deben utilizarse los datos originales, sin la tabulación.

Nota: cálculo del número de intervalos de clase

editar

El número de intervalos de clase que se utilizan en un determinado estudio es una decisión del investigador. No obstante, hay reglas para ayudarnos a orientarnos en un número apropiado.


Una de las técnicas es la regla de Sturges, que calcula el número de intervalos por la siguient fórmula.