Apoyo para Tesis y Trabajo de grado

Parte de mi aporte como profesional, docente e investigadora venezolana; a los estudiantes que buscan enriquecer sus conocimientos, sustentar sus trabajos y mejorar personal y profesionalmente. Éxitos¡¡¡

6/6/11

Distribución de Frecuencia


La distribución de frecuencia es la representación estructurada, en forma de tabla, de toda la información que se ha recogido sobre la variable que se estudia.
Variable
Frecuencias absolutas
Frecuencias relativas
(Valor)
Simple
Acumulada
Simple
Acumulada
xxxxx
X1
n1
n1
f1 = n1 / n
f1
X2
n2
n1 + n2
f2 = n2 / n
f1 + f2
...
...
...
...
...
Xn-1
nn-1
n1 + n2 +..+ nn-1
fn-1 = nn-1 / n
f1 + f2 +..+fn-1
Xn
nn
S n
fn = nn / n
S f





Siendo X los distintos valores que puede tomar la variable.
Siendo n el número de veces que se repite cada valor.
Siendo f el porcentaje que la repetición de cada valor supone sobre el total
Veamos un ejemplo:
Medimos la altura de los niños de una clase y obtenemos los siguientes resultados (cm):
Alumno
Estatura
Alumno
Estatura
Alumno
Estatura
x
x
x
x
x
x
Alumno 1
1,25
Alumno 11
1,23
Alumno 21
1,21
Alumno 2
1,28
Alumno 12
1,26
Alumno 22
1,29
Alumno 3
1,27
Alumno 13
1,30
Alumno 23
1,26
Alumno 4
1,21
Alumno 14
1,21
Alumno 24
1,22
Alumno 5
1,22
Alumno 15
1,28
Alumno 25
1,28
Alumno 6
1,29
Alumno 16
1,30
Alumno 26
1,27
Alumno 7
1,30
Alumno 17
1,22
Alumno 27
1,26
Alumno 8
1,24
Alumno 18
1,25
Alumno 28
1,23
Alumno 9
1,27
Alumno 19
1,20
Alumno 29
1,22
Alumno 10
1,29
Alumno 20
1,28
Alumno 30
1,21
Si presentamos esta información estructurada obtendríamos la siguiente tabla de frecuencia:
Variable
Frecuencias absolutas
Frecuencias relativas
(Valor)
Simple
Acumulada
Simple
Acumulada
xxxxx
1,20
1
1
3,3%
3,3%
1,21
4
5
13,3%
16,6%
1,22
4
9
13,3%
30,0%
1,23
2
11
6,6%
36,6%
1,24
1
12
3,3%
40,0%
1,25
2
14
6,6%
46,6%
1,26
3
17
10,0%
56,6%
1,27
3
20
10,0%
66,6%
1,28
4
24
13,3%
80,0%
1,29
3
27
10,0%
90,0%
1,30
3
30
10,0%
100,0%
Si los valores que toma la variable son muy diversos y cada uno de ellos se repite muy pocas veces, entonces conviene agruparlos por intervalos, ya que de otra manera obtendríamos una tabla de frecuencia muy extensa que aportaría muy poco valor a efectos de síntesis. (tal como se verá en la siguiente lección).
La Distribución de Frecuencias
Una Población o Universo de datos es un conjunto muy grande de números. Estos números pueden estar en un gran listado o puede ser un conjunto hipotético, es decir, podemos imaginar los números pero no los tenemos realmente. Una gran tabla de números ordenados al azar prácticamente no nos muestra información acerca de la población de datos. Suponiendo que disponemos de los datos del universo, ¿cómo podemos clasificar y ordenar los números para obtener más información acerca de ese universo de datos?.

Una forma sería escribir los números desde el menor hasta el mayor y colocar encima de cada uno tantas cruces o cuadraditos como veces que figure repetido en la población.
El número de veces que aparece repetido cada dato es la frecuencia de dicho valor. La representación gráfica que hemos visto se denomina Distribución de Frecuencias de la población.

promedio de la población
La representación gráfica nos permite 
ver información que antes no aparecía
tan evidente. Por ejemplo, sin hacer 
ningún cálculo nos damos cuenta
donde está aproximadamente el 
promedio de la población.
También nos muestra cuales son los valores
máximo y mínimo de la población, es decir, el rango o recorrido.
En el caso anterior, los datos de la población son números enteros. Cuando los números no son enteros o cuando tenemos un número muy grande de datos, se divide el rango total en subintervalos y se cuenta el número de valores que cae dentro de cada subintervalo.
Vamos a suponer, ahora, que tenemos una cierta población de N = 500 datos, por ejemplo el peso de varones adultos de 40 años. Una manera de caracterizar esta población es construir una distribución de frecuencias o gráfico de frecuencias. Para ello seguimos los pasos siguientes:
1) Tomamos nota del valor máximo y el valor mínimo de la serie de datos que estamos considerando.
2) Subdividimos el intervalo entre el máximo y el mínimo en algún número de intervalos (15 ó 20) mas pequeños iguales entre sí.
3) Contamos el número de datos que encontramos dentro de cada intervalo (Frecuencia). Por ejemplo, supongamos que en el intervalo i hay ni observaciones (S*ni = N).
4)Para construir el gráfico, colocamos en el eje de abcisas (Horizontal) los intervalos y levantamos en cada intervalo un rectángulo de altura proporcional al número ni de datos dentro del mismo.

Si hacemos el área del rectángulo levantado sobre el intervalo i-ésimo igual a la frecuencia relativa ni/N, el área total bajo el histograma será igual a la unidad:
area del histograma
Obtenemos así un histograma que nos muestra la distribución de frecuencias de la población:
gráfico de distribución
Esta distribución de frecuencias nos muestra si hay resultados que son mas frecuentes que otros; si los valores están ubicados alrededor de un valor central, si están muy dispersos o poco dispersos. Podemos observar que fracción de todas las mediciones cae por ejemplo, entre 70 y 80 Kg.
Si elegimos una persona del grupo y la pesamos, el resultado es un dato que pertenece a la población de datos representada en el gráfico. Decimos, entonces, que estamos extrayendo un dato de la población de datos. Pero hay distintas maneras de elegir la persona, es decir, distintas maneras de realizar la extracción del dato.
Si nos paramos frente al grupo y elegimos una persona, estaremos seleccionando al más gordo, al más flaco o al más alto (y por lo tanto pesa más que otros), de acuerdo a criterios subjetivos que no podemos evitar. En cambio, si escribimos los nombres de todas las personas en una etiqueta, metemos todas las etiquetas en una caja y luego le pedimos a alguien que retire una etiqueta, la selección no estará influida por nuestra subjetividad. En este caso, decimos que la extracción es aleatoria.
Una extracción aleatoria es aquella en que cada miembro de la población tiene la misma posibilidad de ser elegido.

4 comentarios:

  1. Hola, estoy enredada haciendo mi proyecto de tesis (anteproyecto) para la cual me pidieron definir el tipo de análisis cualicuantitativo (defini el enfoque mixto), y en la forma de presentación de los datos: cuadros de frecuencias múltiples y cuadros integrados. me piden concepto cita y claro el comentario, solo que no he tenido suerte, no consigo nada :( si puede asesorarme por favor. Gracias

    ResponderEliminar
  2. Donde puedo encontrar informacion sobre los cuadros de frecuencias múltiples y cuadros integrados? por favor

    ResponderEliminar