Tesis de Investigacion: Distribución de Frecuencia

6/6/11

Distribución de Frecuencia

La distribución de frecuencia es la representación estructurada, en forma de tabla, de toda la información que se ha recogido sobre la variable que se estudia.

Variable	Frecuencias absolutas		Frecuencias relativas
(Valor)	Simple	Acumulada	Simple	Acumulada
x	x	x	x	x
X1	n1	n1	f1 = n1 / n	f1
X2	n2	n1 + n2	f2 = n2 / n	f1 + f2
...	...	...	...	...
Xn-1	nn-1	n1 + n2 +..+ nn-1	fn-1 = nn-1 / n	f1 + f2 +..+fn-1
Xn	nn	S n	fn = nn / n	S f

Siendo X los distintos valores que puede tomar la variable.
Siendo n el número de veces que se repite cada valor.
Siendo f el porcentaje que la repetición de cada valor supone sobre el total

Veamos un ejemplo:
Medimos la altura de los niños de una clase y obtenemos los siguientes resultados (cm):

Alumno	Estatura	Alumno	Estatura	Alumno	Estatura
x	x	x	x	x	x
Alumno 1	1,25	Alumno 11	1,23	Alumno 21	1,21
Alumno 2	1,28	Alumno 12	1,26	Alumno 22	1,29
Alumno 3	1,27	Alumno 13	1,30	Alumno 23	1,26
Alumno 4	1,21	Alumno 14	1,21	Alumno 24	1,22
Alumno 5	1,22	Alumno 15	1,28	Alumno 25	1,28
Alumno 6	1,29	Alumno 16	1,30	Alumno 26	1,27
Alumno 7	1,30	Alumno 17	1,22	Alumno 27	1,26
Alumno 8	1,24	Alumno 18	1,25	Alumno 28	1,23
Alumno 9	1,27	Alumno 19	1,20	Alumno 29	1,22
Alumno 10	1,29	Alumno 20	1,28	Alumno 30	1,21

Si presentamos esta información estructurada obtendríamos la siguiente tabla de frecuencia:

Variable	Frecuencias absolutas		Frecuencias relativas
(Valor)	Simple	Acumulada	Simple	Acumulada
x	x	x	x	x
1,20	1	1	3,3%	3,3%
1,21	4	5	13,3%	16,6%
1,22	4	9	13,3%	30,0%
1,23	2	11	6,6%	36,6%
1,24	1	12	3,3%	40,0%
1,25	2	14	6,6%	46,6%
1,26	3	17	10,0%	56,6%
1,27	3	20	10,0%	66,6%
1,28	4	24	13,3%	80,0%
1,29	3	27	10,0%	90,0%
1,30	3	30	10,0%	100,0%

Si los valores que toma la variable son muy diversos y cada uno de ellos se repite muy pocas veces, entonces conviene agruparlos por intervalos, ya que de otra manera obtendríamos una tabla de frecuencia muy extensa que aportaría muy poco valor a efectos de síntesis. (tal como se verá en la siguiente lección).
La Distribución de Frecuencias
Una Población o Universo de datos es un conjunto muy grande de números. Estos números pueden estar en un gran listado o puede ser un conjunto hipotético, es decir, podemos imaginar los números pero no los tenemos realmente. Una gran tabla de números ordenados al azar prácticamente no nos muestra información acerca de la población de datos. Suponiendo que disponemos de los datos del universo, ¿cómo podemos clasificar y ordenar los números para obtener más información acerca de ese universo de datos?.

Una forma sería escribir los números desde el menor hasta el mayor y colocar encima de cada uno tantas cruces o cuadraditos como veces que figure repetido en la población.
El número de veces que aparece repetido cada dato es la frecuencia de dicho valor. La representación gráfica que hemos visto se denomina Distribución de Frecuencias de la población.

La representación gráfica nos permite

ver información que antes no aparecía

tan evidente. Por ejemplo, sin hacer

ningún cálculo nos damos cuenta

donde está aproximadamente el

promedio de la población.
También nos muestra cuales son los valores

máximo y mínimo de la población, es decir, el rango o recorrido.

En el caso anterior, los datos de la población son números enteros. Cuando los números no son enteros o cuando tenemos un número muy grande de datos, se divide el rango total en subintervalos y se cuenta el número de valores que cae dentro de cada subintervalo.
Vamos a suponer, ahora, que tenemos una cierta población de N = 500 datos, por ejemplo el peso de varones adultos de 40 años. Una manera de caracterizar esta población es construir una distribución de frecuencias o gráfico de frecuencias. Para ello seguimos los pasos siguientes:
1) Tomamos nota del valor máximo y el valor mínimo de la serie de datos que estamos considerando.
2) Subdividimos el intervalo entre el máximo y el mínimo en algún número de intervalos (15 ó 20) mas pequeños iguales entre sí.
3) Contamos el número de datos que encontramos dentro de cada intervalo (Frecuencia). Por ejemplo, supongamos que en el intervalo i hay n_i observaciones (S*n_i = N).
4)Para construir el gráfico, colocamos en el eje de abcisas (Horizontal) los intervalos y levantamos en cada intervalo un rectángulo de altura proporcional al número ni de datos dentro del mismo.

Si hacemos el área del rectángulo levantado sobre el intervalo i-ésimo igual a la frecuencia relativa n_i/N, el área total bajo el histograma será igual a la unidad:

Obtenemos así un histograma que nos muestra la distribución de frecuencias de la población:
gráfico de distribución

Esta distribución de frecuencias nos muestra si hay resultados que son mas frecuentes que otros; si los valores están ubicados alrededor de un valor central, si están muy dispersos o poco dispersos. Podemos observar que fracción de todas las mediciones cae por ejemplo, entre 70 y 80 Kg.
Si elegimos una persona del grupo y la pesamos, el resultado es un dato que pertenece a la población de datos representada en el gráfico. Decimos, entonces, que estamos extrayendo un dato de la población de datos. Pero hay distintas maneras de elegir la persona, es decir, distintas maneras de realizar la extracción del dato.
Si nos paramos frente al grupo y elegimos una persona, estaremos seleccionando al más gordo, al más flaco o al más alto (y por lo tanto pesa más que otros), de acuerdo a criterios subjetivos que no podemos evitar. En cambio, si escribimos los nombres de todas las personas en una etiqueta, metemos todas las etiquetas en una caja y luego le pedimos a alguien que retire una etiqueta, la selección no estará influida por nuestra subjetividad. En este caso, decimos que la extracción es aleatoria.
Una extracción aleatoria es aquella en que cada miembro de la población tiene la misma posibilidad de ser elegido.

4 comentarios:

ysmarval21 de diciembre de 2014 a las 11:44
Hola, estoy enredada haciendo mi proyecto de tesis (anteproyecto) para la cual me pidieron definir el tipo de análisis cualicuantitativo (defini el enfoque mixto), y en la forma de presentación de los datos: cuadros de frecuencias múltiples y cuadros integrados. me piden concepto cita y claro el comentario, solo que no he tenido suerte, no consigo nada :( si puede asesorarme por favor. Gracias
ResponderEliminar
Respuestas
Unknown5 de octubre de 2017 a las 1:43
Donde puedo encontrar informacion sobre los cuadros de frecuencias múltiples y cuadros integrados? por favor
ResponderEliminar
Respuestas

Añadir comentario

Tesis de Investigacion

Apoyo para Tesis y Trabajo de grado

6/6/11

Distribución de Frecuencia

4 comentarios:

Como citar los temas del Blog de Tesis de Investigación

Investigación y Metodología

Apoyo para Tesis y Trabajo de grado

6/6/11

Distribución de Frecuencia

4 comentarios:

Como citar los temas del Blog de Tesis de Investigación

Suscribirse a

Investigación y Metodología