En las unidades anteriores se manejó el uso de la distribución z, la cual se podía utilizar siempre y cuando los tamaños de las muestras fueran mayores o iguales a 30 ó en muestras más pequeñas si la distribución o las distribuciones de donde proviene la muestra o las muestras son normales.
En esta unidad se podrán utilizar muestras pequeñas siempre y cuando la distribución de donde proviene la muestra tenga un comportamiento normal. Esta es una condición para utilizar las tres distribuciones que se manejarán en esta unidad; t de student, X2 ji-cuadrada y Fisher.
A la teoría de pequeñas muestras también se le llama teoría exacta del muestreo, ya que también la podemos utilizar con muestras aleatorias de tamaño grande.
En esta unidad se verá un nuevo concepto necesario para poder utilizar a las tres distribuciones mencionadas. Este concepto es "grados de libertad".
Para definir grados de libertad se hará referencia a la varianza muestral:
Entonces, en esta unidad la fórmula de grados de libertad será n-1 y su simbología
Supóngase que se toma una muestra de una población normal con media
La media y la varianza de la distribución t son
La siguiente figura presenta la gráfica de varias distribuciones t. La apariencia general de la distribución t es similar a la de la distribución normal estándar: ambas son simétricas y unimodales, y el valor máximo de la ordenada se alcanza en la media
Propiedades de las distribuciones t
- Cada curva t tiene forma de campana con centro en 0.
- Cada curva t, está más dispersa que la curva normal estándar z.
- A medida que
aumenta, la dispersión de la curva t correspondiente disminuye.
- A medida que
, la secuencia de curvas t se aproxima a la curva normal estándar, por lo que la curva z recibe a veces el nombre de curva t con gl =
La distribución de la variable aleatoria t está dada por:
Sean X1, X2, . . . , Xn variables aleatorias independientes que son todas normales con media
La distribución de probabilidad de t se publicó por primera vez en 1908 en un artículo de W. S. Gosset. En esa época, Gosset era empleado de una cervecería irlandesa que desaprobaba la publicación de investigaciones de sus empleados. Para evadir esta prohibición, publicó su trabajo en secreto bajo el nombre de "Student". En consecuencia, la distribución t normalmente se llama distribución t de Student, o simplemente distribución t. Para derivar la ecuación de esta distribución, Gosset supone que las muestras se seleccionan de una población normal. Aunque esto parecería una suposición muy restrictiva, se puede mostrar que las poblaciones no normales que poseen distribuciones en forma casi de campana aún proporcionan valores de t que se aproximan muy de cerca a la distribución t.
La distribución t difiere de la de Z en que la varianza de t depende del tamaño de la muestra y siempre es mayor a uno. Unicamente cuando el tamaño de la muestra tiende a infinito las dos distribuciones serán las mismas.
Se acostumbra representar con
Para encontrar los valores de t se utilizará la tabla de valores críticos de la distribución t del libro Probabilidad y Estadística para Ingenieros de los autores Walpole, Myers y Myers.
Ejemplo:El valor t con
t0.975=-t0.025 = -2.145
Ejemplo:
Encuentre la probabilidad de –t0.025 < t < t0.05.
Solución:
P( –t0.025 < t < t0.05) = 0.925
Ejemplo:Encuentre k tal que P(k < t < -1.761) = 0.045, para una muestra aleatoria de tamaño 15 que se selecciona de una distribución normal.
Solución:
P(-2.977 < t < -1.761) = 0.045
Ejemplo:Un ingeniero químico afirma que el rendimiento medio de la población de cierto proceso en lotes es 500 gramos por milímetro de materia prima. Para verificar esta afirmación toma una muestra de 25 lotes cada mes. Si el valor de t calculado cae entre –t0.05 y t0.05, queda satisfecho con su afirmación. ¿Qué conclusión extraería de una muestra que tiene una media de 518 gramos por milímetro y una desviación estándar de 40 gramos? Suponga que la distribución de rendimientos es aproximadamente normal.
Solución:De la tabla encontramos que t0.05 para 24 grados de libertad es de 1.711. Por tanto, el fabricante queda satisfecho con esta afirmación si una muestra de 25 lotes rinde un valor t entre –1.711 y 1.711.
Se procede a calcular el valor de t:
Si
(
Se hace una distinción entre los casos de
Con mucha frecuencia los estadísticos recomiendan que aun cuando la normalidad no se pueda suponer, con
Ejemplos:
- El contenido de siete contenedores similares de ácido sulfúrico son 9.8, 10.2, 10.4, 9.8, 10.0, 10.2, y 9.6 litros. Encuentre un intervalo de confianza del 95% para la media de todos los contenedores si se supone una distribución aproximadamente normal. Solución:La media muestral y la desviación estándar para los datos dados son:
- Un artículo publicado en el Journal of Testing and Evaluation presenta las siguientes 20 mediciones del tiempo de combustión residual en segundos de especímenes tratados de ropa de dormir para niños:
9.87 9.67 9.94 9.85 9.75
9.83 9.92 9.74 9.99 9.88
9.95 9.95 9.93 9.92 9.89
Se desea encontrar un nivel de confianza del 95% para el tiempo de combustión residual promedio. Supóngase que el tiempo de combustión residual sigue una distribución normal.
Ciertamente sospechamos que las pruebas sobre una media poblacional
Ejemplos:
- El Instituto Eléctrico Edison publica cifras del número anual de Kilowatt-hora que gastan varios aparatos eléctrodomésticos. Se afirma que una aspiradora gasta un promedio de 46 kilowatt-hora al año. Si una muestra aleatoria de 12 hogares que se incluye en un estudio planeado indica que las aspiradoras gastan un promedio de 42 kilowatt-hora al año con una desviación estándar de11.9 kilowatt-hora, ¿esto sugiere con un nivel de significancia de 0.05 que las aspiradoras gastan, en promedio, menos de 46 kilowatt-hora anualmente? Suponga que la población de kilowatt-hora es normal.
- Datos:
s= 11.9 kilowatt-hora
n = 12
- Ensayo de hipótesis Ho;
- Regla de decisión:
Si tR < -1.796 Se rechaza Ho
- Cálculos:
- Justificación y decisión:
Si
Como la
Se puede aprovechar este ejemplo para calcular el valor de P , como el valor de t calculada es de –1.16, se busca en la tabla y se ve que el area a la izquierda de este valor es de 0.135 con 11 grados de libertad, por lo tanto no se rechaza Ho., ya que sería un valor alto para un nivel de significancia.
- Un artículo publicado en la revista Materials Engineering describe los resultados de pruebas de resistencia a la adhesión de 22 especímenes de aleación U-700. La carga para la que cada especímen falla es la siguiente en MPa:
19.8 | 18.5 | 17.6 | 16.7 | 15.8 |
15.4 | 14.1 | 13.6 | 11.9 | 11.4 |
11.4 | 8.8 | 7.5 | 15.4 | 15.4 |
19.5 | 14.9 | 12.7 | 11.9 | 11.4 |
10.1 | 7.9 |
- Datos:
s = 3.55
n = 22
- Ensayo de hipótesis Ho;
- Regla de decisión: Si tR
- Cálculos:
- Justificación y decisión.
Para calcular el valor de P se va a la tabla y se busca en 21 grados de libertad el valor de t = 4.90. Se obseva que el valor mayor de t que se encuentra en la tabla con 21 grados de libertad es de 3.819 el cual le corresponde un área a la derecha de 0.0005, por lo que para el valor de 4.90 el valor de P es practicamente cero, y esto apoya la decisión de rechazar Ho.
- Los pesos en libras de una muestra aleatoria de bebés de seis meses son: 14.6, 12.5, 15.3, 16.1, 14.4, 12.9, 13.7 y 14.9. Haga una prueba con nivel de 5% de significancia para determinar si el peso promedio de todos los bebés de seis meses es distinto a 14 libras, suponga que sus pesos se distribuyen normalmente y calcule el valor de P.
Solución:
- Datos:
s = 1.21 libras
n = 8
- Ensayo de hipótesis Ho;
- Regla de Decisión:
Si tR < -2.365 ó si tR > 2.365 Se rechaza Ho
- Cálculos:
- Justificación y decisión:
Si
Como la
Para calcular el valor de P se busca en la tabla el valor de 0.7012 con 7 grados de libertad. Se obseva que este valor no se encuentra pero se puede interpolar entre los valores de 0.549 y 0.896 con áreas de 0.30 y 0.20 respectivamente. Interpolando linealmente se obtiene el valor de 0.2561.
Error tipo II ó 
El error tipo II se calcula de la misma forma en la que se calculó con la distribución z. Se realizarán algunos ejercicios en los cuales se determinará la probabilidad de cometer el error tipo II, utilizando la tabla de la distribución.Existen curvas características de operación en los libros con diferentes grados de libertad para determinar los tamaños de muestra correspondientes según el grado de error que se quiera, recordando que entre mayor sea el tamaño de muestra menor será el error.
- Se sabe que los voltajes de una marca de pilas tamaño C se distribuyen normalmente, se probó una muestra aleatoria de 15 y se encontró que la media es de 1.4 volts con una desviación estándar de 0.21 volts. En el nivel de significancia de 0.01:
- ¿Indica esto que la media de los voltajes es menor que 1.5 volts?
- Calcular la probabilidad de cometer el error tipo II si el voltaje promedio real de las pilas es de 1.3 volts.
Solución:
- Datos:
- Ensayo de hipótesis
H1;
- Regla de decisión:
Si tR < -2.624 Se rechaza Ho
- Cálculos:
- Justificación y decisión:
- Para el ejercicio del peso de los bebés de 6 meses, calcular el error tipo II, si los pesos verdaderos hubieran sido de 11 y 14.5 libras.
Solución:Primero se calculan los valores de
Se busca en la tabla el valor de 3.55 con 7 grados de libertad, y al interpolar nos da un área de 0.00475. El área correspondiente a 1.19 con 7 grados de libertad es de 0.1479. Por lo que
- Para el ejercicio en donde se dan los resultados de pruebas de resistencia a la adhesión de 22 especímenes de aleación U-700., encontrar la probabilidad de cometer el error tipo II si la carga promedio de falla es igual a 11.
Solución:Primero se obtendrá el valor del estadístico límite:
muy buena información pero no se ven las imágenes con las fórmulas T-T
ResponderEliminar