Apoyo para Tesis y Trabajo de grado

Parte de mi aporte como profesional, docente e investigadora venezolana; a los estudiantes que buscan enriquecer sus conocimientos, sustentar sus trabajos y mejorar personal y profesionalmente. Éxitos¡¡¡

30/5/11

INFERENCIA RESPECTO A LA DIFERENCIA DE DOS MEDIAS CUANDO SE USAN MUESTRAS DEPENDIENTES PEQUEÑAS


Para hacer inferencias estadísticas sobre dos poblaciones, se necesita tener una muestra de cada población. Las dos muestras serán dependientes o independientes de acuerdo a la forma de seleccionarlas. Si la selección de los datos de una población no está relacionada con la de los datos de la otra, son muestras independientes. Si las muestras se seleccionan de manera que cada medida en una de ellas pueda asociarse naturalmente con una medida en la otra muestra, se llaman muestras dependientes. Cada dato sale de alguna fuente; una fuente es algo, una persona o un objeto, que produce datos. Si dos medidas se obtienen de la misma fuente, se puede pensar que las medidas están pareadas. En consecuencia dos medidas que se obtienen del mismo conjunto de fuentes son dependientes. Note que si dos muestras son dependientes, entonces necesariamente tienen el mismo tamaño.
Muchas aplicaciones prácticas requieren hacer comparaciones entre dos poblaciones con base en datos pareados o en muestras dependientes. Las aplicaciones que pueden involucrar muestras dependientes incluyen:

  • Medicina.- Poner aprueba los efectos de una dieta mediante la obtención de las medidas del peso en la misma persona antes y después de aplicar una dieta.
  • Enseñanza.- Probar la efectividad de una estrategia de enseñanza aplicando exámenes antes y después a los mismos individuos.
  • Agricultura.- Poner a prueba los efectos de dos fertilizantes en la producción de frijol de soya comparando la producción de parcelas similares en las mismas condiciones.
  • Finanzas.- Comparar las estimaciones de dos talleres de autos chocados para las mismas unidades.
  • Industria.- Poner a prueba dos marcas de llantas en cuanto al desgaste del piso colocando una de cada marca en los rines traseros de una muestra de coches del mismo tipo.
Si se tienen dos muestral aleatorias dependientes de tamaño n, donde cada elemento de la primera muestra es pareja de un elemento de la segunda, entonces estas dos muestras dan lugar a una de parejas o a una diferencias, como lo indica la siguiente figura. La muestra de diferencias d = x1 – x2 se puede pensar como una muestra de la población de diferencias de datos pareados de dos poblaciones. La media de la población de diferencias es igual a la diferencias de las medias poblacionales.


Se puede demostrar que la media de las diferencias es la diferencias de las mismas considerando las dos poblaciones siguientes con cuyos elementos se han formado parejas:

La diferencia entre medias poblacionales es:

Población 1
Población 2
Diferencia d
2
5
2 – 5 = -3
4
6
4 – 6 = -2
6
2
6 – 2 = 4
8
4
8 – 4 = 4
10
8
10 – 8 = 2
Suma 30
25
5
Media 6
5
1
1-2 = 6 – 5 = 1

y la media de la población de diferencias se representa:
En consecuencia se ve que la media de la población de diferencias es igual a la diferencia entre las medias poblacionales. Siguiendo la misma línea de razonamiento, se puede demostrar que, para dos muestras dependientes, la media de sus diferencias muestrales es igual a la diferencia entre sus medias muestrales. Esto es, si x1 – x2 = d, entonces 

Si se tiene una muestra aleatoria de n pares de datos y si las diferencias d se distribuyen normalmente, entonces el estadístico:
 tiene una distribución muestral que es una distribución t con gl=n-1, donde sd representa la desviación estándar de la muestra de puntajes diferencia.
Estadístico
donde g.l = n-1


Límites del intervalo de confianza para 1-2 cuando se usa muestras dependientes


Ejemplos:

  1. Se hizo un estudio para definirse si los ejercicios aeróbicos reducen el ritmo cardiaco de una persona durante el descanso, y al examinar a diez voluntarios antes y después de seguir un programa de ese tipo durante seis meses, sus pulsaciones, en latidos por minuto, dieron los siguientes registros:
  2. Voluntario
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    Antes
    73
    77
    68
    62
    72
    80
    76
    64
    70
    72
    Después
    68
    72
    64
    60
    71
    77
    74
    60
    64
    68
    Use  = 0.05 para calcular si los ejercicios aeróbicos reducen el ritmo cardiaco durante el reposo. Calcule el valor de P.
    Solución:Ensayo de hipótesis: HoA - D = 0 H1A - D > 0
    Regla de decisión:Si tR  1.833 No se rechaza Ho Si tR > 1.833 se rechaza Ho
    Cálculos:
    Se procederá a calcular las diferencias de cada par:
    Voluntario
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    Antes
    73
    77
    68
    62
    72
    80
    76
    64
    70
    72
    Después
    68
    72
    64
    60
    71
    77
    74
    60
    64
    68
    Diferencia
    5
    5
    4
    2
    1
    3
    2
    4
    6
    4
    Al calcular la media de las diferencias nos da 3.6 con una sd = 1.58.
    Justificación y decisión:
    Como 7.20 es mayor que 1.833, se rechaza H0, y se concluye cn un nivel de significancia de 0.05 que los datos indican que los ejercicios aeróbicos disminuyen significativamente el ritmo cardiaco durante el reposo.Para calcular el valor de P se busca el 7.20 en el renglón de 9 grados de libertad en la tabla t, y se observa que el valor mayor que aparece en dicha tabla es 4.781 al cual le corresponde una área a la derecha de 0.0005, entonces se puede concluir que el valor de P es prácticamente cero.
  3. Diez hombres se sometieron a una dieta especial registrando sus pesos antes de comenzarla y después de un mes de estar en ella. Los resultados de los pesos, en libras, se muestran a continuación:
  4. Hombre
    A

    B

    C

    D

    E

    F

    G

    H

    I

    J
    Antes
    181

    172

    190

    186

    210

    202

    166

    173

    183

    184

    Después

    178

    175

    185

    184

    207

    201

    160

    168

    180

    189
    Haga una prueba con  = 0.05 para determinar si la dieta logró alguna diferencia, ya sea positiva o negativa. Calcule el valor de P.
    Solución:Ensayo de hipótesis: HoA - D = 0 H1A - D  0
    Regla de decisión: Si –2.262  t 2.262 No se rechaza Ho, Si la tc < -2.262 ó si tc > 2.262 se rechaza Ho.
    Cálculos:
    Se procederá a calcular las diferencias de cada par:
    Hombre
    A

    B

    C

    D

    E

    F

    G

    H

    I

    J
    Antes
    181

    172

    190

    186

    210

    202

    166

    173

    183

    184

    Después

    178

    175

    185

    184

    207

    201

    160

    168

    180

    189

    Diferencia

    3

    -3

    5

    2

    3

    1

    6

    5

    3

    -5
    Al calcular la media de las diferencias nos da 2 con una sd = 3.53.
    Justificación y decisión:
    Como 1.79 está entre los dos valores críticos de –2.262 y 2.262, por lo tanto no se rechaza H0, y se concluye con un  = 0.05 que no existe evidencia estadística que apoye la efectividad de la dieta para variar el peso. Para calcular el valor de P se interpola entre 0.10 y 0.05, con 9 grados de libertad obteniendo un área de 0.0574, pero como el ensayo es bilateral este sería un valor de P/2, por lo tanto el valor de P = (2)(0.0574) = 0.1148
  5. Calcula el intervalo de confianza del 95% para la diferencia de medias poblacionales del ejercicio anterior.
Solución:
El intervalo de confianza del 95% es –0.53 y 4.53 y como contiene a cero, no podemos concluir que la dieta sea efectiva para cambiar el peso.


  1. Un economista considera que el número de galones de gasolina que consume mensualmente cada automóvil en Estados Unidos es una variable aleatoria normal con 
=50 y varianza desconocida.

  1. Supóngase que una muestra aleatoria de nueve observaciones presenta una varianza muestral de 36. ¿Cuál es la probabilidad de que x sea mayor que 54?
  2. ¿Cuál es la probabilidad de que x sea menor que 44?
  3. ¿Cuál es la probabilidad de que x este comprendida entre 44 y 55 ?
  4. ¿Cómo modificarían las respuestas a las preguntas anteriores si n = 36 ?

  1. Una máquina produce las varillas de metal utilizadas en el sistema de suspensión de un automóvil. El diámetro de la varilla está distribuido en forma normal, con media y varianza desconocida. Se toma una muestra aleatoria de 10 piezas, y se encuentra que los diámetros son: 2.25, 2.24, 2.27, 2.26, 2.23, 2.25, 2.24, 2.27, 2.22 y 2.23 pulgadas. Encuentre el intervalo de confianza del 99% para el diámetro promedio de todas las varillas de metal.

  1. Una muestra de 12 latas de sopa producida por cierta compañía produjo los siguientes pesos netos, medidos en onzas:
  2. 11.912.211.612.112.111.8
    11.911.812.012.311.812.0
    Si se supone normalidad en los pesos, construya un intervalo de confianza del 95% para el peso promedio de todas las latas de sopa producidas por la compañía.
  3. Los siguientes datos registrados en días, representan el tiempo de recuperación para pacientes que se tratan al azar con uno de los medicamentos para curar infecciones graves de la vejiga:

  4. Medicamento 1

    Medicamento 2

    n1 = 14

    n2 = 16

    x1 = 17

    x2 = 19

    s12 = 1.5

    s22 = 1.8
    Encuentre un intervalo de confianza de 99% para la diferencia promedio en el tiempo de recuperación para los dos medicamentos, suponga poblaciones normales con varianzas iguales.
  5. Un experimento compara las economías en combustible para dos tipos de camiones compactos a diesel equipados de forma similar. Suponga que se utilizaron 12 camiones Volkswagen y 10 Toyota en pruebas de velocidad constante de 90 kilómetros por hora. Si los 12 VW promedian 16 Km/lto con una desviación estándar de 1.0 km/lto, y los 10 Toyota promedian 11 km/lto con una desviación estándar de 0.8 km/lto, construya un intervalo de confianza de 90% para la diferencia entre los kilómetros promedio por litro de estos dos camiones. Suponga poblaciones normales con varianzas iguales.
  6. Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una población normal con varianza 
= 6, tenga una varianza s2

  1. Mayor que 9.1
  2. Entre 3.462 y 10.745

  1. Encuentre el intervalo de confianza del 90% para la varianza del diámetro de las varillas del ejercicio 2 e interprete resultado.
  2. Una máquina que produce bolas para cojinetes se le detiene periódicamente para verificar el diámetro. En este caso en particular no interesa el diámetro medio, sino la variabilidad de los diámetros. Supóngase que se toma una muestra de 31 bolas y se encuentra que la varianza de los diámetros es de 0.94 mm2. Construya un intervalos de confianza de 95% para la varianza, e interprete los resultados, suponiendo normalidad en la población.
  3. Si s12 y s22 representan las varianzas de muestras aleatorias independientes de tamaño n1=8 y n2=12, tomadas de poblaciones normales con varianzas iguales, encuentre P(s12/s22< 4.89).
  4. Los siguientes datos representan los tiempos de duración de las películas que producen dos compañías cinematográficas.



CompañíaTiempo (minutos)
I103, 94, 110, 87, 98
II97, 82, 123, 92, 175, 88, 118



Construya un intervalo de confianza del 90% para la relación de varianzas.
  1. Construya un intervalo de confianza de 98% para la relación de desviaciones estándar del problema número 5, y de acuerdo con los resultados obtenidos, diga si estuvo bien el supuesto de varianzas iguales.
  2. Pruebe la hipótesis de que el contenido promedio de los envases de un lubricante en particular es de 10 litros si los contenidos de una muestra aleatoria de 10 envases son: 10.2, 9.7, 10.1, 10.3, 10.1, 9.8, 9.9, 10.4, 10.3 y 9.8 litros. Utilice un nivel de significancia de 0.01 y suponga que la distribución del contenido es normal.

  1. De acuerdo con un estudio dietético una ingesta alta de sodio se puede relacionar con úlceras, cáncer de estómago y migraña. El requerimiento humano de sal es de sólo 220 miligramos por día, el cual se rebasa en la mayoría de las porciones individuales de cereales listos para comerse. Si una muestra aleatoria de 20 porciones similares de Special K tiene un contenido medio de 244 miligramos de sodio y una desviación estándar de 24.5 miligramos ¿esto sugiere, en el nivel de significancia del 0.05, que el contenido promedio de sodio para porciones individuales de Special K es mayor que 220 miligramos? Suponga que la distribución de contenidos de sodio es normal.
  2. Una compañía armadora de automóviles grandes trata de decidir si compra llantas de la marca o de la B para sus modelos nuevos. Se lleva a cabo un experimento para ayudar a llegar a una decisión, en el que se usan 12 llantas de cada marca. Los resultados son:
Marca A: xA = 37,900 Kilómetros; SA = 5,100 Kilómetros.
Marca B: xB = 39,800 Kilómetros; SB = 5,900 Kilómetros
Pruebe la hipótesis de que no hay diferencia en las dos marcas de llantas con un nivel de significancia de 0.05. También calcule el valor de P, suponiendo normalidad y varianzas iguales.
  1. Dos secciones de un curso de estadística son sometidas a un mismo examen final. De las calificaciones obtenidas se extrae una muestra aleatoria de tamaño 9 en la grupo "A", y otra de tamaño 4 en el grupo "B".

Grupo "A":65, 68, 72, 75, 82, 85, 87, 91, 95
Grupo "B":50, 59, 71, 80

  1. Con un nivel de significación de 0.05 ¿podría decirse que los dos grupos tienen las mismas calificaciones promedio?. Suponga que provienen de poblaciones normales con varianzas iguales.
  2. Calcule el valor de P para este ensayo e interprete su resultado
  3. Por medio de un ensayo de hipótesis diga si estuvo acertada la suposición de las varianzas iguales en el inciso a). Haga la prueba con un nivel de significación de 0.10.
  1. Una máquina automática empacadora de azúcar se usa para llenar bolsas de 5 libras. Una muestra aleatoria de 15 bolsas indicó una media de 4.94 libras y una desviación estándar de 0.02; si se supone que la distribución de los pesos es normal, y de la experiencia pasada se sabe que la desviación estándar de los pesos es de 0.015 libras, ¿muestran los datos suficiente evidencia para decir que hubo un aumento en la variabilidad?. Haga la prueba con un nivel de significancia del 0.05 y calcule el valor de P.

  1. Una empresa empacadora de azúcar está considerando una máquina nueva para reemplazar su máquina actual. Los pesos de una muestra de 21 paquetes de 5 libras empacados por la máquina vieja producen una varianza de 0.16, mientras que los pesos de 20 paquetes de 5 libras empacados por la máquina nueva dan una varianza de 0.09.En base a estos datos, ¿aconsejaría usted al gerente a comprar la máquina nueva? Use un = 0.05.


  1. La Metro Bus Company en una ciudad grande afirma tener una varianza en los tiempos de llegada de sus carros, medidos en minutos, a las distintas paradas, de no más de 5; un ejecutivo de la compañía ordenó tomar los tiempos de llegada en varias paradas para determinar si los conductores están cumpliendo con sus horarios. Si una muestra de 12 llegadas a una parada particular produjo una varianza de 5.7 y se supone que los tiempos de llegada se distribuyen normalmente, ¿muestran estos datos suficiente evidencia para contradecir a la compañía? Use un nivel de significancia de 0.10 y calcule el valor de P.
Respuesta a los Problemas Propuestos

  1. a) 0.0421, b) 0.00862, c) 0.97276
  2. 2.2284    2.2635
  3. 11.859    12.11
  4. 0.70  2 - 1  3.30
  5. 4.3  vw - T  5.7
  6. a) 0.05, b) 0.94
  7. 4.689 x 10-5  2  1.559 x 10-4
  8. 0.60  2  1.679
  9. 0.99
  10. 2.20  (2/1)2  61.50
  11. 0.549  (Vw/T 2.69. Estuvo bien la suposición puesto que el uno esta dentro del intervalo.
  12. Región crítica -3.25  t  3.25. t = 0.77 por lo tanto no rechaza Ho.
  13. Región crítica t>1.729. t= 4.30 rechazar Ho.
  14. Región crítica -2.074  t  2.074. t = -0.84 no rechazar Ho. P = 0.411
  15. a) Región crítica -2.201  t  2.201. t = 2.27 rechazar Ho. b) P = 0.0445 c) Región crítica 0.1129  F  4.07. F = 1.578, no rechaza Ho, estuvo bien la suposición de varianzas iguales.
  16. Región crítica X2 > 23.685. X2 = 24.88 rechazar Ho. P = 0.0377
  17. Región critica F > 2.16. F = 1.77, no se rechaza Ho y no conviene comprar la máquina nueva.
  18. Región crítica X2 > 17.275. X2 = 12.54 no se rechaza Ho. P = 0.3280

1 comentario: