Apoyo para Tesis y Trabajo de grado

Parte de mi aporte como profesional, docente e investigadora venezolana; a los estudiantes que buscan enriquecer sus conocimientos, sustentar sus trabajos y mejorar personal y profesionalmente. Éxitos¡¡¡

30/5/11

ESTADISTICA NO PARAMETRICA


La mayor parte de los procedimientos de prueba de hipótesis que se presentan en las unidades anteriores se basan en la suposición de que las muestras aleatorias se seleccionan de poblaciones normales. Afortunadamente, la mayor parte de estas pruebas aún son confiables cuando experimentamos ligeras desviaciones de la normalidad, en particular cuando el tamaño de la muestra es grande. Tradicionalmente, estos procedimientos de prueba se denominan métodos paramétricos. En esta sección se consideran varios procedimientos de prueba alternativos, llamados no paramétricos ó métodos de distribución libre, que a menudo no suponen conocimiento de ninguna clase acerca de las distribuciones de las poblaciones fundamentales, excepto que éstas son continuas.

Los procedimientos no paramétricos o de distribución libre se usan con mayor frecuencia por los analistas de datos. Existen muchas aplicaciones en la ciencia y la ingeniería donde los datos se reportan no como valores de un continuo sino mas bien en una escala ordinal tal que es bastante natural asignar rangos a los datos.

Un ejemplo donde se aplica una prueba no paramétrica es el siguiente, dos jueces deben clasificar cinco marcas de cerveza de mucha demanda mediante la asignación de un grado de 1 a la marca que se considera que tiene la mejor calidad global, un grado 2 a la segunda mejor, etcétera. Se puede utilizar entonces una prueba no paramétrica para determinar donde existe algún acuerdo entre los dos jueces.

Se debe señalar que hay varias desventajas asociadas con las pruebas no paramétricas. En primer lugar, no utilizan la información que proporciona la muestra, y por ello una prueba no paramétrica será menos eficiente que el procedimiento paramétrico correspondiente, cuando se pueden aplicar ambos métodos. En consecuencia, para lograr la misma potencia, una prueba no paramétrica requerirá la correspondiente prueba no paramétrica.

Como se indicó antes, ligeras divergencias de la normalidad tienen como resultado desviaciones menores del ideal para las pruebas paramétricas estándar. Esto es cierto en particular para la prueba t y la prueba F. En el caso de la prueba t y la prueba F, el valor P citado puede ser ligeramente erróneo si existe una violación moderada de la suposición de normalidad.

En resumen, si se puede aplicar una prueba paramétrica y una no paramétrica al mismo conjunto de datos, debemos aplicar la técnica paramétrica más eficiente. Sin embargo, se debe reconocer que las suposiciones de normalidad a menudo no se pueden justificar, y que no siempre se tienen mediciones cuantitativas.


La prueba del signo se utiliza para probar la hipótesis sobre la mediana  de una distribución continua. La mediana de una distribución es un valor de la variable aleatoria X tal que la probabilidad de que un valor observado de X sea menor o igual, o mayor o igual, que la mediana es 0.5. Esto es, .

Puesto que la distribución normal es simétrica, la media de una distribución normal es igual a la mediana. Por consiguiente, la prueba del signo puede emplearse para probar hipótesis sobre la media de una población normal.

Suponga que las hipótesis son:
Supóngase que X1, X2, . . . , Xn es una muestra aleatoria tomada de la población de interés. Fórmense las diferencias
Ahora bien si la hipótesis nula es verdadera, cualquier diferencia tiene la misma probabilidad de ser negativa o positiva. Un estadístico de prueba apropiado es el número de estas diferencias que son positivas, por ejemplo R+. Por consiguiente, la prueba de la hipótesis nula es en realidad una prueba de que el número de signos positivos es un valor de una variable aleatoria binomial con parámetro P = ½. Puede calcularse un valor P para el número observado de signos positivos r+ directamente de la distribución binomial. Al probar la hipótesis que se muestra al principio, se rechaza H0 en favor de H1 sólo si la proporción de signos positivos es suficientemente menor que ½ ( o de manera equivalente, cada vez que el número observado de signos positivos r+ es muy pequeño). Por tanto, si el valor P calculado
P = P(R+ r+ cuando p = 1/2)
es menor o igual que algún nivel de significancia seleccionado previamente, entonces se rechaza H0 y se concluye que H1 es verdadera.
Para probar la otra hipótesis unilateral
se rechaza H0 en favor de H1 sólo si el número observado de signos más, r+, es grande o, de manera equivalente, cada vez que la fracción observada de signos positivos es significativamente mayor que ½. En consecuencia, si el valor P calculado P = P(R+ r+ cuando p = 1/2) es menor que , entonces H0 se rechaza y se concluye que H1 es verdadera.
También puede probarse la alternativa bilateral. Si las hipótesis son:
se rechaza H0 si la proporción de signos positivos difiere de manera significativa de ½ (ya se por encima o por debajo). Esto es equivalente a que el número observado de signos r+ sea suficientemente grande o suficientemente pequeño. Por tanto, si r+ >n/2 el valor P es
P=2P(R+ rcuando p = ½)
Y si r+ >n/2 el valor P es
P=2P(R+ rcuando p = ½)
Si el valor P es menor que algún nivel preseleccionado , entonces se rechaza H0 y se concluye que H1 es verdadera.

Ejemplos:
  1. Un artículo informa cerca de un estudio en el que se modela el motor de un cohete reuniendo el combustible y la mezcla de encendido dentro de un contenedor metálico. Una característica importante es la resistencia al esfuerzo cortante de la unión entre los dos tipos de sustancias. En la siguiente tabla se muestran los resultados obtenidos al probar 20 motores seleccionados al azar. Se desea probar la hipótesis de que la mediana de la resistencia al esfuerzo cortante es 2000 psi, utilizando 
= 0.05.

Solución:Se mostrará la tabla del ejercicio y es función del investigador poner los signos con respecto a la mediana.



Observación
Resistencia al esfuerzo cortante
xi
Signo de la diferencia
xi-2000
Observación
Resistencia al esfuerzo cortante
xi
Signo de la diferencia
xi-2000
1
2158.70
+
11
2165.20
+
2
1678.15
-
12
2399.55
+
3
2316.00
+
13
1779.80
-
4
2061.30
+
14
2336.75
+
5
2207.50
+
15
1765.30
-
6
1708.30
-
16
2053.50
+
7
1784.70
-
17
2414.40
+
8
2575.10
+
18
2200.50
+
9
2357.90
+
19
2654.20
+
10
2256.70
+
20
1753.70
-

De la tabla se puede observar que el estadístico de prueba r+ = 14.

Regla de decisión:
Si el valor de P correspondiente a r+=14 es menor o igual que  =0.05 se rechaza H0.

Cálculos:
Puesto que r+=14 es mayor que n/2=20/2=10, el valor de P se calcula de
P=2P(R+ 14 cuando p = ½)
La P se calcula con la fórmula de la distribución binomial:
Conclusión:
Como P=0.1153 no es menor que =0.05, no es posible rechazar la hipótesis nula de que la mediana de la resistencia al esfuerzo constante es 2000 psi.

Otra manera de resolver el problema es con Aproximación normal:Cuando p=0.5, la distribución binomial esta bien aproximada por la distribución normal cuando n es al menos 10. Por tanto, dado que la media de la distribución binomial es np y la varianza es npq, la distribución de R+ es aproximadamente normal con media 0.5n y varianza 0.25n, cada vez que n es moderadamente grande. Por consiguiente las hipótesis pueden probarse con el estadístico:
Las reglas de decisión se establecerán como cualquier ensayo en una distribución muestral en donde se utiliza la distribución normal.

Para resolver el problema anterior:



Como la es mayor que 10 se utilizará la aproximación normal.
Regla de Decisión:
Si –1.96 ZR 1.96 No se rechaza Ho
Si ZR < -1.96 ó si ZR > 1.96 Se rechaza Ho

Cálculos:
Decisión y Conclusión:
Como 1.789 esta entre –1.96 y 1.96, no se rechaza H0 y se concluye con un =0.05 que la mediana es de 2000 psi.

No hay comentarios:

Publicar un comentario