PRUEBA DE KOLMOGOROV-SMIRNOV PARA
NÚMEROS ALEATORIOSIntegrantes:
•Quezada Ascencio Daniel•Naucapoma Acuña José
Introducción: Andréi Nikoláyevich Kolmogórov(Tambov, 25 de
abril de 1903 - Moscú, 20 de octubre de 1987) fue un matemático ruso que hizo progresos importantes en los campos de la teoría de la probabilidad y de la topología.
Iván Nikítich Smirnov ( 1881 - 25 de agosto de 1936) fue un líder comunista ruso, considerado viejo bolchevique por su afiliación partidaria previa a la Revolución de 1917.
En estadística, la prueba de Kolmogórov-Smirnov (también prueba K-S) es una prueba no paramétrica que se utiliza para determinar la bondad de ajuste de dos distribuciones de probabilidad entre sí.
Introducción:Las pruebas de Kolmogorov-Smirnov (K-S) esta dentro de las pruebas estadísticas no paramétricas y cumple con el requisito de normalidad y homogeneidad.
Las pruebas K-S nos permite decidir si una muestra de n observaciones corresponde a una distribución normal o difiere con esta, la cual es analizada por diversos parámetros, como son los estadísticos K-S, el nivel de significancia, el p-valor encontrado.
Los estadísticos de K-S, se hallan a partir de un tamaño de muestra n, la cual se le realiza su distribución de frecuencias. Estos estadísticos, son encontrados en cada intervalo del cuadro de distribución de frecuencias; se halla el valor absoluto de la resta entre la frecuencia observada relativa (FOR) acumulada con la frecuencia esperada relativa (FER) acumulada, y por último el máximo valor encontrado de estos valores en cada intervalo.
Se basa:La diferencia entre la FDA (Función de Distribución Acumulada) observada Sn(x) y la FDA esperada FX(x) debe ser pequeña. Sn(x) viene dada por:
Los símbolos D+ y D- son usados para denotar las desviaciones observadas máximas sobre y bajo la FDAesperada en una muestra de tamaño n:
D+ mide la desviación máxima cuando la FDA observada esta sobre la FDA esperada, y D- mide la desviación máxima cuando la FDA observada esta bajo la FDA esperada. Si los valores de D+ y D- son menores que D[α;n] entonces se dice que las observaciones provienen de la distribución respectiva con un nivel de significación de α.
La prueba K-S esta diseñada para distribuciones continuas, muestras pequeñas, y usas todas las observaciones sin hacer agrupaciones haciendo mejor uso de los datos que la chi-cuadrado.
Ejemplo 1: En este ejemplo se usa la prueba KS para examinar, bajo un nivel
de significancia de a=0.05, si un conjunto de datos representa números aleatorios (por ejemplo esta la distribución uniforme entre 0 y 1). Suponga que cinco datos son dados: 0.53, 0.35, 0.03, 0.94, y 0.22
Solución: Para la distribución Uniforme la fdp es: F(x)= 1/(b-a) a ≤ x ≤ b
Para este caso particular a=0 y b=1. Por lo tanto F(x)=x. Ahora se ordenan los valores en forma ascendente y se realizan los cálculos relativos.
La tabla siguiente resume los cálculos realizados:
De acuerdo a los cálculos, D = max( 0.27, 0.14 ) = 0.27. El valor crítico de KS de la tabla en el apéndice de tablas para un tamaño de 5 y un nivel de significancia de 0.05 es 0.565. Debido a que D es menor que este valor crítico, la hipótesis de que los datos dados pertenecen a una distribución Uniforme es aceptada.
Ejm2
Para realizar esta prueba se precisa de 5 pasos:El análisis con esta prueba se efectúa luego de encontrar la tabla de distribución de frecuencias de la muestra en estudio.
1. Formulación de las hipótesis: • H0: Hipótesis Nula o Hipótesis de Trabajo, esta es una
hipótesis de homogeneidad o de igualdad.• H1: Hipótesis Alternativa o Hipótesis del Investigador, esta
es una hipótesis de diferencias.2. Nivel de significancia:
• Nivel de significancia (α): Utilizando mayormente el valor de 5% (α =0.05).
3. Estadístico de prueba:• Valor estadístico calculado de la tabla de valores críticos de
Kolmogorov-Smirnov.4. Estimador K-S:
• Este estimador K-S es el máximo valor hallado en intervalo.5. Toma de decisión:
• Si se acepta la hipótesis o se rechaza para el modelo propuesto.
Ejemplo 2: En este ejemplo se usa la prueba KS para examinar, bajo un nivel
de significancia de a=0.05, si un conjunto de datos representa números aleatorios.
Se han simulado 100 observaciones de una máquina de llenado de gaseosas, con una media de 100 y desviación estándar de 0.35. Determinar si los datos siguen una distribución normal de acuerdo a la prueba de bondad de Kolmogorov-Smirnov.
Se plantean las hipótesis: H0: No hay evidencias suficientes, para decir que los datos no siguen una
distribución normal. H1: Existen evidencias suficientes, para decir que los datos no siguen una
distribución normal.
H0: No hay evidencias suficientes, para decir que los datos no siguen una distribución normal. (Se acepta)H1: Existen evidencias suficientes, para decir que los datos no siguen una distribución normal. (Se rechaza)
Ver tabla
Conclusión: • No hay evidencias suficientes, para decir que los datos no siguen
una distribución normal, ya que pueden existir otros modelos que aceptan esta hipótesis.
Gracias…
Top Related