Practica Dirigida Unidad 4- Bondad de Ajuste Doc

download Practica Dirigida Unidad 4- Bondad de Ajuste Doc

of 5

Transcript of Practica Dirigida Unidad 4- Bondad de Ajuste Doc

  • PRCTICA DIRIGIDA DE ESTADISTICA II

    TEMA: Estadstica no Paramtrica: Experimentos multinomiales: Bondad de ajuste. _____________________________________________________________________________________ Instructivo: Los ejercicios que se presentan a continuacin se usarn en clase tomando algunos de

    ellos con fines de demostracin y los otros deben ser resueltos por los estudiantes y presentados en clase. Es necesario que impriman esta prctica para desarrollarla en clase.

    11-2 DESTREZAS Y CONCEPTOS BSICOS

    Conocimientos estadsticos y pensamiento crtico

    1. Bondad de ajuste. A qu nos referimos cuando decimos que hacemos una prueba de la "bondad de

    ajuste"?

    2. Prueba de cola derecha. Por qu la prueba de hiptesis para la bondad de ajuste siempre es una

    prueba de cola derecha?

    3. Frecuencias observadas y esperadas. Qu es una frecuencia observada? Qu es una frecuencia

    esperada?

    4. Pesos de estudiantes. Un investigador rene los pesos de 20 estudiantes varones elegidos al azar

    de cuatro clases diferentes, luego calcula el total de los pesos y los resume en la siguiente tabla

    (segn datos del National Health Examination Survey). Se pueden utilizar los mtodos de esta

    seccin para probar la aseveracin de que los pesos provienen de poblaciones con la misma media?

    Por qu?

    En los ejercicios 5 y 6, identifique los componentes de la prueba de hiptesis.

    5. Prueba para categoras igualmente probables. Las siguientes son las frecuencias observadas de

    tres categoras: 5,5, 20. Suponga que queremos utilizar un nivel de significancia de 0.05 para probar la

    aseveracin de que las tres categoras son igualmente probables.

    a. Cul es la hiptesis nula?

    b. Cul es la frecuencia esperada para cada una de las tres categoras?

    c. Cul es el valor del estadstico de prueba?

    d. Cul es el valor crtico?

    e. Qu concluye usted acerca de la aseveracin dada?

    6. Prueba para categoras con proporciones diferentes. Las siguientes son las frecuencias

    observadas para cuatro categoras: 5, 10, 10, 20. Suponga que queremos utilizar un nivel de

    significancia de 0.05 para probar la aseveracin de que las cuatro categoras tienen proporciones de

    0.20, 0.25, 0.25 y 0.30, respectivamente.

    a. Cul es la hiptesis nula?

    b. Cules son las frecuencias esperadas para las cuatro categoras?

    c. Cul es el valor del estadstico de prueba?

    d. Cul es el valor crtico?

  • e. Qu concluye usted acerca de la aseveracin dada?

    7. Prueba de balance de rueda de ruleta. El autor observ 500 giros de una rueda de ruleta en el

    Mirage Resort and Casino. (Para el sistema fiscal IRS: No es cierto que ahora un viaje a Las Vegas

    es deducible de impuestos?). Para cada giro, la bola puede detenerse en cualquiera de 38 ranuras

    diferentes que se supone son igualmente probables. Cuando se utiliz STATDISK para probar la

    aseveracin de que las ranuras son de hecho igualmente probables, se obtuvo el estadstico de

    prueba x2 = 38.232.

    a. Calcule el valor crtico suponiendo que el nivel de significancia es 0.10.

    b. STATDISK produjo un valor P de 0.41331, pero qu sabe usted acerca del valor P si slo debe

    utilizar la tabla A-4 junto con el estadstico de prueba dado de 38.232, que resulta de los 500 giros?

    c. Escriba una conclusin acerca de la aseveracin de que los 38 resultados son igualmente

    probables.

    8. Prueba de una mquina tragamonedas. El autor compr una mquina tragamonedas (Bally modelo

    809) y la prob jugando 1197 veces. Al probar la aseveracin de que los resultados observados

    coinciden con las frecuencias esperadas, se obtuvo el estadstico de prueba x2 = 8.185. Existen 10

    categoras de resultados diferentes, incluyendo no ganar, ganar el premio mayor, ganar con tres

    campanas, etctera.

    a. Calcule el valor crtico suponiendo que el nivel de significancia es de 0.05.

    b. Qu concluye usted acerca del valor P de la tabla A-4, si sabe que el estadstico de prueba es x2 =

    8.185 y que existen 10 categoras?

    c. Plantee una conclusin acerca de la aseveracin de que los resultados observados coinciden con

    las frecuencias esperadas. Parece que la mquina tragamonedas del autor funciona

    correctamente?

    9. Dado cargado. El autor taladr un hoyo en un dado, lo rellen con plomo y procedi a lanzarlo 200

    veces. Las siguientes son las frecuencias observadas para los resultados de 1,2, 3,4, 5 y 6,

    respectivamente: 27, 31, 42, 40, 28 y 32. Utilice un nivel de significancia de 0.05 para probar la

    aseveracin de que los resultados no son igualmente probables. Parece que el dado cargado se

    comporta de forma diferente que un dado legal?

    10. El neumtico desinflado y la clase perdida. Un cuento clsico se refiere a cuatro estudiantes que

    van juntos en un automvil y no llegan a un examen; como excusa. Dijeron al profesor que un

    neumtico se desinfl en el camino. En el examen de recuperacin, el profesor pidi a los estudiantes

    que identificaran el neumtico en particular que se desinfl. Si en realidad no tuvieron un neumtico

    desinflado, seran capaces de identificar el mismo neumtico? El autor pidi a otros 41 estudiantes

    que identificaran el neumtico que ellos seleccionaran. Los resultados estn listados en la siguiente

    tabla (excepto el de un estudiante que seleccion el neumtico de refaccin). Utilice un nivel de

    significancia de 0.05 para probar la aseveracin del autor de que los resultados se ajustan a una

    distribucin uniforme. Qu sugiere el resultado acerca de la capacidad de los cuatro estudiantes de

    seleccionar el mismo neumtico cuando en realidad su excusa fue una mentira?

    11. Muertes por choques de automviles. Se seleccionaron al azar muertes por choques de

    automviles y los resultados se incluyen en la siguiente tabla (segn datos del Insurance Institute for

    Highway Safety). Utilice un nivel de significancia de 0.05 para probar la aseveracin de que las

  • muertes por choques de automviles ocurren con la misma frecuencia en los diferentes das de la

    semana. Cmo se explicaran los resultados? Por qu parece haber un nmero excepcionalmente

    grande de muertes por choques de automviles los sbados?

    Segn datos del Insurance Institute for Highway Safety.

    12. Nacimientos. Se obtuvieron registros de nacimientos elegidos al azar; los resultados se presentan en

    la siguiente tabla (segn datos del National Vital Statistics Report, vol 49, nm. 1). Utilice un nivel de

    significancia de 0.05 para probar la razonable aseveracin de que los nacimientos ocurren con la

    misma frecuencia los diferentes das de la semana. Cmo se podran explicar las aparentes bajas

    frecuencias del sbado y del domingo?

    13. Muertes en motocicleta. Los datos de las muertes de conductores de motocicleta seleccionadas al

    azar se resumen en la siguiente tabla (segn datos del Insurance Institute of Highway Safety). Utilice

    un nivel de significancia de 0.05 para probar la aseveracin de que este tipo de decesos ocurren con

    igual frecuencia durante los diferentes meses. Cmo se podran explicar los resultados?

    14. Calificaciones y lugar para sentarse. Los estudiantes con calificacin "A" (o 10) tienden a sentarse

    en una zona particular del saln de clases? El autor registr los lugares de los estudiantes que

    recibieron calificaciones de "A", con estos resultados: 1" se sentaron al frente, 9 se sentaron en medio

    y 5 se sentaron en la parte de atrs del saln. Existe suficiente evidencia para sustentar la

    aseveracin de que los estudiantes de calificacin "A" no estn distribuidos de manera uniforme en la

    totalidad del saln? Si esto fuera as, significa que usted puede aumentar su probabilidad de obtener

    una A si se sienta al frente?

    15. Actrices ganadoras del scar. El autor reuni datos del mes de nacimiento de actrices ganadoras

    del scar. Utilice un nivel de significancia de 0.05 para probar la aseveracin de que las actrices

    ganadoras del scar nacen en los distintos meses con la misma frecuencia. Existe alguna razn por

    la que las actrices ganadoras del scar podran nacer con mayor frecuencia en ciertos meses que en

    otros?

    16. Actores ganadores del scar. El autor reuni datos del mes de nacimiento de actores ganadores del

    scar. Utilice un nivel de significancia de 0.05 para probar la aseveracin de que los actores

    ganadores del scar nacen en los distintos meses con la misma frecuencia. Compare los resultados

    con los del ejercicio 15.

    17. Novia de junio. Un organizador de banquetes para bodas selecciona al azar clientes de los ltimos

    aos y registra los meses en que se celebraron las recepciones. Los resultados se presentan abajo

  • (segn datos de The Amazing Almanac). Utilice un nivel de significancia de 0.05 para probar la

    aseveracin de que las bodas se realizan en los diferentes meses con la misma frecuencia. Los

    resultados sustentan o desmienten la creencia de que la mayora de las bodas se realizan en junio?

    18. Experimento de color de ojos. Un investigador desarroll un modelo terico para predecir el color de

    los ojos. Despus de examinar una muestra aleatoria de padres, predice el color de ojos de su primer

    hijo. La siguiente tabla lista el color de ojos de descendientes. Con base en su teora, el investigador

    predijo que el 87% de los descendientes tendran ojos cafs, que el 8% tendra ojos azules y que el

    5% tendra ojos verdes. Utilice un nivel de significancia de 0.05 para probar la aseveracin de que las

    frecuencias reales corresponden a la distribucin que predijo.

    19. Juegos de la Serie Mundial. El encabezado de USA Today "La serie de siete juegos desafa las

    probabilidades" se refera a la aseveracin de que una Serie Mundial de siete juegos ocurre con

    mayor frecuencia de lo esperado por el azar. A continuacin se indican los nmeros de juegos de

    series mundiales (se omiten dos que duraron ocho juegos) junto con la proporcin que se esperara si

    los equipos tuvieran la misma capacidad. Utilice un nivel de significancia de 0.05 para probar la

    aseveracin de que las frecuencias observadas coinciden con las proporciones tericas. Con base en

    los resultados, al parecer existe evidencia que sustente la aseveracin de que una Serie Mundial de

    siete juegos ocurre con mayor frecuencia de lo esperado?

    20. Experimento de gentica. Con base en los genotipos de los padres, se espera que sus

    descendientes tengan genotipos distribuidos de tal forma que el 25% tenga genotipos denotados por

    AA, que el 50% tenga genotipos denotados por Aa, y que el 25% tenga genotipos denotados por aa.

    Cuando se seleccionan 145 descendientes, se descubre que 20 de ellos tienen genotipos AA, 90

    tienen genotipos Aa y 35 tienen genotipos aa. Ponga a prueba la aseveracin de que las frecuencias

    observadas de los genotipos de los descendientes coinciden con la distribucin esperada del 25%

    para AA, 50% para Aa y 25% para aa. Utilice un nivel de significancia de 0.05.

    21. Dulces M&M. Mars Inc. asevera que sus dulces M&M clsicos se distribuyen con los siguientes

    porcentajes de color: 16% verdes, 20% anaranjados, 14% amarillos, 24% azules, 13% rojos y 13%

    cafs. Remtase al conjunto de datos 13 del apndice B y utilice los datos muestrales para probar la

    aseveracin de que la distribucin de color es como lo afirma Mars Inc. Utilice un nivel de significancia

    de 0.05.

    22. Medicin del pulso. Un ejemplo de esta seccin se bas en el principio de que cuando se miden

    ciertas cantidades, los ltimos dgitos tienden a estar distribuidos de manera uniforme, pero que si son

    estimados o reportados, los ltimos dgitos tienden a tener desproporcionadamente ms ceros o

    cincos. Remtase al conjunto de datos 1 del apndice B y utilice los ltimos dgitos de los pulsos de los

    80 hombres y mujeres. Estos pulsos se obtuvieron como parte de la National Health Examination

    Survey. Pruebe la aseveracin de que los ltimos dgitos de 0, 1, 2,..., 9 se presentan con la misma

    frecuencia. Con base en los dgitos observados, qu se infiere acerca del procedimiento utilizado

    para obtener los pulsos?

  • 23. Participacin en pruebas clnicas segn la raza. Se realiz un estudio para investigar la disparidad

    racial en pruebas clnicas de cncer. De los participantes seleccionados al azar, 644 eran caucsicos,

    23 eran hispanos, 69 eran afroestadounidenses, 14 eran asiticos o de las islas del pacfico, y 2 eran

    indgenas norteamericanos o nativos de Alaska. Las proporciones de estos grupos en la poblacin

    estadounidense son 0.757, 0.091, 0.108, 0.038 y 0.007, respectivamente. (Segn datos de

    "Participation in Clinical Trials", de Murthy, Krumholtz y Gross, Journal of the American Medical

    Association, vol. 291, nm. 22). Utilice un nivel de significancia de 0.05 para probarla aseveracin de

    que los participantes se ajustan a la distribucin de la poblacin estadounidense. Por qu es

    importante tener una representacin proporcional en este tipo de pruebas clnicas?

    24. Se ajustan los impactos de las bombas de la Segunda Guerra Mundial a una

    distribucin de Poisson? En el anlisis de los impactos por bombas V-1 en la Segunda Guerra

    Mundial, el sur de Londres se subdividi en regiones, cada una con una

    rea de 0.25 km2. En la seccin 5-5 presentamos un ejemplo e incluimos una tabla de

    frecuencias reales y las frecuencias esperadas de impactos con la distribucin de Poisson. Utilice los

    valores que se listan aqu y pruebe la aseveracin de que las frecuencias reales se ajustan a una

    distribucin de Poisson. Utilice un nivel de significancia de 0.05.

    25. Montos de cheques del autor y la ley de Benford. La figura 11-6b) ilustra las frecuencias

    observadas de los dgitos lderes de las cantidades de los ltimos 200 cheques que expidi el autor.

    Las frecuencias observadas de estos dgitos lderes se listas abajo. Con un nivel de significancia de

    0.05, pruebe la aseveracin de que provienen de una poblacin de dgitos lderes que cumple con la

    ley de Benford. (Consulte los primeros dos renglones de la tabla 11-1, incluidos en el problema del

    captulo).