Inferencia estadistica

download Inferencia estadistica

of 31

description

Matematicas

Transcript of Inferencia estadistica

  • Captulo 13

    Inferencia estadstica

    Como hemos comprobado en los ejemplos anteriores, conocer la media y la varianza de una

    caracterstica cuantitativa de una poblacin puede proporcionar informacin relevante sobre el

    comportamiento global de la poblacin. En el captulo anterior hemos visto cmo, conocien-

    do estos valores referentes a una poblacin completa, podemos predecir, con un cierto grado

    de probabilidad, el comportamiento de una muestra sucientemente grande. En esto consista

    bsicamente el primer problema que introdujimos en la pgina 57.

    Pero este caso no es, en absoluto, al que nos solemos enfrentar. No es fcil conocer el com-

    portamiento general de una poblacin completa (por motivos obvios: por su tamao, por la

    dicultad de poner de acuerdo a todos, por la premura de tiempo, etc) y aunque as sea, no

    est claro que el trabajo realizado para conocer el comportamiento global, que suele ser enorme,

    merezca la pena en comparacin con las conclusiones que pueden extraerse. Es decir, lo usu-

    al es tener informacin sobre lo que ocurre en una muestra aleatoria, y de ah es de donde

    pretendemos extraer informacin de lo que le ocurre a toda la poblacin (por ejemplo, con un

    sondeo electoral pretendemos conocer de antemano el candidato o la candidata que ganar las

    elecciones). Precisamente esto es lo que nos planteamos en el segundo problema de la pgina 57

    y es al que pretendemos dar respuesta en este captulo. De ah la palabra inferencia, que hacerreferencia al proceso por el que una consecuencia se deduce de sus causas.

    13.1. Estimacin puntual

    En lo que sigue y con la intencin de jar la notacin que utilizaremos, llamaremos X a

    una variable aleatoria que mide una caracterstica (cuantitativa) de una poblacin de tamao

    N cuya media y cuya desviacin tpica se denotarn por y , respectivamente (o por X y

    79

  • 80 CAPTULO 13. INFERENCIA ESTADSTICA

    X , slo si es imprescindible hacer mencin a la variable). Supondremos que hemos extrado una

    muestra aleatoria simple de tamao n y, en tal caso, denotaremos por x y s a su media y a su

    desviacin tpica, respectivamente. Vamos a ponerles nombre a estos valores.

    Denicin 13.1.1 Llamaremos parmetro (poblacional) a un valor numrico que describeuna caracterstica de la poblacin (su media , su varianza , etc.), y llamaremos estadstico(muestral) a un valor numrico que hace referencia a una caracterstica de la muestra (por

    ejemplo, x y s).

    Un estimador (poblacional) puntual es el estadstico que se usa para estimar un parmetro(poblacional). Por tanto, es una variable aleatoria en el muestreo que tiene su correspondiente

    distribucin muestral. Una estimacin puntual es el valor numrico que toma el estimadorpuntual para una muestra determinada.

    Diremos que un estimador es insesgado si su media coincide con el valor del parmetro quese va a estimar, y diremos que es eciente si su varianza es la mnima posible.

    Nota 5 Con el objeto de aclarar un poco la nocin de eciencia, hemos de hacer una breveprecisin. Es posible demostrar que existe una cota inferior (no negativa) para la varianza de

    cualquier estimador de un parmetro poblacional, es decir, esta varianza tiene que ser mayor o

    igual que cierto nmero. Esta propiedad recibe el nombre de acotacin de Frechet-Crmer-Rao.

    Por consiguiente, no puede haber un estimador de un parmetro poblacional con una varianza

    inferior a la que ya estipula esta acotacin. Pero s puede haber algunos que alcancen la igualdad

    y, por tanto, su varianza, sera la menor posible de entre todos los estimadores del parmetro

    poblacional. A aqullos que consiguen la igualdad en la acotacin de Frechet-Crmer-Rao se les

    denomina estimadores ecientes.

    Si conocemos la media x de una muestra y queremos hacer una estimacin puntual de la

    media poblacional , qu valor utilizaremos? No cabe la menor duda: para estimar la media

    poblacional utilizaremos la media muestral. Es decir, si tomamos una muestra aleatoria entre

    el alumnado de un instituto (que sea lo sucientemente grande) y resulta que arroja una media

    de estatura de x = 150 cm, qu valor podemos pensar como media de la estatura de todo el

    alumnado? Sin duda, la misma, y diremos que, aproximadamente, = 150 cm. Sea o no cierto,

    es el mejor valor con el que contamos para predecir el comportamiento poblacional. Ocurre

    lo mismo con la varianza y la desviacin tpica? Sorprendentemente, no: por razones que se

    justican puramente con clculos, la cuasivarianza muestral (que denotaremos por s^2) es mejor

    estimador de la varianza poblacional 2 que la propia varianza muestral s2 (y, coherentemente,

    la cuasidesviacin tpica muestral s^ es mejor estimador de la desviacin tpica poblacional

    que la propia desviacin tpica muestral s). Esto se debe a que la cuasivarianza muestral s^2

    es un estimador insesgado y eciente de la varianza poblacional 2 (no es objetivo de

    A. Roldn

  • 13.2. Estimacin por intervalos 81

    este curso hacer una demostracin de este hecho tan curioso). En denitiva, cuando el tamao

    muestral n es lo sucientemente grande, utilizaremos los siguientes estimadores de los parmetros

    que se indican en la siguiente tabla.

    Parmetro Estimador

    Media Media muestral x

    Varianza 2 Cuasivarianza muestral s^2

    Desviacin tpica Cuasidesviacin tpica muestra s^

    En vista de este hecho, algunos textos llaman directamente desviacin tpica muestral a lo que

    en este texto estamos llamando cuasidesviacin tpica muestral , porque es un estimador ms im-

    portante que la desviacin tpica muestral. Recordemos que estos dos valores estn relacionados

    mediante la igualdad

    s^2 =n

    n 1 s2; e igualmente; s^ = s

    rn

    n 1 :

    13.2. Estimacin por intervalos

    La estimacin puntual tiene, ciertamente, varios inconvenientes. El principal de todos es que

    no tenemos ninguna forma de saber el grado de abilidad de la propia estimacin, es decir,

    desconocemos el grado de aproximacin de a x. Adems, puede no tener mucho sentido si

    la variable considerada es continua. Por ello, es ms interesante considerar un nuevo tipo de

    estimacin, llamada estimacin por intervalos, que mide en cierta forma la probabilidad deque la media poblacional pertenezca a cierto intervalo que determinaremos. Precisamente, si

    lo pensamos, esto es lo que hemos hecho en el captulo anterior: a partir de conocimiento de y

    , nos hemos planteado la probabilidad de que la media muestral est en un intervalo dado de

    antemano. Esta probabilidad mide la abilidad de la armacin de que la media est en dicho

    intervalo. Intentamos a continuacin razonar de manera similar, siempre teniendo claro nuestros

    objetivos: a partir del conocimiento de los estadsticos (muestrales), pretendemos

    I dar un intervalo dentro del cual conamos en que est el parmetro (poblacional) estudiado(que se llamar intervalo de conanza),

    I y medir la probabilidad de que tal cosa ocurra (a esta probabilidad la llamaremos nivel deconanza).

    A. Roldn

  • 82 CAPTULO 13. INFERENCIA ESTADSTICA

    13.2.1. Intervalos caractersticos

    Sea X una variable aleatoria de media y sea p 2 [0; 1] un nmero entre cero y uno.Diremos que un intervalo I centrado en la media (es decir, I = ] k; + k[ si es abiertoo I = [ k; + k] si es cerrado) es un intervalo caracterstico de X correspondiente auna probabilidad p si la probabilidad de que la variable X tome valores en dicho intervalo esexactamente p.

    p (X 2 I) = p.Dicho de otra forma,8

  • 13.3. Intervalos de confianza 83

    donde k es un nmero real positivo que depende exclusivamente del valor de p, o de su comple-

    mentario = 1 p (que llamamos nivel de signicacin). Para que este intervalo correspondaa un nivel de conanza p = 1 , hemos de establecer la condicin:

    p = p (Z 2 ]k; k[) = p (k < Z < k) :z z

    p

    x

    y

    Z ,! N (0; 1)

    El nmero k, que depende tanto de p como de , se denomina valor crtico correspondienteal nivel de conanza p (o al nivel de signicacin ) y se denotar, en lo sucesivo, porz=2. Conviene entender esta notacin antes de continuar. Como se observa en el dibujo ??, sien el centro (alrededor de la media, que es cero) se agrupa una probabilidad p, las dos regiones

    laterales (que se denominan colas, una a la izquierda y otra a la derecha), que son simtricas(por tanto, iguales en probabilidad), acumulan una probabilidad (entre las dos) = 1 p y, siatendemos a una sola, cada una tiene una probabilidad =2. Por eso, el valor crtico k = z=2es el nmero real no negativo que verica que

    pZ > z=2

    =

    2(o equivalentemente, p

    z=2 < Z < z=2 = p = 1 ).

    z z

    p

    _a/2 a /2

    a_2

    x

    y

    Z ,! N (0; 1)

    Se deduce entonces de manera inmediata que el intervalo de conanza de una distribucinnormal estndar correspondiente a un nivel de conanza p (o a un nivel de signicacin = 1 p) es el intervalo (da igual abierto que cerrado)z=2 ; z=2 : (13.1)

    A. Roldn

  • 84 CAPTULO 13. INFERENCIA ESTADSTICA

    La siguiente tabla contiene los valores crticos ms utilizados en los ejercicios.

    p 90 % 92 % 93 % 95 % 96 % 97 % 98 % 99 % 9905 %p+12 = 1 2 0095 0096 00965 00975 0098 00985 0099 00995 009975z=2 1

    0645 1075 1081 1096 20055 2017 20325 20575 2081(13.2)

    Veamos en un ejercicio cmo calcular alguno de estos valores.

    Ejercicio 43 Calcula los valores crticos correspondientes a los niveles de conanza del 90%,95% y 99%.

    Solucin : Consideremos el nivel de conanza p = 90% = 009. Esto signica que en la regincentral se acumula una probabilidad de 009, por lo que en las dos regiones laterales hay unaprobabilidad de = 1 p = 001. Como las dos son iguales, en la de la derecha hay slo 0005 derea, por lo que el valor crtico correspondiente debe vericar:

    z z

    0'9

    _0'05 0'05

    0'05 0'05

    x

    y

    Z ,! N (0; 1)

    p (z0005 < Z < z0005) = 009 ,

    , p (Z > z0005) = 0005 ,

    , p (Z z0005) = 1 2= 1 0005 = 0095:

    Resulta entonces que el valor que hay que buscar en la tabla de la normal estndar es

    1 2=p+ 1

    2= 0095:

    Pero este valor no viene en la tabla, y buscamos los ms cercanos, que son:

    pZ 1064 = 009495; p Z 1065 = 009505:

    Resulta entonces que el valor crtico z0005 est entre 1064 y 1065, y tomamos un valor intermedio,por ejemplo, z0005 = 10645 (otros criterios toman z0005 = 1064 por defecto y z0005 = 1065 porexceso; en estos apuntes preferimos tomar un valor intermedio, que seguro comete un error

    absoluto menor).

    Razonamos ahora ms rpido porque hemos aprendido el proceso anterior. Tomemos el nivel

    de conanza p = 95% = 0095. Entonces el valor que se debe buscar en la tabla es

    p+ 1

    2=0095 + 12

    = 00975:

    A. Roldn

  • 13.3. Intervalos de confianza 85

    Al buscar este valor en la tabla lo encontramos de manera exacta (con un redondeo de cuatro

    cifras) siendo p (Z 1096) = 00975. Entonces z00025 = 1096:

    De la misma forma, si p = 0099, el valor a buscar en la tabla es (p + 1)=2 = 00995, que nogura, pero s descubrimos que p (Z 2057) = 009949 y p (Z 2058) = 009951. Tomando unvalor intermedio, z00005 = 20575.

    13.3.2. Intervalos de conanza correspondientes a una variable normal arbi-traria

    Supongamos ahora que una variable aleatoria X sigue una distribucin normal de media

    y desviacin tpica > 0, lo que denotamos por X ,! N (; ). Como sabemos, la variabletipicada Z = (X )= sigue una distribucin normal estndar. Fijemos un nivel de conanzap 2 ]0; 1[ y calculemos el nmero k > 0 para que el intervalo I = ] k; + k[ sea un intervalode conanza de X correspondiente al nivel de conanza p, es decir, al nivel de signicacin

    = 1 p. Para ello se ha de cumplir la siguiente condicin, que se transforma tipicando lavariable:

    1 = p = p ( k < X < + k) = p (k < X < k) = pk 0 (conocida o no), de la que extraemos una muestra aleatoriade tamao n y media x. Si la poblacin de partida es normal o si el tamao de la muestra es

    A. Roldn

  • 88 CAPTULO 13. INFERENCIA ESTADSTICA

    n 30, entonces el intervalo de conanza de la media poblacional con un nivel de conanzap = 1 2 ]0; 1[ es exactamente

    x z=2 pn; x+ z=2

    pn

    ;

    y si la desviacin tpica es desconocida, se puede reemplazar por los valores que tomen los

    estimadores s^ s. x z=2

    spn; x+ z=2

    spn

    :

    Es importante aprender a interpretar lo que signica el intervalo anterior. La cuestin es

    que queremos delimitar un intervalo en el que probablemente se encuentre la media poblacional

    , que es desconocida en principio. Para ello extraemos una muestra aleatoria sucientemente

    grande (si la poblacin es pequea, sta se entiende con reemplazamiento) y con su media x y su

    desviacin tpica s (si es desconocida) calculamos el intervalo anterior. Y al nivel de conanza

    p que hayamos seleccionado, estimamos que la media poblacional pertenece a dicho intervalo.

    Nota 6 No es el objetivo de este curso indagar con mayor profundidad en la forma de considerarlos intervalos de conanza. Con lo ya expuesto, nos parece suciente. Pero en honor a la verdad,

    es conveniente hacer una breve precisin. Cuando la desviacin tpica poblacional, , es conocida,

    el intervalo que se utiliza es el ya comentado:x z=2

    pn; x+ z=2

    pn

    :

    Pero si no es conocida, en la prctica pueden utilizarse intervalos de conanza ms ables que

    el anterior, como es el siguiente:x t=2

    spn 1 ; x+ t=2

    spn 1

    :

    Este intervalo hace uso de la desviacin tpica muestral s, pero cambia el tamao muestral n

    por su anterior n 1 (como le ocurre a la cuasidesviacin tpica), y no utiliza un valor crticoasociado a la distribucin normal, z=2, sino un valor crtico t=2 asociado a una distribucin

    conocida como t de Student (que es muy parecida a la normal).

    Error mximo admisible

    La estimacin de la media poblacional por un intervalo de conanza describe perfectamente

    nuestra imposibilidad de determinar exactamente (salvo que recurrisemos a la poblacin al

    completo), y al nivel de conanza que se ja, cualquier valor del intervalo de conanza puede

    A. Roldn

  • 13.3. Intervalos de confianza 89

    ser razonable para convertirse en la media. Esta diferencia entre el valor exacto (que es descono-

    cido) y el aproximado (la mejor estimacin puntual posible es x) se denomina error (absoluto)cometido por la estimacin. Lo nico que sabemos entre ambos valores es que

    j x j z=2 pn;

    por lo que a esta cota mxima se la denomina error mximo cometido por la estimacin de lamedia:

    E = z=2 pn

    Evidentemente, si es desconocida, se sustituir por su correspondiente estimador: s^ s. De

    esta relacin, es sencillo despejar cualquier trmino.

    En muchas ocasiones, el tamao muestral que se desea utilizar no est jado de antemano,

    sino que nos podemos plantear utilizar uno u otro segn el grado de aproximacin que queramos.

    Cuanto mayor sea n, menor ser la amplitud del intervalo de conanza. Por tanto, si queremos

    un grado de precisin concreto en el intervalo, debemos jar una cota superior para el error

    que deseamos cometer, es decir, E E0. A valor lmite E0 se le denomina error mximoadmisible, y se debe conocer a priori. En tal caso, la pregunta es: cul es el mnimo tamaomuestral n que se debe tomar para no sobrepasar este error mximo admisible? La respuesta es

    sencilla:

    z=2 pn= E E0 , z=2 E0

    pn , z=2

    E0 pn ,

    , n z=2 E0

    2: (13.3)

    El valor del segundo miembro no suele ser entero, por lo que consideraremos el redondeo porexceso al siguiente nmero natural, es decir, si obtenemos que n 81016, tomaremos comotamao mnimo muestral el valor n = 82 (no n = 81!). Por supuesto, por encima de n = 82,

    tambin est garantizado que el error que se cometer no sobrepasar el error mximo admisible.

    Nota 7 No se debe confundir el error mximo cometido con la amplitud del intervalo de con-anza. Esta amplitud es exactamente el doble del error mximo posible. En los ejercicios, es

    fcil equivocarse si no se presta atencin.

    Nota 8 En ocasiones, lo que se nos proporciona es el intervalo de conanza, para despuspreguntarnos algn dato de los que se nos suele dar (como es o el valor crtico z=2 para

    despus deducir el nivel de conanza). Cuando esto ocurre, la media muestral x es exactamente

    la media aritmtica entre los extremos del intervalo.

    I:C: = ]a; b[ , x = a+ b2:

    A. Roldn

  • 90 CAPTULO 13. INFERENCIA ESTADSTICA

    Por ejemplo, si el intervalo de conanza para la media poblacional ha resultado ser ]2304; 2809[,entonces

    x =2304 + 2809

    2= 26015:

    Despus es usual utilizar la expresin

    E = z=2 pn=b a2

    para calcular algn otro dato desconocido.

    Ejercicios variados

    Ejercicio 44 Se probaron 10 automviles escogidos al azar de una misma marca y modelo, porconductores con la misma forma de conducir y en carreteras similares. Se obtuvo que el consumo

    medio de gasolina, en litros, por cada 100 km, fue de 5. Estudios previos indican que el consumo

    de gasolina tiene una distribucin normal de 2 litros de desviacin. Determine un intervalo de

    conanza, al 95%, para la media del consumo de gasolina de estos automviles.

    Solucin : Sea X la variable aleatoria que mide el consumo de uno de esos automviles elegido

    al azar. En este caso, el tamao de la muestra es n = 10, que no es sucientemente grande.

    Pero como la poblacin de partida ya es normal, podemos aplicar lo anterior a cualquier tamao

    muestral. Segn los datos de que disponemos, X ,! N (; = 2), siendo la media desconocida.Se ha tomado una muestra de n = 10 individuos, y se ha obtenido un consumo medio de x = 5 li.

    Entonces, al 95% de conanza (con valor crtico z=2 = 1096) obtenemos el siguiente intervalode conanza para la media :

    I:C: =

    x z=2

    pn

    =

    5 1096 2p

    10

    =5 1024 3076; 6024 :

    As, el consumo medio de este tipo de automviles est entre 3076 y 6024 litros, al 95% deconanza.

    Ejercicio 45 La duracin de las llamadas de telfono en una ocina comercial sigue una dis-tribucin normal con desviacin tpica de 10 segundos. Se hace una encuesta entre 50 llamadas

    y la media de duracin obtenida en esa muestra es de 35 segundos. Calcula un intervalo de

    conanza al 99% para la duracin media de las llamadas.

    Solucin : Los datos de que disponemos nos dicen que = 10 seg, n = 50 y x = 35 seg. Para

    z=2 = 20575 (correspondiente al 99%), el intervalo de conanza es:

    I:C: =

    x z=2

    pn

    =

    35 20575 10p

    50

    =35 3064 31036; 38064 :

    A. Roldn

  • 13.3. Intervalos de confianza 91

    Ejercicio 46 La desviacin tpica del nmero de horas diarias que duermen los alumnos de unacierta Universidad es de 3 h. Se considera una muestra aleatoria de 40 estudiantes, que revelan

    una media de sueo de 7 h. Halla un intervalo de conanza del 95% para la media de horas de

    sueo de los estudiantes de esa Universidad.

    Solucin : Ahora sabemos que = 3 h, n = 40 y x = 7 h. Tomando z=2 = 1096 (correspondienteal 95%), el intervalo de conanza para la media de las horas de sueo de los estudiantes es:

    I:C: =

    x z=2

    pn

    =

    7 1096 3p

    40

    =7 0093 6007; 7093 :

    Ejercicio 47 La altura media de una muestra tomada al azar de 121 recin nacidos nios esde 51 cm, y la desviacin tpica es de 55 cm. Calcula el intervalo de conanza aproximado para

    la media poblacional con un nivel de conanza del 95%.

    Solucin : Los datos que nos proporciona el enunciado son x = 51 cm, n = 121 y s = 505 cm.Entonces el intervalo de conanza, utilizando la desviacin tpica muestral s, es:

    I:C: =

    x z=2

    spn

    =

    51 1096 5

    05p121

    =51 0098 50002; 51098 :

    Ejercicio 48 El peso medio de una muestra de 64 jvenes de 18 aos ha sido de 70 kg. Sabiendoque los pesos de los jvenes de 18 aos se distribuyen con una desviacin tpica de 12 kg,

    encuentra el intervalo de conanza para la media de los pesos de la poblacin de jvenes de 18

    aos, con un nivel de conanza de 95%.

    Solucin : Los datos que tenemos son: n = 64, x = 70 kg y = 12 kg. Al nivel de conanza del

    95%, con valor crtico asociado z=2 = 1096, tenemos el intervalo de conanza:

    I:C: =

    x z=2

    spn

    =

    70 1096 12p

    64

    =70 2094 67006; 72094 :

    Ejercicio 49 Una muestra aleatoria de 100 alumnos que se presentan a unas pruebas de Selec-tividad revela que la media de edad es de 181 aos. Halla un intervalo de conanza del 90% para

    la edad media de todos los estudiantes que se presentan a la pruebas sabiendo que la desviacin

    tpica de la poblacin es de 04.

    Solucin : Como en casi todos los ejercicios, se nos proporcionan los datos n = 100, x = 1801aos y = 004 aos. As, el intervalo de conanza solucitado es:

    I:C: =

    x z=2

    spn

    =

    1801 10645 0

    04p100

    =1801 000658 18003; 18017 :

    A. Roldn

  • 92 CAPTULO 13. INFERENCIA ESTADSTICA

    Ejercicios de las pruebas de Selectividad

    Ejercicio 50 (Selectividad 2005) En una poblacin, una variable aleatoria sigue una leyNormal de media desconocida y desviacin tpica 3.

    (a) A partir de una muestra de tamao 30 se ha obtenido una media muestral igual a 7. Halleun intervalo de conanza, al 96%, para la media de la poblacin.

    (b) Qu tamao mnimo debe tener la muestra con la cual se estime la media, con un nivel deconanza del 99% y un error mximo admisible de 2?

    Solucin : La poblacin tiene una desviacin tpica = 3, la muestra es de tamao n = 30 y la

    media muestral es x = 7. Al nivel de conanza del 96% (con nivel crtico asociado z=2 = 20055),el intervalo de conanza para la media poblacional es

    I:C: =

    x z=2

    pn

    =

    7 20055 3p

    30

    =7 10126 50874; 80126 :

    Para que, al nivel de conanza del 99% (z=2 = 20575), el error mximo admisible sea 2, eltamao muestral debe ser, al menos, de:

    n z=2

    E

    2=

    20575 32

    2= 140919 15:

    Ejercicio 51 (Selectividad 2005) En una poblacin una variable aleatoria sigue una ley Nor-mal de media desconocida y desviacin tpica 2.

    (a) Observada una muestra de tamao 400, tomada al azar, se ha obtenido una media muestraligual a 50. Calcule un intervalo, con el 97% de conanza, para la media de la poblacin.

    (b) Con el mismo nivel de conanza, qu tamao mnimo debe tener la muestra para que laamplitud del intervalo que se obtenga sea, como mximo, 1?

    Solucin : Sea X la variable aleatoria que sigue una ley N (; = 2). Tomada una muestra detamao n = 400, la media muestral es x = 50. Entonces para el nivel de conanza del 97% (con

    valor crtico asociado z=2 = 2017), el intervalo de conanza para la media poblacional es:

    I:C: =

    x z=2

    pn

    =

    50 2017 2p

    400

    =50 00217 490783; 500217 :

    Para que la amplitud del intervalo de conanza sea A = 1, el error mximo cometido en la

    estimacin debe ser la mitad, es decir, E = 005. Entonces habra que tomar una muestra detamao:

    n z=2

    E

    2=

    2017 2005

    2= 75034 76:

    A. Roldn

  • 13.3. Intervalos de confianza 93

    Ejercicio 52 (Selectividad 2005) La duracin de un viaje entre dos ciudades es una variablealeatoria Normal con desviacin tpica 0.25 horas. Cronometrados 30 viajes entre estas ciudades,

    se obtiene una media muestral de 3.2 horas.

    (a) Halle un intervalo de conanza, al 97%, para la media de la duracin de los viajes entreambas ciudades.

    (b) Cul es el error mximo cometido con dicha estimacin?

    Solucin : Con los datos que tenemos, = 0025 h, n = 30 y x = 302 h, el intervalo de conanzabuscado es:

    I:C: =

    x z=2

    pn

    =

    302 2017 0

    025p30

    =302 001 301; 303 :

    Con dicha estimacin, el error mximo cometido es la mitad de la amplitud del intervalo de

    conanza, es decir, E = 001 h.

    Ejercicio 53 (Selectividad 2005) La estatura de los soldados de un cuartel sigue una dis-tribucin Normal con desviacin tpica 12 cm.

    (a) Indique la distribucin que sigue la media de la estatura de las muestras de soldados de esecuartel, de tamao 81.

    (b) Si se desea estimar la estatura media de los soldados de ese cuartel de forma que el error nosobrepase los 3 cm, cuntos soldados debern escogerse para formar parte de la muestra

    si se utiliza un nivel de conanza del 97%?

    Solucin : SeaX la variable aleatoria que mide la estatura de un soldado elegido al azar. Sebemos

    que sigue una ley normal de desviacin tpica = 12 cm. Entonces, si X81 denota la variable

    aleatoria que mide la estatura media de 81 soldados tomados al azar, el teorema central del

    lmite 12.2.1 nos asegura que X81 sigue, aproximadamente, una distribucin normal de la misma

    media que X y desviacin tpica s = =pn = 12=

    p81 = 4=3 cm. As, X81 ,! N

    ; 43

    .

    Por otro lado, para cometer un error inferior a 3 cm, se ha de tomar en la muestra, al menos:

    n z=2

    E

    2=

    2017 123

    2 75034 76 soldados.

    A. Roldn

  • 94 CAPTULO 13. INFERENCIA ESTADSTICA

    Ejercicio 54 (Selectividad 2005) El ndice de resistencia a la rotura, expresado en kg, de undeterminado tipo de cuerda sigue una distribucin Normal con desviacin tpica 15.6 kg. Con

    una muestra de 5 de estas cuerdas, seleccionadas al azar, se obtuvieron los siguientes ndices:

    280; 240; 270; 285; 270:

    (a) Obtenga un intervalo de conanza para la media del ndice de resistencia a la rotura de estetipo de cuerdas, utilizando un nivel de conanza del 95%.

    (b) Si, con el mismo nivel de conanza, se desea obtener un error mximo en la estimacin dela media de 5 kg, ser suciente con elegir una muestra de 30 cuerdas?

    Solucin : La desviacin tpica poblacional es = 1506 kg, por lo que no hace falta calcular ladesviacin tpica muestral. Pero s necesitamos la media muestral, que es:

    x =280 + 240 + 270 + 285 + 270

    5= 269 kg:

    Obsrvese que n = 5, por lo que la muestra no es sucientemente grande. Pero como la poblacin

    de partida sigue una ley normal, cualquier media muestral sigue tambin una distribucin nor-

    mal, y as es posible utilizar el intervalo de conanza:

    I:C: =

    x z=2

    pn

    =

    269 1096 15

    06p5

    =269 130674 2550326; 2820674 :

    Para cometer un error mximo de E = 5 kg, sera necesario tomar una muestra aleatoria de:

    n z=2

    E

    2=

    1096 1506

    5

    2 370396 38 cuerdas,

    por lo que no sera suciente con una muestra de 30 cuerdas.

    Ejercicio 55 (Selectividad 2005) La longitud de los tornillos fabricados por una mquinasigue una ley Normal con desviacin tpica 0.1 cm. Se ha seleccionado una muestra aleatoria

    y, con una conanza del 95%, se ha construido un intervalo, para la media poblacional, cuya

    amplitud es 0.0784 cm.

    (a) Cul ha sido el tamao de la muestra seleccionada?

    (b) Determine el intervalo de conanza, si en la muestra seleccionada se ha obtenido una lon-gitud media de 1.75 cm.

    Solucin : Sabemos que = 001 cm, p = 0095 (z=2 = 1096) y A = 000784 cm. Entonces el errormximo cometido es la mitad de la amplitud, E = 000392, por lo que el nmero el tamao de lamuestra seleccionada ha sido:

    n =z=2

    E

    2=

    1096 001000392

    2= 25 tornillos.

    A. Roldn

  • 13.3. Intervalos de confianza 95

    Obsrvese que la muestra no es grande, pero la longitud de los tornillos ya sigue una ley normal,

    por lo que es adecuado utilizar la frmula anterior. Por otro lado, si la media muestral es

    x = 1075 cm, el intervalo de conanza es:

    I:C: = ] x E [ = 1075 000392 = 107108; 107892 :Ejercicio 56 (Selectividad 2005) Se supone que la puntuacin obtenida por cada uno de lostiradores participantes en la sede de Gdor de los Juegos Mediterrneos Almera 2005, es una

    variable aleatoria que sigue una distribucin Normal con desviacin tpica 6 puntos. Se toma

    una muestra aleatoria de tamao 36 que da una media de 35 puntos.

    (a) Obtenga un intervalo, con un 95% de conanza, para la puntuacin media del total detiradores.

    (b) Calcule el tamao mnimo de la muestra que se ha de tomar para estimar la puntuacinmedia del total de tiradores, con un error inferior a 1 punto y con un nivel de conanza

    del 99%.

    Solucin : Como = 6, n = 36 y x = 35, al nivel de conanza del 95%, el intervalo para la

    media poblacional es:

    I:C: =

    x z=2

    pn

    =

    35 1096 6p

    36

    =35 1096 33004; 36096 :

    Para que el error fuese inferior a un punto, al 99%, habra que tomar una muestra de, al menos:

    n z=2

    E

    2=

    20575 61

    2= 23807 239 participantes.

    Ejercicio 57 (Selectividad 2005) El peso de los cerdos de una granja sigue una ley Normalcon desviacin tpica 18 kg.

    (a) Determine el tamao mnimo de una muestra para obtener un intervalo de conanza, parala media de la poblacin, de amplitud 5 kg con un nivel de conanza del 95%.

    (b) Si la media de los pesos de los cerdos de la granja fuera 92 kg, cul sera la probabilidadde que el peso medio de una muestra de 100 cerdos estuviese entre 88 y 92 kg?

    Solucin : Sabemos que = 18 kg y que la amplitud del intervalo de conanza, al 95%, es de

    A = 5 kg. Esto signica que el error mximo cometido en el intervalo es la mitad, E = 205 kg,y el tamao mnimo muestral que ha de tomarse para que esto ocurra es:

    n z=2

    E

    2=

    1096 18205

    2= 199015 200 cerdos.

    A. Roldn

  • 96 CAPTULO 13. INFERENCIA ESTADSTICA

    Si la media poblacional es = 92 kg, la variable aleatoria que mide la media de pesos de una

    muestra de n = 100 cerdos seguira una distribucin normal:

    X100 ,! N;

    pn

    = N 92; 108 ) Z = X100 92

    108,! N (0; 1) ;

    y entonces la probabilidad solicitada es:

    p88 X100 92

    = p

    88 92108

    X100 92108

    92 92108

    = p

    2022 Z 0 == p

    0 Z 2022 = p Z 2022 p (Z 0) = 009868 005 =

    = 004868:

    Ejercicio 58 (Selectividad 2006) El gasto anual, en videojuegos, de los jvenes de una ciu-dad sigue una ley Normal de media desconocida y desviacin tpica 18 euros. Elegida al azar,

    una muestra de 144 jvenes se ha obtenido un gasto medio de 120 euros.

    a) Indique la distribucin de las medias de las muestras de tamao 144.

    b) Determine un intervalo de conanza, al 99 %, para el gasto medio en videojuegos de losjvenes de esa ciudad.

    c) Qu tamao muestral mnimo deberamos tomar para, con la misma conanza, obtener unerror menor que 109?

    Solucin : Los datos que tenemos son n = 144, = 18 y x = 120 e. La distribucin de las

    medias muestrales de tamao 144 es, segn el teorema 12.3.1,

    X144 ,! N;

    pn

    N

    x;18

    12

    = N 120; 105 :

    Para un nivel de conanza p = 0099, tenemos el nivel crtico

    2=1 + p

    2= 00995 ) z=2 = 20575;

    de donde el intervalo de conanza para el gasto medio, redondeando a los cntimos, es (segn

    el teorema 13.3.2)

    I:C: =

    x z=2

    pn

    =

    120 2057518

    12

    =120 308625

    116014; 123086 :A. Roldn

  • 13.3. Intervalos de confianza 97

    Finalmente, si queremos que el error sea menor o igual que 1090 e, segn la desigualdad(13.3), debemos tomar un tamao no menor de:

    109 E = z=2pn

    ) n z=2

    E

    2=

    20575 18109

    2 59501:

    As, debemos elegir una muestra de, al menos, 596 jvenes.

    Ejercicio 59 (Selectividad 2006) a) Los valores:

    52; 61; 58; 49; 53; 60; 68; 50; 53;

    constituyen una muestra aleatoria de una variable aleatoria Normal, con desviacin tpi-

    ca 6. Obtenga un intervalo de conanza para la media de la poblacin, con un nivel de

    conanza del 92 %.

    b) Se desea estimar la media poblacional de otra variable aleatoria Normal, con varianza 49,mediante la media de una muestra aleatoria. Obtenga el tamao mnimo de la muestra

    para que el error mximo de la estimacin, mediante un intervalo de conanza al 97 %,

    sea menor o igual que 2.

    Solucin : Como la variable de partida sigue una distribucin normal, entonces cualquier media

    muestral sigue una distribucin normal. En particular, sabemos que x = 56 para la muestra

    considerada, siendo de tamao n = 9. Como = 6, el intervalo de conanza para la media de

    la poblacin es

    I:C: =

    x z=2

    pn

    =

    56 1075 6p

    9

    =56 305 = 5205; 5905 :

    Si para otra variable se tiene que 2 = 49 (cuidado: = 7), y queremos un error menor o

    igual que 2, debemos tomar una muestra de tamao, al menos,

    n z=2

    E

    2=

    2017 72

    2 570684;

    por lo que tomaremos una muestra de tamao, al menos, 58.

    Ejercicio 60 (Selectividad 2006) Se han tomado las tallas de 16 bebs, elegidos al azar, deentre los nacidos en un cierto hospital, y se han obtenido los siguientes resultados, en centmet-

    ros:

    51; 50; 53; 48; 49; 50; 51; 48; 50; 51; 50; 47; 51; 51; 49; 51:

    La talla de los bebs sigue una ley Normal de desviacin tpica 2 centmetros y media desconocida.

    a) Cul es la distribucin de las medias de las muestras de tamao 16?

    A. Roldn

  • 98 CAPTULO 13. INFERENCIA ESTADSTICA

    b) Determine un intervalo de conanza, al 97%, para la media poblacional.

    Solucin : Sabemos que la variable aleatoria

    X = Talla de cada beb ,! N (; 2)

    sigue una distribucin normal, por lo que cualquier variable que mida la distribucin de las

    medias muestrales de cualquier tamao tambin es normal. En particular, las medias muestrales

    de tamao n = 16 sigue una distribucin

    X16 ,! N;Xpn

    N

    x;2

    4

    = N 50; 005 :

    Por otro lado, al nivel de conanza p = 97 %, el valor crtico correspondiente es z=2 = 2017,por lo que el intervalo de conanza solicitado es

    I:C: =

    x z=2

    Xpn

    =

    50 2017 1

    2

    4809; 5101 :

    Ejercicio 61 (Selectividad 2006) Una variable aleatoria sigue una ley Normal con mediadesconocida y desviacin tpica 24. Se quiere estimar la media poblacional, con un nivel de

    conanza del 93%, para lo que se toman dos muestras de distintos tamaos.

    a) Si una de las muestras tiene tamao 16 y su media es 103, cul es el intervalo de conanzacorrespondiente?

    b) Si con la otra muestra el intervalo de conanza es (90776; 110224), cul es la media muestral?Cul es el tamao de la muestra?

    Solucin : Sea X la variable aleatoria del problema, de la que sabemos que X ,! N (; = 204),siendo la media desconocida. Para un nivel de conanza p = 0093, el valor crtico corres-pondiente es z=2 = 1081. Si tomamos una muestra de tamao n = 16 y media x = 1003, elcorrespondiente intervalo de conanza es:

    I:C: =

    x z=2

    pn

    = I:C: =

    1003 1081 2

    044

    =1003 10086 =

    =90214; 110386

    :

    Si ahora el intervalo de conanza es ] 90776; 110224 [, la media de la muestra es

    x =90776 + 110224

    2= 1005:

    A. Roldn

  • 13.3. Intervalos de confianza 99

    As, el error admitido es E = 110224 1005 = 00724, y el tamao de la muestra es

    n =z=2

    E

    2=

    1081 20400724

    2= 62 = 36:

    Obsrvese que se obtiene el valor exacto de 36 individuos en la muestra.

    13.3.4. Intervalo de conanza para la suma

    Intentamos resolver ahora el mismo problema anterior pero utilizando la distribucin de las

    sumas muestrales, . Por ejemplo, pretendemos estudiar el peso de los cincuenta pasajeros que se

    suben a un autobs, para estudiar el sistema de fuerzas que acta el mismo y su comportamiento

    en caso de accidente. Para ello, no nos interesa la media del peso de los pasajeros, sino la suma

    de los cincuenta pasajeros (de toda la poblacin) que pueden subirse al autobs. Pero como

    no tenemos acceso al peso de toda la poblacin para estimar cunto pueden pesar cincuenta

    personas a la vez, nos vemos obligados a hacer un estudio utilizando muestras aleatorias.

    En tal caso, sea ahora X una variable aleatoria que mide una caracterstica de una poblacin

    de media (por supuesto, tambin desconocida) y desviacin tpica > 0. Como vimos en el

    teorema 12.3.2, la distribucin de las sumas muestrales Tn de tamao n, cuando la poblacin

    de partida es normal o cuando n 30, se aproxima a una normal

    Tn Nn ; pn :

    Por tanto, jado un nivel de conanza p, el intervalo de conanza para Tn correspondiente al

    nivel p esTn z=2 Tn ; Tn + z=2 Tn

    =

    n z=2

    pn ; n + z=2

    pn

    ;

    y como la media es desconocida, se utilizar la estimacin puntual correspondiente a la muestra,

    que es la media x.

    Teorema 13.3.3 Consideremos una poblacin (no necesariamente normal) de media desco-nocida y desviacin tpica > 0 (conocida o no), de la que extraemos una muestra aleatoriade tamao n y media x. Si la poblacin de partida es normal o si el tamao de la muestra es

    n 30, entonces el intervalo de conanza de la suma de n elementos con un nivel de conanzap = 1 2 ]0; 1[ es exactamente

    n x z=2 pn ; n x+ z=2

    pn

    ;

    y si la desviacin tpica es desconocida, se puede reemplazar por los valores que tomen los

    estimadores s^ s. n x z=2 s

    pn ; n x+ z=2 s

    pn

    :

    A. Roldn

  • 100 CAPTULO 13. INFERENCIA ESTADSTICA

    En este caso, el mximo error admisible cometido al nivel de conanza p es

    E = z=2 pn;

    y se razona exactamente como en el caso anterior.

    Ejercicio 62 El peso de los cerdos de una granja se distribuye segn una normal con desviacintpica de 10 kg. Tomada una muestra al azar de 35 de ellos para transportarlos en un camin, el

    peso medio de los mismos es de 140 kg. Calcula un intervalo de conanza al 8% de signicacin

    en el que se mover el peso de 35 cerdos de la granja, tomados al azar para otro transporte.

    Solucin : Sea X la variable que mide el peso de cada cerdo de la granja. Segn los datos,

    X ,! N (; = 10 kg), siendo la media desconocida. Tomamos una muestra sucientementegrande (de tamao n = 35 30) y resulta que el peso medio de los cerdos de la muestra esx = 140 kg. Entonces, al nivel de conanza del 92%, el peso de 35 cerdos de la granja se mueve

    en el intervalo:

    I:C: =

    n x z=2

    pn

    =

    35 140 1075 10

    p35

    =

    =

    4900 103053

    =479605; 5003053

    :

    Este peso ha de ser tenido en cuenta, por ejemplo, a la hora de su transporte.

    13.3.5. Intervalo de conanza para la diferencia de medias

    Repitiendo el mismo argumento, si deseamos determinar un intervalo de conanza para la

    diferencia de medias 1 2 de dos poblaciones, tomaremos muestras sucientemente grandes,y la variable en el muestreo que mide la diferencia de medias muestrales, Y = X1 X2, sedistribuye, segn el teorema 12.3.3, mediante una normal

    n1; n2 30; Y N0@ 1 2 ;

    s21n1+22n2

    1A :Entonces el intervalo de conanza para la media de Y , al nivel de conanza p, es

    Tn z=2 Tn ; Tn + z=2 Tn=

    =

    35 1 2 z=2 s21n1+22n2; 1 2 + z=2

    s21n1+22n2

    24Y estimamos las medias 1 y 2 en el intervalo anterior con las medias muestrales x1 y x2.

    A. Roldn

  • 13.3. Intervalos de confianza 101

    Teorema 13.3.4 Consideremos dos poblaciones (no necesariamente normales) de medias 1y 2 (desconocidas) y desviaciones tpicas 1; 2 > 0 (conocidas o no), respectivamente, delas que extraemos sendas muestras aleatorias de tamaos n1 y n2 y medias respectivas x1 y

    x2. Si las poblaciones de partida son normales o si el tamao de las muestras es n1; n2 30,entonces el intervalo de conanza de la diferencia de medias 1 2 con un nivel de conanzap = 1 2 ]0; 1[ es, exactamente,35 x1 x2 z=2

    s21n1+22n2

    ; x1 x2 + z=2 s21n1+22n2

    24 ;y si la desviaciones tpicas 1 y 2 son desconocidas, se puede reemplazar por los valores que

    tomen los estimadores s^1 y s^2 o bien s1 y s2.35 x1 x2 z=2 ss21n1+s22n2

    ; x1 x2 + z=2 ss21n1+s22n2

    24 :El mximo error admisible que se comete con esta estimacin es

    E = z=2 s21n1+22n2

    al nivel de signicacin .

    Ejercicio 63 En un estudio sobre hbitos de alimentacin en murcilagos, se sabe que la dis-tancia que recorren volando en una pasada en busca de alimento sigue una distribucin normal

    tanto en los machos como en las hembras. Las desviaciones tpicas poblacionales son 80 y 75

    metros, respectivamente. Con el n de estimar la diferencia de medias de distancias recorri-

    das, se toma una muestra formada por 40 machos y 35 hembras, y se determinan las medias

    muestrales, que son, respectivamente, 230 y 140 metros. Hallar un intervalo de conanza para

    la diferencia de medias recorridas poblacionales al nivel del 95%.

    Solucin : Sean X1 y X2 las variables aleatorias que miden las distancias recorridas por los

    murcilagos machos y por las hembras, respectivamente, en una pasada. Segn los datos de

    que disponemos, X1 ,! N (1; 1 = 80 m) y X2 ,! N (2; 2 = 75 m), siendo las medias 1y 2 desconocidas. Para estimar la diferencia 1 2, tomamos sendas muestras de tamaosrespectivos n1 = 40 y n2 = 35, ambas sucientemente grandes, que arrojan medias muestrales

    de x1 = 230 m y x2 = 140 m. Entonces, al nivel de conanza del 95% (con valor crtico asociado

    z=2 = 1096), el intervalo de conanza para la diferencia 1 2 es:

    I:C: =

    35 x1 x2 z=2 s21n1+22n2

    24 = # 230 140 1096r80240

    +752

    35

    "=

    =90 350101 = 540899; 1250101 :

    A. Roldn

  • 102 CAPTULO 13. INFERENCIA ESTADSTICA

    Esto signica que, al nivel de conanza del 95%, los machos recorren entre 55 y 125 metros ms

    que las hembras en cada vuelo.

    Ejercicio 64 De una poblacin de personas comparables con exceso de peso se seleccionan dosgrupos A y B de 100 y 50 individuos, respectivamente. A los individuos del grupo A se les

    suministra una nueva dieta D1, con lo que sufren una prdida media de peso al cabo de un mes

    de 79 kg, con una desviacin tpica de 02 kg. A los individuos del grupo B se les suministra

    una dieta D2 con la que sufren una prdida media de peso al cabo de un mes de 68 kg, con

    una desviacin tpica de 03 kg. Hallar los lmites de conanza del 95% para la diferencia del

    nmero medio de kg perdidos producidos por el suministro de las dos dietas D1 y D2.

    Solucin : Razonando como antes, los datos que nos proporciona el enunciado son:8>:tamaos de las muestras : n1 = 100; n2 = 50;

    medias muestrales: x1 = 709 kg; x2 = 608 kg;desviaciones tpicas muestrales: s1 = 002 kg; s2 = 003 kg:

    Con estos datos y el valor crtico z=2 = 1096 calculamos el intervalo de conanza para ladiferencia de medias poblacionales:

    I:C: =

    35 x1 x2 z=2 ss21n1+s22n2

    24 = # 709 608 1096r0022100

    +0032

    50

    "=

    =101 00092 = 10008; 10192 :

    Esto signica que los individuos sometidos a la primera dieta adelgazan entre 10008 y 10192 kgms que los de la segunda dieta.

    Ejercicio 65 Para el consumo de bombillas se puede elegir entre la marca A y la marca B. Deuna muestra de 120 bombillas de la marca A se determin que la vida media era 1500 horas y la

    desviacin tpica, 110 horas. Para una muestra de 180 bombillas de la marca B se determin que

    la vida media era 1300 horas y la desviacin tpica, 90 horas. Hallar un intervalo de conanza

    para la diferencia de las vidas medias para las poblaciones de las marcas A y B.

    Solucin : En este caso no se nos indica el nivel de conanza que debemos aplicar, por lo que

    podemos elegirlo nosotros. Por ejemplo, al nivel de conanza del 95%, tendremos el intervalo:

    I:C: =

    35 x1 x2 z=2 ss21n1+s22n2

    24 = # 1500 1300 1096r1102120

    +902

    180

    "=

    =200 23067 = 176033; 223067 ;

    A. Roldn

  • 13.3. Intervalos de confianza 103

    y si hubisemos elegido el 99% de conanza:

    I:C: =

    35 x1 x2 z=2 ss21n1+s22n2

    24 = # 1500 1300 20575r1102120

    +902

    180

    "=

    =200 3101 = 16809; 23101 :

    En el segundo caso, el intervalo de conanza es mayor porque estamos ms seguros de que en l

    est la diferencia de medias poblacionales 1 2:

    13.3.6. Intervalo de conanza para la proporcin

    Supongamos que tratamos de determinar la proporcin de votantes de un determinado par-

    tido poltico para conocer, de antemano, el resultado que obtendr en las prximas elecciones.

    Esta proporcin p hace referencia al conjunto de toda la poblacin, y sera imposible conocer el

    voto de cada individuo a priori (eso es lo que se hace concretamente el da de las elecciones),

    as que p normalmente no es conocida hasta despus del escrutinio. Pero nosotros tratamos de

    estimarla a priori, y para ello recurrimos a una muestra aleatoria de tamao n. Si la muestra es

    representativa, la proporcin P^n de votantes del partido sigue una distribucin aproximadamente

    normal, dada en el teorema 12.3.4, que es:

    P^n Np ;

    rp qn

    :

    Por tanto, el intervalo de conanza de la proporcin muestral P^n al nivel de conanza p esP^n z=2 P^n ; P^n + z=2 P^n

    =

    p z=2

    rp qn

    ; p+ z=2 rp qn

    ;

    pero como la proporcin p de la poblacin no es conocida, la sustituiremos por la proporcin

    muestral p^, que es su estimador insesgado. As tenemos el siguiente enunciado.

    Teorema 13.3.5 Consideremos una poblacin (no necesariamente normal) en la que una pro-porcin p (desconocida) de individuos poseen una cierta caracterstica comn. Tomemos unamuestra aleatoria de tamao n 30 y supongamos que la proporcin p^ de individuos de lamuestra que poseen dicha caracterstica verica que n p^ 5 y n q^ 5, donde q^ = 1 p^.Entonces el intervalo de conanza para la proporcin poblacional p al nivel de signicacin

    es, exactamente, #p^ z=2

    rp^ q^n

    ; p^+ z=2 rp^ q^n

    ":

    El error mximo que se comete con esta aproximacin es

    E = z=2

    rp^ q^n; (13.4)

    A. Roldn

  • 104 CAPTULO 13. INFERENCIA ESTADSTICA

    por lo que, despejando por si nos lo solicitan, el tamao mnimo muestral que se ha de determinar

    para que este error no supere el error mximo admisible E0 es:

    E E0 ) n z2=2 p^ q^E20

    : (13.5)

    Ejercicios de la relacin de la Ponencia sobre proporciones

    Ejercicio 66 Tomada, al azar, una muestra de 120 estudiantes de una Universidad, se encontrque 54 de ellos hablaban ingls. Halle, con un nivel de conanza de 90%, un intervalo de con-

    anza para estimar la proporcin de estudiantes que hablan el idioma ingls entre los estudiantes

    de esa Universidad.

    Solucin : La proporcin de estudiantes de esa Universidad que hablan ingls en la muestra

    (de tamao n = 120) es p^ = 54=120 = 0045. Para el nivel de conanza p = 009, el valorcrtico correspondiente es z=2 = 10645. Observemos que n p^ = 120 0045 = 54 5 y n q^ =120 0055 = 66 5, adems de que n 30. Entonces el intervalo de conanza para la proporcinde estudiantes de la Universidad que hablan ingls es, segn el teorema 13.3.5:

    I:C: =

    #0045 10645

    r0045 0055120

    " 0045 000747 = 003753; 005247 :

    Esto signica que, segn el estudio, al nivel de conanza del 90%, entre el 37053 % y el 52047 %de los estudiantes de esa Universidad hablan ingls.

    Ejercicio 67 Se desea estimar, por medio de un intervalo de conanza, la proporcin p deindividuos daltnicos de una poblacin a travs del porcentaje observado en una muestra aleatoria

    de individuos de tamao n. Si el porcentaje de individuos daltnicos en una muestra aleatoria

    es igual al 30%, calcule el valor mnimo de n para que, con un nivel de conanza del 95%, el

    error que se cometa en la estimacin sea inferior a 0031.

    Solucin : Si queremos un error mximo admisible de E0 = 00031 con una proporcin muestralp^ = 003 al nivel de conanza 0095 (con valor crtico asociado z=2 = 1096), debemos tomar unamuestra de tamao no inferior a (vs. (13.5)):

    n z2=2 p^ q^E20

    =10962 003 007

    000312= 839048;

    por lo que en la prctica tomaremos no menos de 840 personas para la muestra.

    A. Roldn

  • 13.3. Intervalos de confianza 105

    Ejercicio 68 En una encuesta realizada a 500 mujeres adultas de una poblacin se encontr que300 de ellas estn casadas actualmente. Construya con estos datos un intervalo de conanza, con

    un nivel del 90%, para la proporcin de mujeres adultas actualmente casadas en esa poblacin.

    Solucin : La proporcin de mujeres casadas en la muestra es p^ = 300=500 = 006. Para el nivel deconanza p = 009, el valor crtico correspondiente es z=2 = 10645. Es claro que n p^ = 500 006 =300 5 y n q^ = 500 004 = 200 5. Como la muestra es sucientemente grande, n = 500 30,podemos aplicar el teorema 13.3.5, que nos garantiza que el intervalo de conanza para la

    proporcin de mujeres adultas casadas de esa poblacin es:

    I:C: =

    #006 10645

    r006 004500

    " 006 00036 = 00564; 00636 :

    Esto signica que, segn el estudio, al nivel de conanza del 90%, entre el 5604 % y el 6306 %de las mujeres adultas de esa poblacin estn casadas.

    Ejercicio 69 Una muestra aleatoria de automviles tomada en una zona turstica ha permitidoobtener un intervalo de conanza, al nivel de 95%, para estimar la proporcin de matrculas

    extranjeras de esa zona, siendo sus extremos 0232 y 0368.

    a) Determine el valor de la proporcin estimada a travs de esa muestra y una cota del errorde estimacin a este nivel de conanza.

    b) Utilizando el mismo nivel de conanza, cul sera la cota de error si esa misma proporcinse hubiera observado en una muestra de 696 matrculas?

    Solucin : Como conocemos los extremos del intervalo de conanza, dicho intervalo es I =

    ]00232; 00368[. Como vimos en la nota 8 de la pgina 89 (aplicada a la media x pero tambinvlida para p^ por ser el centro del intervalo de conanza), la proporcin muestral es el punto

    medio entre los extremos, por lo que

    p^ =00232 + 00368

    2= 003;

    y la cota del error de estimacin es la distancia entre este punto medio y los extremos del

    intervalo, que puede calcularse como:

    E = 00368 p^ = 00368 003 = 00068:

    Supongamos ahora que la muestra es de tamao n = 696 y se ha obtenido la proporcin

    muestral anterior, es decir, p^ = 003. Debemos comprobar que n p^ = 696 003 = 20808 5 y que

    A. Roldn

  • 106 CAPTULO 13. INFERENCIA ESTADSTICA

    nq^ = 696007 = 48702 5. Como adems n = 696 30, el teorema 13.3.5, y ms concretamentela igualdad (13.4), nos asegura que, al nivel de conanza del 95% (con valor crtico z=2 = 1096),el error mximo que se cometera en la estimacin por intervalo de conanza es:

    E = z=2

    rp^ q^n

    = 1096 r003 007696

    00034:

    Ejercicio 70 Para conocer la audiencia de uno de sus programas (proporcin de televidentesque lo preeren), una cadena de TV ha encuestado a 1000 personas elegidas al azar obteniendo

    una proporcin muestral del 33% de personas favorables a ese programa. Calcule una cota del

    error de estimacin, por medio de un intervalo de conanza, con un nivel del 92%.

    Solucin : La proporcin de personas que ven el programa en la muestra (de tamao n = 1000)

    es p^ = 0033, y tomando un nivel de conanza del 92% (con valor crtico asociado z=2 = 1075),la cota de error que cometera el correspondiente intervalo de conanza es:

    E = z=2

    rp^ q^n

    = 1075 r0033 00671000

    00026:

    Ejercicio 71 Para estimar la proporcin de familias con un solo hijo en una ciudad, se hatomado una muestra de familias al azar, de las cuales el 30% tiene un solo hijo. Cul es el

    mnimo tamao muestral necesario para que, con estos datos, un intervalo de conanza de esa

    proporcin a un nivel del 95% tenga una cota de error de 006, como mximo?

    Solucin : En este caso, p^ = 003, y debemos calcular n para que:

    z=2

    rp^ q^n

    = E 0006 ,z2=2 p^ q^

    n 00062 ,

    , n z2=2 p^ q^

    00062=10962 003 007

    00062= 224009:

    Por tanto, el tamao mnimo muestral que se ha de tomar para cometer un error inferior a 006

    es n = 225.

    Ejercicio 72 Se va a tomar una muestra aleatoria de 600 recin nacidos en este ao en unaciudad para estimar la proporcin de varones entre los recin nacidos de esa ciudad, mediante

    un intervalo de conanza con un nivel del 95%. Con qu proporcin estimada ser mxima la

    amplitud de ese intervalo? Cul es la amplitud mxima?

    Solucin : Con una muestra de tamao n = 600 y un nivel de conanza del 95% (con nivel

    crtico asociado z=2 = 1096), estudiamos la funcin que determina la amplitud A del intervalode conanza, que a su vez coincide con el doble del error mximo cometido:

    A = 2E = 2z=2

    rp^ q^n

    =2 1096p600

    pp^ (1 p^) = C

    pp^ (1 p^);

    A. Roldn

  • 13.3. Intervalos de confianza 107

    donde C = (2 1096)=p600 es una constante positiva. Resulta entonces que esta amplitud esfuncin de la proporcin muestral p^, as que nos planteamos cunto debe valer p^ para que la

    amplitud A sea mxima. Derivamos una vez:

    A : [0; 1]! R; A (x) = Cpx (1 x); A0 (x) = C

    2 1 2xp

    x (1 x) :

    Esta funcin alcanza un nico punto crtico, x = 1=2, que resulta ser un mximo porque A (0) =

    A (1) = 0. Por tanto, el valor que hace que la amplitud del intervalo de conanza correspondiente

    sea mxima es x = p^ = 005.

    En tal caso, dicha amplitud es:

    A005=2 1096p600

    p005 (1 005) 0008:

    Ejercicio 73 En una muestra aleatoria de 600 coches de una ciudad, 120 son de color blanco.Construya un intervalo de conanza de la proporcin de coches de color blanco con un nivel de

    conanza del 98%.

    Solucin : El tamao muestral es n = 600 y la proporcin muestral de coches blancos es p^ =

    120=600 = 002. Observamos que se cumplen las condiciones requeridas por el teorema 13.3.5:n 30, n p^ = 600 002 = 120 5 y n q^ = 600 008 = 480 5. Entonces, al nivel de conanzadel 98% (con valor crtico asociado z=2 = 20325), tenemos el intervalo de conanza:

    I:C: =

    #p^ z=2

    rp^ (1 p^)

    n

    "=

    #002 20325

    r002 008600

    "=

    =002 00038 = 00162; 00238 :

    Esto signica que en esa ciudad hay, al 98% de conanza, entre el 162% y el 238% de coches

    de color blanco.

    Ejercicio 74 Mediante una muestra aleatoria de tamao 400 se estima la proporcin de resi-dentes en Sevilla que tienen intencin de asistir a un partido de ftbol entre el Betis y el Sevilla.

    Si para un nivel de conanza del 95% resulta un error mximo en la estimacin del 3%, obtenga

    el valor de la estimacin, sabiendo que es inferior a 025.

    Solucin : La muestra tiene tamao n = 400, el valor crtico asociado al 95% de conanza es

    z=2 = 1096 y el error cometido es E = 0003. Entonces podemos despejar el producto p^ q^ =

    p^ (1 p^) de la expresin:

    E = z=2

    rp^ q^n

    , E2 =z2=2 p^ q^

    n,

    , p^ (1 p^) = p^ q^ = E2 nz2=2

    =00032 40010962

    0009371:

    A. Roldn

  • 108 CAPTULO 13. INFERENCIA ESTADSTICA

    Resolvemos entonces la ecuacin de segundo grado:

    p^2 p^+ 0009371 = 0 , p^ 1 007912

    , p^ 2 00895; 00105 :Como el enunciado nos dice que p^ 0025, slo queda la solucin p^ = 00105, es decir, la proporcinde residentes en Sevilla que tiene intencin de ir al partido es del 105%.

    Ejercicio 75 En una investigacin de mercado se pregunta a 600 personas sobre el inters enconsumir un determinado producto, si ste se comercializa en la ciudad. De ellas, el 55% mani-

    estan su intencin de consumirlo. Con posterioridad a la encuesta, el fabricante del producto

    comercial exige que el error de la estimacin sea inferior al 3%, con una conanza del 98%.

    (a) Cumple la investigacin los requisitos exigidos por el fabricante?

    (b) En caso negativo, cul es el valor mnimo del tamao de la muestra para cumplir con lasexigencias del fabricante?

    Solucin : En la muestra de tamao n = 600, la proporcin de interesados en el producto es

    p^ = 0055. Al nivel de conanza del 98% (con valor crtico asociado z=2 = 20325), el mximoerror cometido es:

    E = z=2

    rp^ q^n

    = 20325

    r0055 0045600

    000472 = 4072 %:

    Como este error es mayor del 3%, la investigacin realizada no cumple con los requisitos del

    fabricante. Para que ello ocurriera, el error mximo admisible debera ser del E0 = 0003, y paraello hace falta un tamao muestral como el siguiente:

    z=2

    rp^ q^n

    = E E0 ,z2=2 p^ q^

    n E20 ,

    , n z2=2 p^ q^E20

    =203252 0055 0045

    00032= 148605:

    Por tanto, el menor tamao muestral que habra que tomar para cumplir con los requisitos del

    fabricante es n = 1487.

    Si se tomase z=2 = 2033, el menor tamao muestral sera:

    n z2=2 p^ q^E20

    =20332 0055 0045

    00032= 149209 1493:

    A. Roldn

  • 13.3. Intervalos de confianza 109

    Ejercicios de las pruebas de Selectividad sobre proporciones

    Ejercicio 76 (Selectividad 2006) De 500 encuestados en una poblacin, 350 se mostraronfavorables a la retransmisin de debates televisivos en tiempos de elecciones. Calcule un intervalo

    de conanza, al 995%, para la proporcin de personas favorables a estas retransmisiones.

    Solucin : La proporcin de personas favorables en la muestra es p^ = 350=500 = 007. Comop = 00995, entonces

    1 2=1 + p

    2= 009975 ) z=2 = 2081:

    Entonces el intervalo de conanza buscado es, segn el teorema 13.3.5:

    I:C: =

    #p^ z=2

    rp^ (1 p^)

    n

    "=

    #007 2081

    r007 003500

    "=

    =007 000576 = 006424; 007576 :

    Ejercicio 77 (Selectividad 2006) En una muestra aleatoria de 1000 personas de una ciudad,400 votan a un determinado partido poltico. Calcule un intervalo de conanza al 96% para la

    proporcin de votantes de ese partido en la ciudad.

    Solucin : La proporcin de votantes de ese partido en la muestra de tamao n = 1000 es

    p^ = 400=1000 = 004. Para el nivel de conanza p = 0096, el valor crtico correspondiente esz=2 = 2

    0055. Entonces el intervalo de conanza, segn el teorema 13.3.5, es:

    I:C: =

    #004 20055

    r004 0061000

    " 004 000318 = 003682; 004318 :

    Esto signica que, segn el estudio, dicho partido poltico obtendr, al nivel de conanza del

    96%, entre el 36082 % y el 43018 % de los votos.

    A. Roldn