Estadistica para la administración y Economía Lind Marchal 11 edición.pdf

download Estadistica para la administración y Economía Lind Marchal 11 edición.pdf

If you can't read please download the document

Transcript of Estadistica para la administración y Economía Lind Marchal 11 edición.pdf

  • ,., i~ e r- . _; -.

    11 Edicin

    Douglas A, Lind Coastal Carolina University y The University o Toledo

    The University of Toledo

    The University of Toledo

    ESCUELA POLITECNICA 1 DEL EJERCITO

    BIBLIOTECA E.SPEl lATACUNGA

    No?lt/JQ Fechol!::f? .. 2(J(;if/1 Preci~: .1:! .. 'l1!? . .Ooncci;;: ............. .

    1. Alfaomega

  • Traduccin: Mara del Carmen Hano Roa Universidad lberoamericana Maestra en matemticas

    Revisin tcnica y genera!: !ng. Francisco Paniagua Bocanegra, f.M.E. Sociedad Mexicana de Geografa y Estadstica -Comunicacin educativa en estadstica y economa

    Al cuidado de la edicin: Felipe de Jess Castro Prez Martha Cupa Len

    Produccin: Mara Teresa Barajas S.

    Versin en espaol de la obra en ingls: Statistica/ Techniques in Business and Economics, 11. ed., por Douglas A. Lind, Wllliam G. Marchal y Robert O. Mason, publicada originalmente por The McGraw-Hill Companies, !ne.

    2004 ALFAOMEGA GRUPO EDITOR, S.A. de C.V. Pitgoras 1139, Col. del Valle. 03100 Mxico, D. F.

    Miembro de la Cmara Nacional de la Industria Editorial Mexicana Registro No. 2317

    Internet: http://www.alfaomega.corn.mx e-mail: [email protected]

    ISBN 970-15-0974-9 ISBN 0-07-240282-2, versin original porThe McGraw-Hill Companies, lnc.

    2004 ALFAOMEGA COLOMBIANA, S. A. Calle 106 A No. 22-56, Bogot, D. C. Tel.: 619 7677 e-mail: [email protected] ISBN: 958-682-513-2

    Derechos reservados Esta obra es propiedad intelectual. de su autor, y los derechos de publicacin en lengua espaola han sido legalmentetra_nsferidos al editor. Prohibida su reproduccin parcial o total por cualquier medio, sin pern1iso por escrito del propietal"io de los derechos del copy_right.

    NOTA IMPORTANTE La informacin contenida en esta obra tiene un fin exclusivamente didctico y, por tanto, no est previsto su aprovechamiento a nivel profesional.o industrial. Las indicaciones tcnicas _y programas_ incluido,s, han sido. elaborados con gran cuidado por el autor y eProducidos bajo estrictas normas de control. ALFAOMEGA GRUPO EDITOR, S.A. de C.V. no ser jurdicamente responsable por: errores u omisiones; daos y perjuicios que se pudieran atribuir al uso de la informacin comprendida en este libro y en el CD-ROM adjunto, ni por la utilizacin indebida que pudiera drsele.

    Impreso en Colombia - Printed in Colombia

  • \ \

    A Jane, mi esposa y meior amiga, y a nuestros hiios l\/Iike, Steve y Mari?.

    Douglas A Lincl

    A Andrea, mi corazn y madre ele mis hiios: Rache! Anne (y Eric), Joseph Anclrew, Sarah Louise, Christopher Brophy, y Nimy Bridge!.

    William C. Marcha/

  • VI

    Como el ttulo indica, el objetivo de Estadstica para Administracin y Economa es propor-cionar a los estudiantes de economa, finanzas, mercadotecnia, contadura, administracin y de otras reas de la administracin de negocios, una revisin introductoria a las numero-sas aplicaciones de la estadstica -descriptiva e inferencia!- a la administracin, el comer-co, la economa y los negocios. Aunque nuestro principal inters son las aplicaciones econmico administrativas, hemos tratado ele usar ejemplos enfocados a los estudiantes, que no requieran conocimientos previos en administracin o economa.

    En 1967, cuando Robert Masen escribi la primera edicin de este libro, la localizacin de datos relevantes era difcil. Esto ha cambiado! Hoy la obtencin de datos no es un pro-blema: la cantidad de artculos que se compran en una tienda de comestibles es registra-da en la caja automticamente; las compaas de telfonos llevan un registro de la duracin de cada llamada, la hora a la que se hizo y el nC1mero de la persona a la que se llam; existen aparatos mdicos que de manera automtica monitorean y registran e! ritmo cardaco, la presin sangunea y la temperatura del cuerpo de un ser humano; gran canti-dad de informacin econmica y de negocios se registra y reporta casi instantneamente. Empresas como CNN, USA Today (en Estados Unidos) y Yahoo!, por ejemplo, cuentan con sitios en la Red (websites) en los que se puede consultar los precios ele las acciones finan-cieras en menos de 20 minutos.

    En la actualidad se requiere habilidad para poder utilizar todo este cmulo de informa-cin. En primer lugar se necesita ser crtico al utilizar la informacin que otros generan. En segundo, es necesario saber transformar grandes cantidades de datos a un formato acce-sible y comprensible, de manera que uno pueda interpretar y juzgar estos datos, y con ba-se en eso tomar decisiones.

    Hoy, todos los estudiantes no slo poseen calculadoras, sino que mucl1os de ellos cuentan Incluso con su propia computadora o cuando menos tienen acceso a una en la inst'1tucin educativa a !a que pertenecen. Tambin se cuenta ya con una gran cantidad de software para estadstica, y de datos almacenados electrnicamente, En repuesta a estos cambios introducimos, en los captulos, pantallas de Excel y de MINiTAB, Esto permite a los estudiantes ver realmente los resultados que se obtienen con estos programas; las ins-trucciones necesarias para llegar a estos resultados se dan al final del captulo, Hemos sustituido muchos de los clculos de los ejemplos por la interpretacin de los mismos, pa-ra ayudar al estudiante en su aprendizaje de comunicar los resultados estadsticos.

    Al hacer estos cambios no nos hemos apartado de nuestro esfuerzo por presentar, lo mejor pos'1ble, los conceptos clave junto con ejemplos de apoyo. La onceava edicin de Estadstica para Administracin y Economa es producto del trabajo de muchas personas: estudiantes, colegas revisores y el equipo editorial de McGraw-Hill/lrwing. A tocios ellos les damos las ms cumplidas gracias. Queremos expresar tambin nuestro 111s sincero agra-decimiento a los revisores:

    Douglas Barrett University of North Alabama Darl Bien University of Denver Wendy Brown Southem A/berta lnstitute of Technology Mary Elizabetll Camp Indiana University

    Sllarad Chitgopekar 11/inois State University G'1opal Dorai William Paterson University Bernice Evans Margan State University Burdette Hansen University of Phoenix

  • Prefacio

    Clifford B. Hawley West Virginia University Lloyd R. Jaisingh Morehead State University Valerie M. Janes Tidevvater Community Col/ege Creig Kronstedt Cardinal Stritch University Denise Kummer St. Louis Community Co//ege Jack Muryn Cardinal Stritch University Julia A. Norton California State University - Hayward

    Louis A. Patille University of Phoenix - Colorado Christopher W. Rogers Miami-Oade Community Co//ege Charlene Robert Louisiana State University Linda Stephanchick OeVry lnstitute of Technology Andrew Welki John Carro// University Kathleen Whitcomb University of South Carolina Charles W. Williams Troy State University

    vii

    Sus sugerencias y la revisin exhaustiva de la edicin anterior, as como de los originales de sta, han dado como resultado un mejor libro de texto.

    Un agradecimiento especial para las siguientes personas: el Dr. Leonard Presby, de la William Paterson University; el Dr Jerzy Kamburowski, de the University o Toledo; y la Dra. Roberta Thomas, de la University of Phoenix; quienes revisaron el manuscrito y comproba-ron que los ejercicios estuvieran correctos; el Profesor Walter H. Lange, de The University of Toledo, que prepar la gua de estudio (disponible en la versin en ingls de este texto); el Dr. Samuel Wathen, de la Coastal Carolina University, que elabor un banco de exme-nes y verific la exactitud del texto (disponible en la versin en ingls de este texto); la Sri-ta. Denise Heban y los autores de este libro elaboraron el manual para el profesor (disponible en la versin en ingls de este texto); y la Srita. Jane Lind realiz la presenta-cin en PowerPoint

    Agradecernos su co!aboracin para la realizacin de este proyecto. Quisiramos dar las gracias tambin al equipo editorial original de McGraw-Hill/lrwing,

    y otras personas, que aunque no las conocemos personalmente, sabemos que aportaron valiosas contribuciones a este libro.

  • Vlll

    Hemos tratado de que este libro "no sea ms difcil de lo necesario". Lo que queremos decir con esto es que hemos procurado que las explicaciones sean prcticas pero sin una exagerada simplificacin. Usamos ejemplos parecidos a los que se encuentran en el mundo de la administracin, la economia y los negocios. El material de este libro ayuda-r al lector a utilizar las herramientas estadsticas para la toma de decisiones en la admi-n1stracin, la economa y los negocios. Adems, el lector observar que muchos de los tpicos y temas de este libro, podrn ser usados en otros de sus cursos, y que son con-sistentes con lo que encontrar en otros cursos en los que se tratan temas cuantitativos o de estadstica.

    No hay duda de que hoy se d'1spone de muchos ms datos tiles que en el pasado. Sin embargo, no se cuenta con suficientes personas capaces de convertir estos datos en informacin til, y de interpretarlos correctamente. Si el lector estudia con atencin y per-severancia el contenido de este libro, estar en condiciones de contribuir al xito y desa-rrollo de cualquier empresa en la que colabore. Recuerde que como ley, no hace mucho, uno de los autores en una galletita de la suerte "Ningn secreto para llegar al xi-to funcionar si usted no funciona".

    Ayudas para el aprendizaje Este libro est pensado para ayudar a los estudiantes a acercarse a la materia y apren-derla sin la angustia que suele causarles la estadstica a algunos de ellos. Los siguientes elementos de ayuda les facilitarn en gran medida el estudio.

    Objetivos. Cada captulo inicia sealando un conjunto de objetivos, lo que ayuda a enfocar y motivar el aprendizaje. stos determinan los conocimientos que se habrn adquirido al terminar el estudio del captulo. Una foto ilustrativa, al lado de los objeti-vos, los relaciona con uno de los ejercicios del captulo. Introduccin. Al inicio de cada captulo se repasan los conceptos importantes de los captulos anteriores, y se describe su relacin con el tema del captulo en estudio.

    Definiciones. Las definiciones de trmlnos nuevos y de trminos exclusivos de !a es-tadstica se separan del texto principal y se destacan para facilitar referirse a ellos nuevamente o hacer un repaso.

    Frmulas. La primera vez que se usa una frmula se encierra en un recuadro y se nu:.. mera para facilitar referirse a ella. Adems, el libro contiene un formulario desprendi-ble con todas las frmulas principales, para que el lector las tenga siempre a mano cuando hace las tareas o en los exmenes.

    Notas al margen. Hay ms de 300 notas concisas que se colocan al margen. Cada una pone nfasis en el concepto clave que se presenta inmediatamente.

    Ejemplos/Soluciones. Presentamos numerosos ejemplos con solucin. stos tienen la finalidad de mostrar al lector, inmediatamente y en detalle, la aplicacin de los con-ceptos a situaciones reales.

    Estadstica en accin. En cada captulo se presentan generalmente dos artculos, ti-tulados La estadstica en accin. Estos articulas proporcionan aplicaciones especia-les e interesantes de la estadistica y dan una perspectiva histrica de la misma.

  • Nota para el estudiante IX

    Au!oexamen. En todo el captulo se encuentran autoexmenes que siguen estrecha-mente el patrn del Ejemplo/Solucin que los precede. Esto ayudar al lector a mo-nitorear su progreso y reforzar la tcnica en cuestin. Las respuestas, junto con el mtodo ele solucin, estn al final del captulo.

    Ejercicios. En cada captulo se han incluido ejercicios, despus c!e ios autoex8.n1e-nes,- y al 'final del captulo. Las respuestas y mtodos de solucin de los ejercicios ele nmero impar se encuentran al final del libro. Los datos para la mayor parte de los ejercicios con ms de 20 datos estn en el disco compacto (CD-ROM) que acompa-a al libro.

    Resumen del captulo. Al final de cada captulo hay un resumen. ste es un apoyo para el aprendizaje que brinda al lector la oportunidad de revisar el material, especial-mente e! vocabula:io, adems de ver y revisar, una vez rns, las frmulas.

    Ejercicios de la red. En casi todos los captulos se presentan referencias a direccio-nes de Internet donde se pueden obtener conjuntos de elatos de empresas, organis-mos gubernamentales y universidades. Ejercicios con datos para computadora. En la mayor parte de los captulos, los cuatro ltimos ejerclcios se referen a cuatro grandes conjuntos de datos econmico-administrativos. Estos conjuntos de datos se encuentran al final del libro y tambin en el disco co111pacto que lo acompaa.

    Secciones de repaso. Despus de algunos captulos se presenta una seccin de re-paso. Esta seccin contiene un breve repaso de los captulos, un simbologa con los trminos clave y un examen prctico del material visto. En esta seccin de repaso tambin se presentan casos que permiten al lector tomar decisiones usando !as he-rramientas y tcnicas de algunos captulos.

    Suplenntento El disco compacto que se incluye, sin costo extra, en cada ejemplar de esta obra, con-tiene principalmente materiales de apoyo para el aprendizaje: tutoriales para computado-ra; diapositivas en PowerPoint; archivos con los datos (en formatos para MINITAB, Excel, y ASCII), para los ejercicios al final del captulo, y para los ejercicios con 20 o ms datos. Contiene tambin un vnculo a Internet para el sitio de este libro en la Red, y vnculos a los sitios de la Red que se mencionan en los ejercicios del libro. Tambin contiene Me-gaStat para Excel, de J.B. Orris, programa para computadom que aumenta la capacidad de Excel en el anlisis estadstico. Adems contiene Visual Statistics 2.0, escrito por Doanne, Tracy y Mathieson. Visual Statistics es un programa de computadora para la en-seanza y aprendizaje de estadstica a travs de la experimentacin y visualizacin inte-ractiva.

    Una amplia y muy completa Gua de Estudio (disponible en la versin en ingis de este texto), escrita por el profesor Walter Lange de The University of Toledo, organizada de manera muy parecida a un libro de texto. Cada capitulo contiene objetivos, un breve resumen del captulo, problemas con solucin, ejercicios de autoexamen y problemas pa-ra e! alumno.

    Douglas A Und William G. Marcha!

  • X

    1 Qu es la Estadstica? ] 2 Descripcin de los datos. [)istribuciones lle frecuencias y representacione::i grficas 2] 3 Descripcin de los elatos. f\!ledidas de tendencia central 64 /1 "t Otras n1edidas descrip\'as 99 5 Revisin de algunos conceptos de probabilidad 149 6 Distribuciones de probabilidad discreta 191 7 Distribucin de probabilidad normal 226 8 Mtodos de muestreo y el teorema de lmite central 263 9 Estin1acin e intervalos de confianza 297

    10 11 Pruebas de hiptesis para dos muestras 377

    ~ 2 Anlisis de vari,mza 413 13 !:Zegresin Hnea1 ;l co1Telaci:rQ 456 14, 1\.n3Hsis de regresi11 y corre]acin n1.ltiples 502 15 Mtodos no parnmtricos. Aplicaciones de ji cuadrada 548 16 l'\!Itodos no paramtricos. Anlisis de elatos ordenados Jor rango 580 17 Conlrnl estadstico de calidad 622 18 Nmeros ndice 655 19 Series de l:iemJ)o y pronsticos 689 20 Introduccin a la teora de decisiones 726

    Apndices: 1i1blas y conjuntos de datos 745 Gua de referencia rpida de IVlegaStat 777

    l{espnestas a los ejercicios de cada captulo con nrncros irnpares 780 [~espnest::11s a los ejercicios de re)aso con nn1eros in1pares 8]_9 ndice 825

  • Capitulo

    1 Qt1 es ]a :E~stac]stTii~a? l

    Capitulo

    lntroduccin 2 Qu se entiende por estadstica? 2 Por qu estudiar estadstica? 4 Tipos de estadstica 6

    Estadstica descriptiva 6 Estadstica inferencia! 7

    Tipos de variables 8 Niveles de medicin 9

    Datos de nivel nominal 9 Datos de nivel ordinal O Datos de nivel de intervalo Datos de nivel de razn i 2

    Ejerccios 13 Usos y abusos de la estadstica 13 Aplicaciones para computadora 15 Resumen del captulo 17 Ejercicios de! captulo i 7 ejercicios.com 18 Ejercicios con datos para computadora i 9 Respuestas al autoexamen 20

    2 Desciiucin de los datos. ' Dstribuciones de frecuencias

    lntroduccin 22 Elaboracin de una distribucin

    de frecuencias 22 Intervalos de clase y puntos niedlos de clase 26

    21

    Ejemplo con un programa de computacin 27 Distribucin de frecuencias relativas 28 Ejercicios 28

    Representaciones de tallo y hoja 29

    Representacin grfica de una distribucin de 'frecuencias 34

    Histograma 35 Polgono ele frecuencias 36

    Ejen:;icios 39 Distribuciones de frecuencias acumuladas 40

    E:jerc1cJos 43 Otras representaciones grficas de datos 44

    Capitulo

    Grficas engaosas 48

    Resumen del captulo 52 Ejercicios del captulo 53 ejercicios.com 59 Ejercicios con datos para computadora 59 Comandos para computadora 60 Respuestas al autoexamen 62

    3 Descrincin de los datos. . .

    1\iledidas de tendencia central 64 Introduccin 65 Media poblacional 65 Media muestra! 67 Propiedades de la media aritmtica 68

    Media ponderada 70 Ejercjcjos 1 Mediana ?i Moda 74

    Solucin por con1putadora 76 Media geomtrica 77

    XI

  • xii

    Captulo

    Contenido

    Media, mediana y rhoda de datos agrupados 79

    Media aritmtica 79 Ejercicios .Y! Mediana 82 Moda 85

    Posiciones relativas de la media, la mediana y ia moda 87

    Resumen del captulo 88 Sin1bologa 89 Ejercicios del captulo 90 ejercicios.com 95 Ejercicios con datos para computadora 96 Comandos para computadora 97 Respuestas al autoexamen 98

    4 Otras Inedidas desc1iptivas 99 Introduccin 100 Por qu estudiar la dispersin? 100 Medidas de dispersin 101

    Amplitud (o ntervalo) de variacin 101 Desviacin media 102

    Ejercicios 103 Varianza y desviacin estndar 104

    Ejerccios - 0.8 Medidas de dispersin para datos agrupados en una distribucin de frecuencias 108

    Amplitud de variacin Desviacin estndar

    108 109

    Interpretacin y usos de la desviacin estndar 1i2

    Teorema de Cl1ebyshev 112 Regla emprica 113

    Ejercicos Dispersin relativa 115

    Asimetra 117

    Captulo

    5

    Ejercicios 20 Otras medidas de dispersin

    Cuartiles, deciles y centiles i24

    Diagramas de caja 125 Ejerccio.::; Resumen del captulo 28 Simbologa i 30 Ejercicios del captulo i 30 ejercicios.corn i 36

    121 121

    Ejercicios con datos para computadora Comandos para computadora i 38 Respuestas al autoexamen 140

    Re,isin de algunos conceptos de piybabilidad 149 Introduccin i 50 Qu es una probabllidad? 151

    Caso 1 153 Caso 2 153

    Enfoques de la probabilidad 153 Probabilidad clsica 153 Concepto emprico 155 Probabilidad subjetiva 155

    E:jercicJos i SG Algunas reglas de probabilidad 158

    Reglas de adicin 1 s8 Ejen::icios 163

    Reglas de multiplicacin Diagramas de rbol i 68

    164

    Teorema de Bayes 170 E.jercic:ios Principios de conteo 175

    Frrnula de la multiplicacin 175

    137

  • Captulo

    Gonlendo

    Frmula ele la permutacin Frmula de la combinacin

    Resumen del captulo 180 Simbologa 13-1 Ejercicios de! captulo ejercicios.com i 88

    181

    177 178

    Ejercicios con datos para computadora 188 Respuestas al autoexamen i 89

    Distriibt1ciornes ele 1Jrc~lJal1ilicl21d discreta 191

    -----Introduccin 192 Qu es una distribuc!n c!e

    probabilidad? i 92 Variables aleatorias 194

    Variable aleatora discreta 195 Variable aleatoria continua i 95

    Media, varianza y desviacin estndar de una distribucin de probabilidad 195

    Media 195 Varianza y desviacin estndar 196

    Ejercicios - 98 Dstribucin de probabilidad binomial 200

    Cmo se calcula una distribucin de probabilidad binomial? 201

    Tablas de probabilidad binomial 202 EjeTclcios 207

    Distribuciones de probabilidad acumulada 208

    Ej10rcicios 209 Distribucin de probabilidad hipergeomtrica 21 O

    Ejercic!o:s 2- 3 Distribucin de probabilidad de Poisson 2i 4 Ejercicios Resumen del captulo Ejercicios del captulo

    2"17

    218 Ejercicios con datos para con1putadora 222 Co1nandos para computadora 223 Respuestas al autoexamen 225

    XlB

    Captulo ~ JIJ~ ' 'l ,, ' '11 l 1-' 11 // 1strrr;1~c1orh C[e 1?ilTJoabb]_\C~.8JC[

    Captulo

    normal 226 Introduccin 227 La familia de distribuciones de probabilidad

    normal 227

    Distribucin de probabilidad normal estndar 229

    Usos de la distribucin normal estndar 230

    reas bajo la curva normal 231 Ejercicios 233

    Clculo del rea bajo la curva normal 234 Ejercicios 237 Ejercicios 240 Ejercicios 243 Aproximacin norma! a la binomial 243

    Factor de correccin de continuidad 243 Cmo aplicar el factor de correccin 246

    Ejercicios 247 Resumen de! captulo

    Ejercicios del captulo 248 248

    Ejercicios con datos para computadora Comandos para computadora 254 Respuestas al autoexamen 255

    253

    iJ I;;Itodos ele ]_TI~Jestrreo )1 el -U:eorer~_1a de hn1ite central 263 lntroduccin 264 Muestreo de !a poblacin 264 Mtodos de muestreo de probabilidad 265

    Muestreo aleatorio simple 266 Muestreo aleatorio sistemtico 268 Muestreo aleatorio estratificado 269 Muestreo por conglomeracin 270

    Ejercick)s 270

  • XlV Contenido

    "Error" de rnuestreo 273 Distribucin de muestreo de medias muestrales 273

    Ejercicios 2"16 Teorema de lmite central 277

    Uso de la distribucin de muestreo de la media muestra] 285

    Ejercicios 288 Resumen del captulo 289 Simbologa 290 Ejercicios del captulo 290 ejercicios.com 295 Ejercicios con datos para computadora 295 Respuestas al autoexamen 296

    Captulo

    9 Estimacin e intervalos de confianza 297 Introduccin 298 Estimaciones puntuales e intervalos de confianza 298

    s conocida o muestra grande 298 Una simulacin por computadora 304

    Ejercicios 305 s desconocida y muestra pequea 306

    Ejercicios Un intervalo de confianza para una

    proporcin 313 Ejercicios 3'j 5 Factor de correccin para poblacin finita 316

    Ejsrc!cios 3- 8 Eleccin del tamao de muestra apropiado 318

    Ejercicios 32-~ Resumen del captulo 321 Sirr1bologa 322 Ejercicios del captulo 323 ejercicios.com 326 Ejercicios con datos para computadora 326 Comandos para computadora 327

    Respuestas al autoexamen 329

    Captulo

    -~ O ]3ra_1eb~1s lle !1irPteslis ]J.CJtra uJx1a 1ll.l.ltestr~1 334 Introduccin 335 Qu es una hiptesis? 335 Qu es una prueba de hiptesis? 336 Procedimiento de cinco pasos para probar

    una hiptesis 336 Paso : Plantear la hiptesis nula (H8)

    y la hiptesis alternativa (H1) 337 Paso 2: Seleccionar el nivel de significancia 338

    Paso 3: Calcular el valor estadstico de prueba 339

    Paso 4: Formular la regla de decisin Paso 5: Tomar una decisin 341

    Pruebas de significancia de una y de dos colas 341

    Prueba para una media pob!acionai, con una desviacin estndar poblacional conocida 343

    Prueba de dos colas 343 Prueba de una cola 346

    Valor p en las pruebas de hiptesis 347

    340

    Pruebas para una media poblaciona!: muestra grande y desviacln estndar poblaciona! desconocida 348

    Ejercicios 350 Prueba para una media pobiacional: muestra

    pequea, desviacin estndar poblaciona! desconocida 351

    Una solucin por co111putadora 356 Ejerclcios 359 Pruebas respecto a proporciones 360

    Error de tipo 11 364

  • Capitulo

    Ejercclos 367 Resumen del captulo Simbologa 369 Ejercicios del captulo ejercicios.com 373

    367

    369

    Ejercicios con datos para computadora Comandos para computadora 374 Respuestas a! autoexamen 375

    373

    11 Pmebas de hiptesis

    Captulo

    parn dos 1nuesl:rns 377 ~-----

    !ntroduccln 378 Pruebas de hiptesis: medias

    poblacionales 378 Ejercicios 383 Comparacin de poblaciones con muestras pequeas 384

    Ejemplo de software en e! que se utiliza el programa Excel 387

    Ejercicios 388 Pruebas para proporciones 389 Ejercicios 393 Muestras dependientes 394 Comparacin de rnuestras dependientes

    e independientes 397 Ejercicios 399 Resumen de! captulo 402 Simbologa 402 Ejercicios de! captulo 403 ejercicios.con1 408 Ejercicios con datos para computadora Comandos para computadora 41 O Respuestas al autoexamen 412

    409

    '12 J\11lisis de vmianza 4B !ntroduccin 414 la distribucin F 414 Comparacin de dos varianzas

    poblacionaJes 415 E'.jsrclcios 419

    XV

    Suposiciones para e! ANOVA 419 la prueba ANOVA Ejercicios 427 Inferencias acerca de pares de vaiores medios

    de tratan1iento 429 Ejercc!os 43i AnHsis de varianza en dos direcciones 433 Ejercicios Resumen del captulo 438 Simbologia 440 Ejerc!cios del captulo 440 ejercicios.con1 445 Ejercicios con datos para computadora Comandos para computadora 447 Respuestas al autoexamen 449

    Repasode los capr~u!os-10- -12 450 G'!osario 451 Ejercicio$ 452 Gasas 454

    Capiiulo

    13 Regresin lineal y conefacin 456 Introduccin 457 Qu es un anlisis de correlacin? 457 Coeficiente de correlacin 460 Coeficiente de determinacin 465

    Una advertencia 465 Ejercicios 436 Prueba de significancia de! coeficiente

    de correlacin 468

    ,-1 -Anlisis de regresin 470 -"Principio de mnimos cuadrados 471 -.',-Trazo de la lnea de regresin 473

    Ejercicios 474 .. El error estndar de estirnacin 476

    ? Consideraciones bsicas para !a regresin !inea.I 479

    EJercicios 480 ;;,~lnterva!os de confianza y de prediccin

    446

    481

  • XVl

    Ejercicios Algo ms acerca del coeficiente de

    determinacin 485 Ejercicios /i.87 Relaciones entre el coeficiente de correlacin,

    el coeficiente de determinacln y el error estndar de estimacin 488

    Ejercicios f.!.SG Resumen del captulo 491 Simbologa 492 Ejercicios del captulo 493 ejercicios.com 497 Ejercicios con datos para computadora 498 Comandos para computadora 499 Respuestas al autoexamen 50i

    Captulo

    "14 Anlisis de regresin y correlacin i11ltiples 502 Introduccin 503 Anlisis de regresin mltiple 503

    507 Error estndar mltiple de estimacin Hiptesis para la regresin mltiple y !a correlacin mltiple 51 O

    La labia ANOVA 511 E.jetck:ios v 'J 0 Evaluacin de !a ecuacin de regresin

    509

    514 Uso ele un diagrama de dispersin S 4 Matriz de correlacin 514 Prueba global: verificacin de la validez del modelo de regresin mltiple 515

    Evaiuacin de cada uno de los coeficientes de regresin 517

    Variables cualitativas independientes 520 Ejetc1cios 523 Anlisis de residuales 523 Resurnen del captuio 526 Simbologa 527 Ejercicios del captulo 527 ejercicios.com 539 Ejercicios con datos para computadora 540 Comandos para computadora 54i

    Respuestas al autoexamen 543

    Captulo

    15 J\!Itodos no paramhicos Pt:blic(gciou1es cle ii ctJ.cldrll(

  • Col!enido

    Ejerc::ic:os 5~JO Prueba de rangos con signo de Wilcoxon 590

    Prueba de suma de rangos de Wilcoxon 596

    Prueba de Kruskat-Wallis: anlisis de varianza por rangos 600 Ejerc~cios 604 Correlacin rango-orden 605 Prueba de la significancia de rs 607 F::jercicJcJS 60[3 Resumen del captulo 609 Silnbologa 61- Ejercicios dei captulo 6i i ejercicios.com 613 Ejercicios con datos para computadora 614 Comandos para computadora 615 Respuestas a! autoexamen 617

    Capitulo

    11 Control estadstico de calidad 622 introduccin 623 Breve historia del control de calidad 623 Causas de variacin 625 Diagramas de diagnstico 626

    Diagramas Pareto 626 Diagrama de causa y efecto (o diagrama

    de espinazo de pescado) 628 630

    Objetivo y tipos de los diagramas de control de calidad 630

    Diagramas de control para variables 631 Diagrama de amplitudes de variacin 634

    Ejemplos de situaciones bajo control y fuera de control 636

    E.jercicios !338

    Captulo

    XVH

    Diagramas de control de atributos 638 Diagrama de porcentaje de defectos 639 Diagrama de e con barra 640

    ~/luestreo de aceptacin 642

    Resu1nen del captulo 645 Simbologa 646 Ejercicios de! captulo 647 Comandos para computadora 651 Respuestas al autoexamen 654

    655 Introduccin 656 Nmeros ndice simples 656 Por qu convertir datos en ndices? 659 Obtencin de los nmeros ndice 660 Ejerck:!o.s 661 ndices no ponderados 662

    Promedio simple de ndices de precios 662 ndice agregado simple 663

    ndices ponderados 663 ndice ele precios de Laspeyres 664 ndice de precios de Paasche 665 ndice ideal de Fisher 667

    ndice de valor 669 Ej2rccios 670 ndices para propsitos especiales 670

    ndice de precios al consumidor 675 Usos especiales del ndice de Precios al Consumidor 676

    Desp!azamiento de !a base 679

    Resumen del captulo Ejercicios del captulo ejercicios.com 687

    682 683

    Comandos para computadora 687 Respuestas al autoexamen 688

  • XVlll

    Captulo ~(\1 s ' ru :;;! eries .Je tiern1Jo

    y pronsticos 689 Introduccin 690 Componentes de na -serie de tiempo 690

    Captulo

    Tendencia secular 690 Variacin cclica 692 Variacin estacional Variacin irregular Tendencia lineal

    693 693

    694 Mtodo de mnimos cuadrados 695

    Trazo ele la recta 696 Estimacin 697

    Mtodo del promedio mvil 699 Tendencias no lineales 703 F:'.jercicios 705 Variacin estacional 705

    Determinacin de un ndice estacional

    Desestacionalizacin de datos 7i 2 Utilizacin de datos desestaciona!lzados para pronstico 713

    Resumen del captulo 716 Ejercicios de! captulo 717 ejercicios.com 723 Ejercicios con datos para computadora Con1andos para computadora 724 Respuestas al autoexamen 725

    1hTtro(!_t11cci]_1 a 1~1 teora de decisiones 726 Introduccin 727 Elementos de una decisin 727 Un caso referente a toma de decisin en condiciones de incertidumbre 728

    Tabla de ganancias 728 Ganancias esperadas 729

    EjerGicios

    706

    723

    Prdida de oportunidad 731 Ejercicios 732

    Prdida esperada de oportunidad 732

    Estrategias de deploracin rnaxirnn, maximax y minimax 733

    Valor de la informacin perfecta 734 Anl!sis de sensibHidad 736 t:YO

  • Cl~!CO Diferenciar entre los nive!es de medicin nominal, ordinal, de intervalo y de razn.

    SEIS Definir los trminos mutuamente excluyente y exhaustvo.

  • 2 Captulo 1

    Introducci11 Hace ms de 100 aos, H. G. Wells, historiador y autor ingls, seal: "Algn da el conoci-miento estadstico ser tan necesario para ser un buen y eficiente ciudadano, co1110 lo es sa-ber leer." En ese momento no mencion al sector empresarial porque !a Revolucin lndustria! estaba comenzando. Si tuviera que hablar.sobre el conocimiento estadstico en la actualidad, probablemente dira que "el conocirniento estadstico es necesario no slo para ser un buen y eficiente ciudadano, sino tambin para una toma de decisiones efectiva en varias reas de los negocios".

    El fallecido W. Edwards Deming, importante estadstico y expe1to en control de calidad, insista en que la educacin estadstica debera comenzar antes de la enseanza media su-perior. Le gustaba contar la historia de un nio de 11 a11os de edad que dise un diagrama de control de calidad para monitorear las llegadas a tiempo de su autobs escolar. Deming coment: "este nio tuvo un buen comienzo en la vida"_ Esperamos que este libro le propor-cione al lector una base slida de estadstica para su vida futura en la mercadotecnia, la ad-

    ministracin, la contabilidad, las ventas o cualquier otra rea de los negocios_

    Casi todos los das utilizamos los conceptos estadsti-cos en las diversas facetas de nuestra vida. Por ejemplo, al comenzar el da uno abre la llave de la ducha 6 regadera pa-ra probar la temperatura del agua y decidir si aade ms agua caliente o ms agua fra y, si la temperatura es idnea, empieza a baarse., Como segundo ejemplo, supongamos que se est en una tienda de comestibles decidiendo qu pizza congelada se va a comprar. Una de las empresas pro-ductoras de pizzas cuenta con un mostrador donde se ofre-cen pequeas pruebas de su producto_ Despus de probarlo, uno decide si. lo compra o no_ En ambos ejemplos, el del bao y el de la pizza, se toma una decisin y se elige un curso de accin basndose en una muestra.

    Las empresas enfrentan problemas similares. La Com-paa Kellogg debe asegurarse de que la cantidad prome-

    dio de cereal en el paquete de 25.5 gramos cumpla con las especificaciones de la etiqueta. Para hacerlo, selecciona muestras peridicas del rea de produccin y pesa el contenido.

    A nivel nacional, un candidato a la presidencia de Estados Unidos quiere saber qu por-centaje de electores en el estado de lllinois lo apoyar en la siguiente eleccin. Existen dife-rentes formas de saber esto: puede hacer que su equipo llame por telfono a todas las personas registradas en el padrn del estado y les pregunte por quin votarn. Puede salir l mismo a las calles de Chicago, detener a diez personas adultas y preguntarles por quin van a votar. Puede seleccionar en forma aleatoria a 2 000 electores del estado, hablar con ellos y, basndose en esta seleccin, realizar un clculo del porcentaje de personas que votarn por l en la eleccin. En este texto le mostraremos por qu motivo la tercera opcin es la mejor.

    Cmo definimos la palabra "estadstica"? Es un trmino que encontramos frecuentemente en nuestro lenguaje diario. En realidad tiene dos significados. En e! uso ms coml!n, la esta-dstica se refiere a informacin numrica. Como ejemplos de lo anterior tenemos el salarlo ini-cial promedio de los egresados de una licenciatura, el nlimero promedio de autornviles Ford vendidos mensualmente en el ao pasado en la Agencia Kistler de Autos Ford, el porcenta-je de estudiantes de Harvard que terminarn su educacin a nivel licenciatura, el nmero de n1uertes por a!coho!ismo durante el ltimo ao, la variacin en el Promedio Industrial Dow Jo-

  • La esttadstica eri accirn

    co_s. \V!l.limn G

  • 4 Capitulo 1

    ta". Recolectan datos de ventas pasadas de la compaa y calculan las ganancias futu-ras. Asimismo, antes de hacer una recomendacin, consideran otros factores como son: la demanda mundial esperada de los productos de la compaa, la fortaleza de la com-petencia, as como el efecto del nuevo contrato entre gerencia y sindicato.

    0 El departamento de mercadotecnia en Lever Brothers, compafia productora de artculos de jabn, tiene la responsabilidad de presentar recomendaciones acerca de la rentabilidad potencial de un nuevo gru-po de jabones faciales recin desarrollados con olor a frutas, como uva, naranja y pia. Antes de tomar una decisin final, realizarn pruebas en diferentes mercados. Esto quiere decir que los jabones podran promo-verse y venderse en Topeka, Kansas, y en Tampa, Florida. La empresa Lever Brothers tomar la decisin de introducir o no los jabones a nivel nacional, basndose en las pruebas de mercadotecnia en ambas regio-nes. ' El gobierno de Estados Unidos est interesado en las condiciones actuales de su economa y en la prediccin de las tendencias econmi-cas futuras. Realiza un gran nmero de encuestas para determinar la confianza del consumidor y las perspectivas ele la gerencia respecto a las ventas y la produccin en los siguientes doce meses. Cada mes se desarrollan ciertos ndices para evaluar la inflacin, como el ndice de Precios al Consumidor (descrito en el captulo 18). La informacin so-

    bre ventas en tiendas deparcamentales, compras de viviendas, movimiento de dinero, y produccin industrial, es tan slo una parte de los centenares de artculos que se utilizan como base de las proyecciones. Los bancos emplean estas evaluaciones para decidir su prima de prstamo; asimismo, la Junta de la Reserva Federal las utiliza para decidir res-pecto del nivel de control a colocar en el abasto de dinero.

    ' La gerencia debe tomar decisiones sobre la calidad del producto. Por ejemplo, los tala-dros automticos no hacen un barreno perfecto que siempre tenga 1.30 pulg de dime-tro cada vez que se taladra (a causa de desgaste de la broca, vibracin de la mquina y otros factores). Hay ciertas tolerancias permitidas, pero cuando el barreno es demasiado pequeo o muy grande, la produccin es defectuosa y no se pueden utilizar los produc-tos. El departamento de aseguramiento de calidad es el encargado de monitorear conti-nuamente la produccin utilizando tcnicas de muestreo (descritas en el captulo 17).

    Por qu estu~ff estadstica? Si se revisan los programas de estudio de una universidad, se descubrir que la educacin es-tadstica se requiere en muchos programas escolares. Por qu pasa esto? Cules son las diferencias en los cursos de estadstica que se imparten en una Facultad ele Ingeniera, en los Departamentos de Psicologa o Sociologa de una universidad, o en una Escuela de Adminis-tracin? La diferencia principal est en los ejemplos que se utilizan. Bsicamente, el conteni-do de !os cursos es el mismo. En una Escuela de Administracin interesan cosas como ganancias, horas de trabajo, y sueldos o salarios. En un Departamento de Psicologa intere-san los resultado.s de las pruebas, y en una Facultad de Ingeniera el inters puede centrarse en saber cuntas unidades se producen con una mquina en especial. Sin embargo, las tres reas desean saber lo que es un valor tpico y la cantidad de variacin que existe en la infor-macin. Es posible que tambin exista una diferencia en el nivel de matemticas necesario. Normalmente un curso de estadstica para ingenieros requiere del clculo diferencial. Los cur-sos de estadstica en escuelas de administracin y en la educacin bsica, generalmente se imparten a nivel de aplicaciones de la estadstica. Si se termin bien el curso de lgebra de la preparatoria, el lector podr manejar las matemticas que se presentan en este texto.

    Entonces, por qu es necesario estudiar estadstica en tantas carreras? La primera razn es que en todos lados encontramos informacin numrica. Si se revisan peridicos (como

  • Ejemplos de las razones para estudiar estadstica.

    5

    USA Today), revistas de informacin (como Time, Newsweek, y US, News and World Fieport), revistas de negocios (Business Week, o Forbes), publicaciones de inters general (Peop/e), re-vistas femeninas (Home and Garden), o revistas de deportes (Sports 11/ustrated o ESPN The lVlagazine), se ver bombardeado con informacin numrica.

    A continuacin presentamos algunos ejemplos: 0 La empresa General E!ectric repo11 que en 1999 sus ganancias fueron de $111 630 000

    (dlares), mayores que los $100 469 000 que obtuvo en 1998, El precio de cierre al final de 1999 de una accin de ttulos comunitarios fue $154,75, superior al de $102,00 que tena la accin al final de 1998.

    0 Los egresados de posgrado del Programa de Maestra en Adn1inistracin de Empresas en la Universidad de Notre Dame, contaron con un sueldo promedio inicial de $54 000 dlares y 91 % de ellos consiguieron trabajo a los tres meses de la graduacin.

    ' En Estados Unidos hay 26.4 millones de jugadores de golf cuya edad es igual o superior a 12 aos. Aproximadamente 6.1 millones son jugadores vidos, es decir, juegan en 25 o rns circuitos por ao. El jugador de golf tpico es hombre, tiene 40 aos, percibe un suel-do de 68 209 dlares y juega 21.3 circuitos por ao.

    En Estados Unidos se consume mayor cantidad de caf que en cualquier otro pas; en promedio, i .75 tazas diarias por persona.

    Ctrio podernos determinar s las conclusiones presentadas son razonables? Acaso las muestras fueron suficientemente grandes? Cmo se seleccionaron las unidades de la muestra? Para poder ser un consumidor capacitado a fin de entender esta infor111acin, se necesita poder leer diagramas y grficas, y entender el anlisis de la Informacin numrica. La comprensin de los conceptos bsicos de la estadstica ser de gran ayuda.

    La segunda razn para tomar un curso de estadstica es que las tcnicas estadsticas se utillzan para tomar decisiones que afectan nuestra vida diaria. Esto quiere decir que influyen en nuestro bienestar personal. He aqu algunos ejemplos:

    '? Las compaas de seguros utilizan anlisis estadsticos para establecer las tarifas de los seguros de casa, automvil, vida y salud. Existen tablas que indican la probabilidad de que una mujer de 25 aos de edad viva un ao ms, cinco aos ms, etctera. Las pri-mas de ios seguros de vida se establecen basndose en estas probabilidades.

    ' La Agencia de Proteccin al Medio Ambiente (en EUA) est interesada en la calidad del agua en el Lago Erie. Peridicamente toman muestras del lquido para establecer el nivel de contaminacin y mantener el nivel de calidad.

    "' Los investigadores mdicos estudian las tasas de curacin de enfermedades, basndo-se en el uso de diferentes medicamentos y distintas formas ele tratamiento. Por ejemplo, cu! es el efecto de trc:tar cie1io tipo de dao a la rodll!a con ciruga o con terapia fsica? Si uno toma una aspirina diaria, esto reducir el riesgo de sufrir un ataque cardiaco?

    La tercera razn para tomar un curso de estadstica es que el conocimiento de los rnto-dos estadsticos ayuda a entender por qu se toman ciertas decisiones, y aporta una mejor comprensin respecto a la -forma en la que nos afectan las decisiones.

    Sin importar el tipo de trabajo que se elija, el lector tendr que enfrentarse con la toma de decisiones, para !o cual una comprensin del anlisis de datos ser ele gran ayuda. Para po-der tomar una decisin basada en la informacin, se necesita:

    1. Determinar si la infor111acin existente es adecuada o si se requiere informacin adicional. 2. Reunir inforn1acin adiciDnal, si es necesario, de tal forma que no haya resultados errneos. 3. Resumir la informacin de modo til e informativo. 4. Analizar la informacin disponible. 5. Sacar las conclusiones y realizar las inferencias necesarias, al tie111po que se evala el

    riesgo de llegar a una conclusin incorrecta.

  • 6 Capitulo 1

    Los mtodos estadsticos que se presentan en este texto le proporcionarn un marco de trabajo en el procedimiento de la toma de decisiones.

    En resumen, existen por lo menos tres razones para estudiar la estadstica: (1) los datos se encuentran en todos lados, (2) las tcnicas estadsticas se utilizan para la toma de muchas decisiones que afectan nuestra vida, y (3) sin importar su lnea de trabajo futura, usted ten-dr que ton1ar decisiones que involucran datos. El conocimiento de los mtodos estadsticos ayudar a tomar esas decisiones con mayor efectividad.

    'li'' ] l' . i ~P'.:::~_::::_eS[j~il~I~~ F s r-1r~; Qt: "":-1 "lF('CJ/~-.-,t1'110 -"-',,_ca._~-"'"-'"-'"--"-'~..:~ -'__-''e~ Generalmente, el estudio de la estadstica se divide en dos categoras: estadstica descripti-va y estadstica inferencia!. La definicin de estadstica que se present con anterioridad menciona la "organizacin, presentacin, an!isis ... de datos". Esta rea de la ciencia esta-dstica se conoce comnmente como estadstica descriptiva.

    JEsradfoticafl_escriptiva ConjiJn!Q,dE) mtodos paraorganizar, resumir y presentar los dalos de manera informativa .. /

    /''

    Por ejemplo, cuando el gobierno de Estados Unidos reporta que la poblacin de ese pas era de 179 323 000 en 1960; 203 302 000 en 1970; 226 542 000 en 1980; 248 709 000 en 1990, y 265 000 000 en 2000, presenta informacin que pertenece al carnpo de la estadsti-ca descriptiva. Seria el rnismo caso si se calcula el porcentaje de crecimiento de una dcada a la siguiente. Sin embargo, no sera el caso si se utilizan estos datos para predecir la pobla-cin de Estados Unidos en el ao 2010, o el porcentaje de crecimiento de 1990 a 201 O.

    Los siguientes son otros ejemplos de estadstica descriptiva. En Estados Unidos hay 42 796 millas de carreteras interestatales. El sistema interestatal representa slo 1 % de las carreteras del pas, pero transporta 20% de lodo el trfico. La carretera interestatal ms larga es la 1-90, que va de Bos!on a Seattle, y tiene una longi-tud de 3 081 millas. La ms corta es la 1-878 en la ciudad de Nueva York, que mide 0.70 millas. Alaska no tiene carreteras interestatales. Texas posee la mayor cantidad de millas en carreteras interestatales: 3 232 millas, y Nueva York tiene el mayor nmero: 28 carre-teras interestatales. De acuerdo con la Oficina de Estadstica Laboral, el salario semanal promedio tuvo un au-mento de 3.7%, ajustado estacionalmente, de rnarzo de 1999 a marzo de 2000. Despus de la deflacin y mediante el ndice de Precios al Consumidor, el salario semanal prome-dio disminuy 0.2%. Antes de los ajustes debido a la variacin estacional y la inflacin, el salario semanal promedio fue de $465.80 (dlares) en marzo de 2000, en comparacin con $448.70 en el ao anterior. El Servicio de Recaudacin de Impuestos report que el tiempo promedio para archivar el formato 1040EZ era de 2 horas y 46 minutos. Lo anterior se puede comparar con las 7 horas y 34 rninu!os que toma archivar el formato 1040A, y las 1 O horas y 53 minutos pa-ra el formato 1040. El tiempo promedio para realizar un reembolso mediante un sistema TeleFile es de 37 minutos.

    Los conjuntos de dalos no organizados (corno el censo de poblacin, los ingresos sema-nales de miles de programadores en informtica y las respuestas individuales de 2 340 elec-tores registrados acerca de su seleccin para el presidente de Estados Unidos) son de poco valor. Sin embargo, hay tcnicas estadsticas para organizar este tipo de informacin de ma-nera significativa. Algunos datos pueden organizarse en una distribucin de frecuencias. (El procedimiento para hacer esto se expone en el captulo 2.) Suelen utilizarse diversos tipos de

  • Razones para el mues-treo.

    Qu es la Eslads!ica? 7

    grficas para describir !os datos; en el captulo 2 tambin se presentan varias formas bsi-cas de grficos.

    Determinadas medidas de tendencia central, como la media, pueden calcularse para des-cribir el valor central de un grupo de datos numricos. En el captulo 3 se presentan estos promedios. Pueden utilizarse varias medidas estadsticas para describir qu tan estrecha-mente se agrupan los datos con respecto a un promedio. Estas medidas se analizan en el captulo 4.

    '' > ]' I' . e . 1 a:!.,st-a( 1s1ca 1NT~ere]_1c1.ad Otra rea estadstica es !a estadstica inferencia!, tan1bi11 denominada inferencia estads-tica y estadstica inductiva. El principal objetivo de la estadstica inferencia! es encontrar al-go sobre una poblacin basndose en una muestra tomada de esa poblacin. Por ejemplo, con fundamento en una encuesta realizada por el gobierno federal y publicada en el peridi-co USA Today, solamente 46% de alumnos en el (rltimo grado de la educacin media supe-rior pueden resolver problemas relacionados con fracciones, decin1ales y porcentajes. Adems, slo 77% de los rnismos alumnos evaluaron correctamente el costo de la sopa, las hamburguesas, las papas a la francesa y los refrescos en el men de un restaurante. Ya que estas son inferencias relativas a la poblacin (todos los estudiantes del ltimo grado de tal instruccin) basadas en una n1uestra de datos, se denominan estadstica inferencia!.

    Esfadsti.ca iilferencial Conjunto de mtodos utilizados para saber algo acerca de una poblacin, basndose en una muestra ..

    . . . ----,~-',

    Observe las palabras "poblacin" y "muestra" en la definicin de la estadstica inferencia!. Frecuentemente se hace referencia a ta poblacin que vive en Estados Unidos o a ta pobla-cin de mil millones que reside en China. Sin embargo, en estadstica la palabra poblacin tie-ne un significado ms amplio. Una poblacin puede constar de individuos, por ejemplo tos estudiantes inscritos en ta Universidad del Estado de Utah, los alumnos de la clase de conta-bilidad 201. o todos los reclusos en la prisin de Attica. Una poblacin tambin puede incluir objetos, como las llantas XB-70 producidas durante una semana en la compaa Cooper Tire and Rubber, en Findlay, Ohio. o todas las truchas que se encuentran en un estanque. Una po-blacin tambin puede estar formada por un grupo de medidas, como podran ser los pesos de todos los jugadores de la lnea defensiva del equipo de futbol americano de la Universidad Estatal Penn, o las estaturas de los jugadores de basquetbol de la Conferencia del Sudeste. Por tanto, una poblacin, en el sentido estadstico, no siempre se refiere a personas.

    Poblacin Conjunto de todos los posibles individuos, objetos o medidas de inters.

    Generalmente se toma una muestra de una poblacin para inferir algo acerca de la misma.

    Mues!J'a .Urta.porcn; rn parte, dela.pblacin de inters:

    Por qu se toma una muestra en vez de estudiar a cada miembro de la poblacin? Una muestra de electores registrados es necesaria por el a!to costo que representara comunicar-se con millones de electores antes de una eleccin. A! someter a una prueba el contenido de humedad en el trigo, se destruye el mismo, por tanto tomar una muestra es de suma impor-tancia. Si los catadores de vino lo probaran todo, no habra vino disponible para su venta. Se-ra fsicamente imposible que unos cuantos bilogos marinos capturaran y marcaran a todas las focas del ocano. (Estas y otras razones para el muestreo se presentan en el captulo 8).

    Como se observ, el hecho de tomar una muestra para obtener informacin acerca de una poblacin es una prctica comn en los negocios, la agricultura, la poltica y el gobier-no, como lo indican los siguientes ejemplos:

  • 8

    Se recomienda realizar los ejercicios de autoe-xamen.

    Variable cualitativa.

    Capflo i

    0 Las en1presas de televis~n constantemente monitorean la popularidad de sus programas contratando a la empresa Nieisen y a otras organlzaciones para conocer las preferencias de los telespectadores. El ndice de televidencia (rating) de estos programas se utiliza pa-ra establecer los precios de la publicidad y cancelar programas. ~ Una empresa de contabilidad pbnca selecciona una muestra aleatoria de 100 facturas y

    verifica que sean correctas. En cinco de las mismas se encontraron errores, por tanto la empresa estima que 5% de toda la poblacin de facturas contiene algl1n error.

    "' Una muestra aleatoria de i 260 egresados de la carrera de contadui-a con un programa de cuatro aos de estudios mostr que su salario inicial promedio fue $32 694 (dlares). Por tanto, se llega a la conclusin de que para estudiantes egresados de una escuela de contadura (cuyo programa de estudios abarque cuatro aos) el promedio de sueldo al comenzar actividades laborales es de $32 694.

    A continuacin se presenta la relacin entre una n1uestra y una poblacin.

    -

    Poblacin Todas las par:es

    Muestra Las pa1ies se seleccionan

    de !a pob!acln

    En seguida se presenta un problema de auloexamen. En cada captulo se expone un cierto n-mero de estos problemas, los cuales sirven para poner a prueba la comprensin del lector res-pecto al material precedente. Al final del capitulo se indican la respuesta y el mtodo de solucin. Se recomienda resolver cada uno de los problemas y despus verificar la contestacin.

    Las respuestas se encuentran al final del captulo. La c111paa rvlarket Facts con baSe en Chicago pidi a una muestra de 1 960 consun1idores que probaran un platillo de pescado congelado producido por la empresa Morton, y denomina-do Fish Delight De los 1 960 consumidores consultados, 1 176 dijeron que compraran el plati-llo si se pusiera a !a venta. a) Qu informara Market Facts a Morton Foods respecto a la aceptacin del Fish Delight? b) Se trata de un ejemplo de estadstica descriptiva o de estadstica inferencia!? Jushfique su

    respuest_a.

    Existen dos tipos bsicos de datos: (1) los obtenidos a partir de una poblacin cualitativa, y (2) los que resu!tan de una poblacin cuantitativa. Cuando la caracterstica o variable en estudio es no numrica, se la denomina variable cualitativa o atributo. Ejemplos de estas variables son:

  • Variable cuantitativa

    La etadstica en accJln

    estdstiCa.

    Qu es !a tstadstica? 9

    gnero sexual, religin, tipo de automvil, estado o lugar de nacimiento, y color de los ojos de la persona. Cuando la informacin estudiada es cualitativa, generalmente interesa saber Cun-tas o qu proporcin entra en cada categora. Por ejemplo, qu porcentaje de la poblacin tie-ne ojos azules? Cuntos catlicos y cuntos evanglicos hay en Estados Unidos? Qu porcentaje de la cantidad letal de automviles vendidos el mes pasado fue de la marca Buick? Normalmente, los datos cualitativos se resumen en diagramas o grficas de barras (captulo 2).

    Cuando !a variable estudiada se puede expresar numricamente, se ... d8nomina variable cuantitativa, y la poblacin se conoce como poblacin cuantitativa. Ejemplos de variables cuantitativas son: el saldo en una cuenta de cheques, la edad de los presidentes de compaas, la duracin ele un acumulador de automvil (42 meses), las velocidades de los vehculos que cir-culan por la carretera interestatal 5, cerca de Seattle, o bien e! 11n1ero de hijos en una familia.

    Las variab!es cuantitativas pueden ser discretas o continuas. Las variables discretas pueden asumir slo ciertos valores, y generalmente existen "brechas" o "huecos" entre ellos. Ejemplos de variables discretas son: el nmero de recmaras en una casa ('I, 2, 3, 4, etc.), la cantidad de automviles que pasan por la caseta de cobro en la carretera 1-75 en Berea, Ken-tucky, en una hora (16, 19, 30, etctera), y el nmero de estudiantes en cada grupo del cur-so de estadstica (25 en el grupo A, 42 en el grupo 8, y 1 sen el grupo C). Se cuenta el nmero de automviles que llegan a Berea en la carretera interestatal 75, y se evala la cantidad de estudiantes de estadstica en cada grupo. Ntese que una casa puede tener 3 o 4 recma-ras, pero no 3.56 dormitorios. Por tanto, existe una "brecha" entre los posibles valores. Por lo comn, las variables discretas son resultado de un conteo.

    Las observaciones de una variable continua pueden tomar cualquier valor dentro ele un intervalo determinado. Ejemplos de variables continuas son: la presin clel aire en un neum-tico de automvil y el peso ele un cargamento de granos (que segn la precisin de las bs-culas podra ser igual a 15.0, 15.01, 15.013 toneladas, etc.). La cantidad de cereal en una caja y el tiempo de vuelo para transportarlo por va area desde Orlando hasta San Diego, son otras variables de indole continua. El vuelo de Orlando a San Diego puede tomar 7 horas y 30 minutos, o 7 horas con 30 minutos y 45 segundos, o bien 7 horas con 30 minutos y 45.1 segundos, dependiendo ele !a precisin cronomtrica. Las variables continuas resultan gene-ralmente de medir algo.

    Los datos pueden clasificarse de acuerdo con los niveles de medicin. Generalmente, e! ni-vel de medicin de un dato determina los clculos que se pueden realizar para resumir y pre-sentar la informacin, y las pruebas estadsticas que pueden desarrollarse. Por ejemplo, hay seis colores de dulces en una .bolsa de lunetas M&M. Supongamos que al color caf le asig-namos el valor 1, al amarillo el 2, al azul 3, al naranja 4, al verde 5, y al rojo 6. Para una bol-sa de lunetas se suman los valores asignados a los colores, y el resultado se divide entre el nmero de dulces, resultando que el color medio es 3.56.

    Esto significa que el color promedio es azul o naranja? Como segundo ejemplo tenen1os una co_mpetencia de carreras en la )Sta de una escuela. Hay 8 competidores en la carrera de los 400 metros. Se repo1ia el orden de llegada y se indica que el valor promedio en el or- den citado es 45. Qu indica este valor promedio en el orden de llegada? En ambos casos, el nivel de medicin no se ha utilizado en la forma adecuada.

    Existen cuatro niveles de medicin: nominal, ordinal, de intervalo y de razn. El nivel "ms bajo", o ms primitivo, es el nominal. El ms alto, o el que proporciona la mayor cantidad de inforn1acin acerca de la observacin, es el nivel de medicin de razn.

    Datos En el nivel nomina! de la n1edicin, las obsetvaciones solamente se pueden clasificar o con-tar. No existe alg1n mden especfico entre las clases. Un ejemplo del nivel nominal de medi-

  • 10 Capit"lo 1

    cin es la clasificacin en seis colores de las lunetas IVl&M. Simplemente se clasifican las lu-netas segn el color. No hay un orden natural. Esto quiere decir que primero se puede repor-tar la cantidad de lunetas ele color caf, o las anaranjadas, o las de cualquier otro color. El gnero sexual es otro ejemplo del nivel de medicin nominal. Supngase que se cuenta el nmero de estudiantes que asisten a un juego de futbol utilizando su identificacin escolar y se reporta cuntos son hombres y cuntos son mujeres. Se puede reportar primero la canti-dad de varones o la de fminas. Para e! nivel nominal de medicin la nica medicin posible es un conteo. La tabla 1.1 muestra un desglose del uso de telelona de larga distancia en Es-tados Unidos. Este es el nivel nor1inal de n1edicin porque se cuenta e! nl1mero de veces que se utiliz cada compaila que proporciona servicio de larga dlstancia. No conviene distraer-se con el hecho de haber resumido los datos para indicar cuntas veces se utiliz a un pro-veedor de los servicios de larga distancia.

    il\Bll\ 1.1 Uso de la telefona de larga distancia segn el proveedor del servicio.

    Compaa Nmero de llamadas Porcentaje AT&T 108115800 75 MCI 20 577 310 14 Sprint 8 238 740 6 Otros 7130620 5

    Total 144062470 100

    La forma en que se presentan los nombres de las compaas ele la tabla 1.1 puede ser dife-rente. Esto es, se poda haber colocado primero a MCI, luego a Sprint, etctera. Bsicamen-te esto indica la caracterstica principal del nivel nominal ele medicin: no hay un orden especfico entre las categoras.

    Tales categoras son mutuamente excluyentes, lo cual quiere decir que, por ejemplo, una llamada en especial no puede iniciarse tanto en AT&T como en MCI.

    Muhrn1mente exefoyenfo Propiedad d un conjJntO de Categoras, irpplica tUfLJrl~ persona, objeto o medicin se ha de incfuir en slo. una categ()ra.

    Las categoras en la tabla 1.1 tambin son exhaustivas, lo que significa que cada miem-bro de la poblacin, o de la muestra, debe aparecer slo en una ele las categoras. Por tan-to, si la llamada no se origin en AT&T, MCI o Sprint, entra en la categora "Otras".

    Exhausl:lyof'ropie?addeurl conjunto d~ .. categor~s.qlle implica qu., cadaindividuo, objeto o medicin debeaprecer en .slo una categora,

    Para poder procesar los datos acerca del uso del telfono, el gnero sexual, el empleo por industria y otras reas, generalmente se codifican las categoras en 1, 2, 3, etc.; en este caso el 1 representara AT&T; el 2, MC:, y as sucesivamente. Esto facilita el conteo por computa-dora. Sin embargo, haber asignado nmeros a las diferentes empresas no permite manipular los nmeros. Por ejemplo, 1 + 2 no es igual a 3; esto es, AT&T + MCI no es igual a Sprint En resumen, los datos de nivel nominal tienen las siguientes propiedades:

    1. Las categoras para los elatos son mutuamente excluyentes y exhaustivas. 2. Las categoras para los datos no tienen un orden lgico.

    Datos de nivel ordinal El siguiente nivel de datos es el nivel ordinal. La tabla 1.2 presenta las calificaciones dacias por !os estudiantes al profesor James Brunner en un curso de "Introduccin a las Finanzas".

  • Qu es la Estadislica?

    Cada estudiante respondi a la siguiente pregunta: "En general, cmo califica al profesor de este curso?" Esto muestra el uso de la escala de medicin ordinal. Una categora es "n1s al-ta" o "mejor" que la siguiente. E!lo quiere decir que "Exce!ente" es mejor que "Bueno", "Bue-no" es mejor que "Regular", etctera. Sin embargo, no es posible distinguir algo referente a la magnitud de la diferencia entre los grupos. Acaso la diferencia entre "Excelente" y "Bueno" es la misma que la existente entre "Malo" y "Muy malo"? Es algo que no se puede responder. Si "Excelente" equivale a 5 y "Bueno" a 4, podemos concluir que la calificacin de "Excelen-te" es mejor que "Bueno", pero no se puede sumar una calificacin de "Excelente" y otra de "Bueno" y obtener un resultado significativo. Adems, no es posible concluir que una califica-cin de "Bueno" (con valor de 4) sea necesariamente el doble de buena que "Malo" (con va-lor de 2). Lo nico que puede concluirse es que una calificacin de "Bueno" es mejor que la de "Malo". Lo que no es posible elucidar es qu tanto "mejor" es una calificacin que la otra.

    TPJ~lA l .2 Calificacin de nn profesor de finanzas.

    Ga!ificacin Frecuencia Excelente 6 Bueno 28 Regular 25 Malo 12 Muy malo 3

    En resumen, las propiedades del nivel de datos ordinal son:

    1. Las categoras para los datos son mutuamente excluyentes y exhaustivas. 2. Dichas categoras para los datos se clasifican por intervalos, o se ordenan de acuerdo

    con las caractersticas particulares que poseen.

    Datos C1e 11_ivel de :h1terva1o El nivel de intervalo de la medicin es el siguiente nivel en orden ascendente. Incluye todas las caractersticas del nivel ordinal pero, ade111s, la diferencia entre los valores tiene un ta-mao constante. Un ejemplo del nivel de medicin de intervalo es la temperatura. Por ejem-plo supngase que las temperaturas ms altas en tres das consecutivos de invierno en la ciudad de Bastan son 28, 31 y 20 grados Fahrenheit (F). Estas temperaturas suelen ordenar-se fcilmente, pero ta111bin se puede determinar la diferencia entre las mismas. Esto es po-sible gracias a que un "grado Fahrenheit" representa una unidad constante de medicin. Las diferencias iguales entre dos temperaturas son las 111ismas, sin importar la posicin en la que se encuentren en la escala. Esto quiere decir que la diferencia entre 1 O F y 15 Fes 5, y la diferencia entre 50 y 55 grados tambin es 5 grados. Es importante sealar que o es sola-mente un punto de la escala, y no representa la ausencia de la condicin. "Cero grados Fah-renheit" no representa la ausencia de calor, sino que indica que "hace fro". De hecho, O "F corresponde a un valor de -18 grados aproximadamente en la escala Celsius.

    Las propiedades de la escala de intervalo son:

    -1. Las categoras para los datos son mutuamente excluyentes y exhaustivas. 2. Las categoras en cuestin estn ordenadas de acuerdo con la cantidad de la caracters-

    tica que poseen. 3. Diferencias iguales en la caracterstica se representan por diferenclas iguales en la 111edi-

    cin.

    Hay pocos ejemplos de la escala de medicin de un intervalo. La temperatura, antes men-cionada, es uno de los ejemplos. La medida de calzado es otro.

  • 12 GapllllO 1

    Datos ele Prcticarr1ente todos los datos cuantitativos son el nivel de razn de la medicin. Ei nivei de razn es el nivel de medicin "111s alto". Esta medida tiene todas las caractersticas del ni-vel de iniervalo, pero adems el punto O s tiene significado, y la razn (o cocienie) entre dos nmeros tambin es significativa. Ejemplos de la esca!a de razn son los salarios, las unida-des de produccin, e! peso, los.cambios en !os precios de !as qcciones, la distancia entre un conjunto de oficinas y la estatura. El dinero es un buen ejemplo. Si se tienen O dlares, en-tonces no se poseen fondos. El peso puede ser otro ejemplo, ya que si ia escala de una bs-cula est en cero, hay una total ausencia de peso. La razn entre dos nl1meros tambin tiene significado. Si una persona gana $30 000 dlares al ao vendiendo seguros, y otra gana $60 000 al ao vendiendo automviles, la segunda persona gana el doble de lo que percibe la primera. La razn o cociente vale 2.

    Las propiedades del nivel de razn de los daios son:

    i. Las categoras de los datos son mutuamente excluyentes y exhaustivas. 2. Dichas categoras tienen un intervalo u orden de acuerdo con la cantidad de la caracte-

    rstica que poseen. 3. Diferencias iguales en la caracterstica estn representadas por diferencias iguales en los

    nmeros que se han asignado a las categoras mencionadas. 4. El punto (o valor) O representa la ausencia de la caractestica.

    La tabla 1.3 presenta el uso de !a escala de medicin de razn. Se indican los ingresos de cuatro combinaciones de padres e hijos.

    TA[]Lj}, !J.3 Con1binacin de Jos ingresos (en dlares) de padres e hijos. Nombre de ia familia Ingresos del padre Ingresos de! hijo Jimnez 80 000 40 000 Blanco 90 000 30 000 Rulz 60 000 120 000 Snchez 75 000 130 000

    Observe que en la familia Jimnez ei padre gana el doble de lo que gana su l1ijo. En la fami-lia Ruiz el ingreso del hijo es el doble del ingreso de su padre.

    El diagrama 1.2 presenta las caractersticas principales de los diferentes niveles de medi-cin.

    1

    ____ [ ___ _ [ Nominal l l_~_o_r"'di_n,_a1_._.-:~S]__ .. .~

    ~L ____ _ 1 o.rde.na.los .. '.l .. ~..to. $ ... . . .. . ] por Jerarquias

    '--'--"--D_e __ in,te_rv_a_lo~_.J e . Dern_. _._ ._._

    L._.2ri~:~~ca

    ~---Nmero en !a ca[f:r{~;eta:de n jugador de futbol .~arca de un automvil e; Calificacin- ele _un esfudiant.'en sli ciase .e. P_o?i_cin det equipo en el Pacrn D~,.;l-&;fl;p;~J!jl, J.2 H.esu1nen de las caractersticas de los niveles de tnedicin.

    .

    E! O y et cociente entr_e valores tienen sighificadb

    ..

    1

    .Nmero de pacle.n~ atncldos J.

    e Nmero d_e. llam._ ac.!a_s ele venta realizadas

    w Distancia a la escuela

  • Qu es la Estadistica?

    Cul es el nivel de medicin que reflejan los siguientes datos? a) Las edades ele los adultos que escuc.han las casi 700 estaciones de radio con canciones

    "de antao" en Estados Unidos son:

    35 29 41 34 44 46 42 42 37 47 30 36 41 39 44 39 43 43 44 40 47 37 41 27 33 33 39 38 43 22 44 39 35 35 41 42 37 42 38 43 35 37 38 43 40 48 42 31 51 34

    b) En una encuesta a 200 propietarios de automviles de lujo, i 00 eran de California, 50 de Nueva York, 30 de lllinois, y 20 de Ohio.

    Las respuestas a los ejercicios con n1nero rnpar se encuentran al final del libro. i. Cul es el nivel de medicin para cada una de las siguentes variables?

    a) Promedios de calificacin de los estudiantes. b~ La distancia que reco-ren Jos estudiantes para llegar a clases. e) Calificaciones de los alumnos en el primer examen de estadstica. d) Clasificacin de los alumnos de acuerdo con el estado donde nacieron. e) Clasificacin de alumnos segl1n el ao escolar que cursan. f} Cantdad de horas de estudio por semana de los estudiantes.

    13

    2. Cul es el nivel de medicin en los siguientes conceptos relacionados con el negocio de pu-blicacin de peridicos? a) La cantidad de diarios vendidos cada domingo durante i998. b} El nmero de empleados en cada departamento; por ejen1plo, editorial, publicidad, depor-

    tes, etctera. e) Un resu111en de la cantidad de perdcos que se venden por pas. d) El nmero de aos que cada empleado ha trabajado en el medio periodstico.

    3. Busque en la ltlma edicin de su peridico local, ejemplos de cada uno de los niveles de me-dicin. Escriba un breve resumen acerca de sus observaciones.

    4. Para cada uno de los pur.tos siguientes, determine si el grupo utilizado es una muestra o una poblacin: a) Los participantes en e! estudio de un nuevo medicamento para la diabetes. b) Todos los conductores que se hicieron acreedores a una multa por conducir a exceso de

    velocidad en la ciudad ele f

  • l4

    Un promeclio puede no rep1esentar la totalidad de los elatos.

    Estudio de los mtodos de muestreo.

    Capll!lo 1

    dejan fuera los datos que pueden perjudicar su posicin. Una de las metas principales de es-te texto es hacer que el lector sea un consumidor de informacin mucho ms crtico. Al ob-servar grficas o datos en alg1n peridico, revista o programa de televisin siempre hay que preguntarse: qu trata de decirme? Tiene el autor alg(1n propsito "especial"? A continua-cin presentamos varios ejemp!os ele abusos en el anlis!s estadstico.

    El trmino promedio se refiere a las diferentes medidas de tendencia central que se anali-zarn en e! captulo 3. Para la mayora de las personas, un promedio se obtiene sumando los valores considerados y dividiendo la suma entre el n(1mero de ellos. Por tanto, si un agente de bienes races dice a su cliente que la casa promedio en cierta subdivisin se vendi en $150 000 (dlares), se supone que $150 000 es el precio de venta representativo de tocias las casas. Pero supngase que soamente hay 5 casas y se vendieron en $50 000, $50 000, $60 000, $90 000 y $500 000. Se puede expresar correctamente que el precio de venta pro-medio es $150 000, pero acaso este elato realmente representa el precio ele venta "tpico"? Al cliente le gustara saber si se vendi el mismo nmero de casas en ms de $60 000 o en menos de $60 000? Quiz tamb n le interese saber que el precio de venta que ms se pre-sent fue $50 000. Por tanto, cul es el precio de venta que resulta realmente el precio "tpi-co"? Este ejemplo muestra que un promedio puede ser engaoso, ya que puede ser uno de varios nmeros que se utilizan para representar los datos. En realidad no existe un grupo de criterios objetivos que especifique el promedio que debe reportarse en cada caso. En esta parte se quiere mostrar al lector, como consumidor de datos, ele qu modo una persona o un grupo puede indicar un valor que favorezca su posicin y excluir otros valores. En el captulo 3 se estudiarn los promedios, o medidas de tendencia central.

    Los diagramas y las grficas tambin suelen utilizarse para engaar visualmente. Supon-gamos que los impuestos escolares en cierto distrito escolar aumentaron de $100 (dlares) en el ao 1990 a $200 en 2000, es decir, en diez aos los impuestos se duplicaron. Paramos-trar este cambio, el smbolo del dlar que se presenta a la derecha duplica la altura del sm-bolo de la izquierda. Adems, el smbolo de la derecha tiene el doble de ancho que el de la izquierda, de manera que el ree. que cubre es cuatro veces mayor (no dos) que el rea que cubre el smbolo de la izquierda.

    $300

    u 200 "' u ~ "' 100 -~~

    o :p 1990 2000

    Ao

    ~!AGRf..\.iViti ,3 Itnpuestos escolares para 1990 y 2000 en una escuela.

    La figura es engaosa porque visualmente el aumento aparece mucho mayor de lo que realmente es. En el captulo 2 analizaremos la elaboracin de tablas y grficas.

    Hace varios aos se present una serie de anuncios por televisin que indicaban que 2 de cada 3 dentistas recomendaban cierta marca de pasta dental a sus pacientes. La deduc-cin es que 67% ele todos los dentistas recomendaran el producto. El truco est en que el productor del dentfrico pudo haber interrogado a muchos grupos de 3 dentistas y solamen-te report los grupos en donde 2 de los 3 especialistas indicaron que recomendaran ese pro-ducto. Sin lugar a dudas, se requiere una encuesta de ms de 3, la cual no debe ser favoritista y debe ser representativa de toda la poblacin de odontlogos. En el captulo 8 se analizan los mtodos de muestreo.

  • Qu es la Estadsllca? 15

    Otra rea donde puede haber tergiversacin de datos es la asociacin entre variables. A menudo, en los anlisis estadsticos se encuentra que hay una fuerte asociacin entre las va-riables. La descubrimos entre el nmero de horas que un alumno estudia para un examen y la calificacin que obtiene. Esto quiere decir que estudiar permite obtene1 calificaciones ms altas? No. Lo que significa es que an1bas variables estn relacionadas, es decir, tienden a actuar juntas en una manera predecible. La asociacin entre variables se estudiar en los captlos 13 y 14.

    Algunas veces aun los mismos nmeros pueden ser engaosos. El precio promedio ele las casas vendidas en el rea ele Tampa, Florida, el mes pasado fue $134 891.58 (dlares). Esto parece ser un va!or n1uy preciso y puede crear un alto grado de confianza en su exac-titud. Reportar que el precio ele venta promedio es $135 000 no incluye la misma precisin y exactitud. Sin embargo, una cifra estadstica que es muy precisa e incluye 5 o hasta 1 O de-cimales, no necesariamente es exacta.

    Existen otras formas en las que la informacin estadstica puede resultar engaosa. Se han escrito libros completos sobre este tema. El ms famoso es el que lleva por ttulo How to Lie with Statistics (Cmo mentir con la estadstica?), escrito por Darrell Huff. Entender es-tas prcticas har que el lector sea un mejor consumidor de informacin estadstica, y pue-de ayudarle a defenderse en contra ele aquellos que deseen engaarlo.

    En la actualidad las computadoras estn al alcance de los estudiantes en la mayor parte de los colegios y universidades. Las hojas de clculo como Excel de Microsoft, y los paquetes de computacin para estadstica como MINITAB, estn disponibles en un gran nlimero de labora-torios de computacin. Gran parte de las computadoras personales que se usan en los hoga-res incluyen la aplicacin Excel de Microsoft. En este texto se utiliza tanto Excel como MlNITAB para las aplicaciones estadsticas. Tambin se emplea una extensin de Excei, MegaStat, la cual proporciona a Excel la capacidad de producir reportes estadsticos adicionales.

    El siguiente ejemplo muestra la aplicacin ele las computadoras en el anlisis estadstico. En los captulos 2, 3 y 4 mostraremos mtodos para resumir y describir los datos. Un ejemplo que se utiliza en esos captulos se refiere al precio de 80 vehculos que se vendieron el mes pa-sado en la agencia Whitner Pontiac. La siguiente pantalla de Excel revela, entre otras cosas, que a) el ltimo mes se vendieron 80 automviles, b) el precio promedio de venta fue $20 218

    lvle,J1a 20218 'IG Error iipico ,:% f.1'109 lvlldi~no 19331 ModJ%lre 1806 11~8 Cl1oi(1,;ic, 0.5,l330S

    Coelci~nte !Je aoimel1i8 0.72G51G 21J37S 1:;;5.'IG 32',12$

  • 16 Captulo 1

    (dlares) y, c) los precios ele venta variaron desde un mnimo de $12 546 hasta un mximo de $32 925. La siguiente pantalla muestra los resultados del sistema MINITAB. Contiene casi la misma informacin que la pantalla anterior.

    Rasu!ts for: Tbl2-1.Mi'N

    Oascriptive Statlstics: Pri~

    Vaolol>!~ '

    !"' ~0~!1' l.'JliJ: ~O~il'i

    >anolll~ fm;;'-"' lb:d'1-'41. ~' ~~~~e 12540 J~:;m; u~'~ 1

    Si se hubiera utilizado una calculadora para obtener estas medidas y otras necesarias pa-ra analizar completarnente los precios de venta, se hubieran requerido muchas horas de clcu-los. La posibilidad de cometer un error aritmtico es alta cuando se tienen graneles cantidades de valores. Por otro lado, los paquetes de computacin para estadstica y las hojas de clculo respectivas pueden proporcionar informacin exacta en cuestin de segundos.

    Siguiendo los consejos de su profesor, y dependiendo del sistema operativo disponible, se recomienda el uso de un paquete de computacin para realizar los ejercicios que se pre-sentan en la seccin de Ejercicios con datos para computadora en cada captulo. Esto evi-tar realizar clculos tediosos, y permitir concentrarse en el anlisis de los elatos.

  • Qu es la Esladslica? 17

    Res.gmen delcaptulo L L.~e_st~-~stica,es'l'_cieriCi'qL_1_e reol_ecta, orga1iiza,:artaliZa e-interpreta los datos para obtener

    una toma de decisionesm'S efectiva; 11. Exstendos enfoques de estadstica.

    A. Estadsttca_-dScrfptiva;--que.nCluye 1os procditlientOs--p_ara organizar y r8sUmir datos. - . ,. e~- EStadSti_C'liifEffi'5iai;'"QU\j'Q'f'fi'JfSffae-ra.tifi"d8:na:-YfiUSStf"d8'"PbfE"C6ii"{/farea.::

    lizEit:in .de'eStiniacidnSS- acer_ca de-'esa-pobl_a:Ci!i/Ccin _base en Jos. resultados para la muestra. t. Una po~l~cin E'8 ~ conjunto total de. los individuos u objetos de inters. 2; l:)ha f11Uestra es una parte de.la pobladq.

    111. Existen dos tipos de varib[es, A. Unayadab!e __ c_u~lit_ativa-__ e:;;.)lC{hm_rica.

    1 . Generalrn8nt8'nos int13re_sa el_ nmeroO:_porcent~j_e de las observaciones en cada cate-(Jia. . >.

    2; Los_d:;ttq~: CLJ,~fit_a1!_vo_~-fbrn_alrilente_ se:~esul-nen en cuadros o grficas de barras. B. _H.aY_~()-~:t_i_P?_s _d~_v_ari_CI?l~~--c:u,_~_otitat[~as,.-y -~-en~ra_!rnente se reportan de manera_ nu_mrica.

    t. Las.v~r_ia~-f~_s:_d_!;)cr~t_as; ___ q_u_e-_:sol_;me_nt~ pueden_asumir ciertos_ valores y, normatmente, e~i~~e~ :_huec?q __ o-.brecha~_ .;EJ11tre _esds __ valores.

    2; Uni:variable contiqu.a pu"de.m>umr cualquier valor dentro de un intervalo (o amplitud de variacin)e.epecfico.

    IV. ExiStet:r _c~_at_ro _niy$lfJS __ d_e __ ~-~9i:qi_n.-. A~ En_eLn_iv~_f no_minal._los:dato~_se Pl8sHGal1 en.categoras sin nlngl1n orden especfico entre

    !as:Qlis~a~:-:: :XhausUvas. Cad.a.Jndividuo u objeto aparece slo en una de las

    9ateqora3, ., > < B. El nive!or?irilsupone qy13 cadacategora tiene mayor jerarqua que Ja siguiente. C. El nivel de intervalo posee las caractersticas de jerarqua de.1 nivel .de medicin ordinal, pe-

    r ,a_de_ms_ti,~_pe !_a -~a~a~t~rstica de,_q~e _ra __ distan_ci~ -?ntre. !'s_ __ v_a!o_res es conStante.: !); El nivel detazn (o reiacin} tiene las caracterist.cas del nivel de intervalo, pero adems el

    punto cero'- es significativo y tambi_ii lo es la razli (o cciciente) entre dos valores.

    Ejercicios del captulo

    8. 9;

    10.

    11.

    12.

    ~~pliq~

  • 18

    '"'---

    Capil"lo 1

    "3. Explique fa diferencia eltre. u_na varia!J!e diScreta y una contriu_a-.. Proporcione un ejemplo de cadaJ111a que no est inc!uida_en_l_teXto.

    14. Una- e,ncuesta realizada-a hogares estadounidenses: a,c_e_r_ca de su satisfaccin respe:to al desempeo_de las escuela$ pl1blicas,.en:su-_pas,_ rev_e_l !os-siguientes datos, los_ cLia!es se presentan grficamente. Observe que 1993. ~ i_OO. Un valocde "IOO sealara una satisfac-cin etQ~?te. Fi0a1ni.~ne .en 1~ colunina con.el e~cabe~ado "More lnfo"; pulse en

    Rlas;e~_.rc_h, De.q~1 nive! sO,il lps.datcx3? C_otTip~:re, !_os t'esul:tados. Qu accon_es recomen": dara: usted?

  • Qu es Ja Estadstica? 19

    Ejercicios con datos para computadora.~~-~--16.

    17.

    18.

    19.

    consu1te ei conjunto de datos de bienes races (Real State) que est al final de este libro. Ah se. reporta informaci.q .0e::.1El~: c.-~~.-9:L!e ~-~;_v~_~d.iero,~:, eii::.~!_..hr~a,:. de V8_nic_~.:FJorJd_a; __ eLao_ pasado: Considere ras Sigu_~nt.es . .vari.bt~s: .pre,g!p-=de-_v.nta; nmero ,de __ do,rmitorios_ .o_ rec-. maras, _localidad. y distancia al centro de la ciudad. --ar-qya_t_e_~-ae~:~st~s_ Vfl&1es .. san;cua1fatrvs;:.y.--cL1aie~rs:O"::cliaQtrtafvas'r

    b) Deterrnine el nivel de medicin de cada vari.a~le. Consu}t~ el 9onjunto de datos de bisbol (fjaseb~lt2p0), en el qJ? sepreseptainformacin sobre los ;JO equipos de _la Liga Mayor de Bis~01 en El)A, Para IE\ tempprad~del ao 2000. Considerelas sig~1entes variables: rmer9 dejueg9s9anados, sueldo en el equipo, asisten- c1a,_ si. e! equipo jug_ coino !ocal, s_.e! ju.~go._se re~tz_ s,obre_ p9;stcr riatur

  • 20 Captulo 1

  • !!NO Organizar los datos en na distribu-cin de frecuencias.

    DOS Presentar una distribudn de frecuen~ cas en un histograma, un polgono de frecuencias y un polgono de frecuen-cias acumuladas.

    TRES Elaborar e interpretar Una representa-cin de tallo y hoja.

    CUATRO Presentar datos utilizando tcnicas de. graficacin cmo grficas de lneas, grficas de barras y grficas circulares.

  • 22 Captulo 2

    Rob Whitner es el propietario de la empresa Whitner Pontiac, en Columbia, Carolina del Sur. El padre de Rob fund la agencia en 1964, y durante ms de 30 aos vendieron exclusiva-mente automviles Pontiac. A principios de la dcada de 1990, la salud de su padre comen-

    z a deteriorarse, y Rob se encarg de la operacin diaria de la agencia. Al mismo tiempo, el negocio de los automviles comenz a camb.iar, las agencias empezaron a vender vehculos de otras marcas, y Rob se enfrent con varias decisiones importantes que deba tomar. La primera fue cuando otra agencia local -que venda autos Volvo, Saab y Volkswagen- habl con Rob para venderle su concesin. Des-pus de pensarlo y analizarlo en demasa, Rob compr la concesin. Tiempo despus, la agencia local de automviles Eagle Jeep tuvo problemas y Rob la adquiri. Actualmente, Rob vende en el mismo lo-te la lnea completa de Pontiac, los caros productos Volvo, Saab, Volkswagen y Chrysler, incluyendo la popular lnea Jeep. La agencia Whitner Pontiac emplea a, 83 personas, incluyendo a 2:3 vendedores

    de tiempo completo. A causa de la diversidad en la lnea de productos, hay bastante varia-cin en los precios de venta de los vehculos. Un automvil Volvo de tecnologa de punta se vende en ms del doble de lo que cuesta un Pontiac Grand Am. A Rob le interesa desarro-llar algunos diagramas y grficas que pueda revisar mensualmente para determinar en dn-de tienden a acumularse los precios de venta, para analizar la variacin de los mismos y poder apreciar cualquier tendencia. En este captulo se presentan tcnicas que sern tiles a Rob y a cualquier otra persona en la administracin de su negocio.

    Recuerde que en el captulo 1 se describieron las tcnicas que se utilizan para describir un conjunto de datos como concepto de la estadstica descriptiva. Para expresarlo de manera diferente, utilizamos tal enfoque para organizar los datos de varias maneras e indicar.los si-tios donde los valores de datos tienden a acumularse, y ayudar a distinguir los valores ma-yores y menores. El primer mtodo que se utiliza para describir un conjunto de datos es la distribucin de frecuencias.

    Disfr1ilmdr\ de fieccie11cias Agruga~Wntod~f1at6~.~.n~at~j9r~~Rigtu'3.rri~6t~~~cluyentes, que indican el nmero dl)g.ps~rv!'cil)n~".~~cad!' cat~gOf.<

    Cmo se elabora una distribucin de frecuencias? El primer paso es anotar los datos en una tabla que muestre las clases (categoras) y el nmero de observaciones en cada catego-ra. Los pasos para elaborar una distribucin de frecuencias se describen mejor utilizando un ejemplo. Recuerde que el objetivo es obtener una tabla que muestre a simple vista la forma de los datos.

    En la introduccin se describe un caso en el que Rob Whitner, propietario de Whitner Pontiac, est interesado en reunir informacin sobre. los precios de venta de los vehcu-los que se venden en su agencia. Cul es el precio de venta tpico? Cul es precio de venta ms alto? Cul es ei ms bajo? Alrededor de qu valo.r tienden a acumularse los precios de venta? Para poder responder a estas preguntas, es necesario recolectar datos. De acuerdo con los registros de venta, Whitner Pontiac vendi 80 vehculos el mes pasado. La tabla 2.1 muestra el precio que pagaron los clientes por cada vehculo. Resmanse los precios de venta de los vehculos que se vendieron e! mes pasado. Al-rededor de qu valor tienden a acumularse los precios en cuestin?

  • SOLUCIN

    Pasos para organizar los datos en una distribucin de frecuencias.

    lABLP, 2.'1 Precios de venta_::_:~~ vc:cul:~ vcndi(~os en el_::~ /1sado en la ~::~~ia. _ s15z1 $20 197 $20 372 $17 454 $20 59_1 $23 651 $24 453 S14 266 $25 683 $27 872

    16 ~I7 J2851 16251 ,

    2016,9 17047 21 285 21 324 21 60,9 25670 12 546 12'55 16 &.3 22 251 22277 25 034 2-1 533 24443 16 889 -17J04 -4357 -17 55 16 688 20 657 23613 17 G95 '17 203 20765 22783 2366'1 29 277 ti menor

    115b 18 93i 21 052 22 799 12 794 15 263 i4 399 14 958 - 7/356 16 3'31 18442 18 722 'i9 817 16 766 17 633 19 845 23285 24896

    26076 29492 15 890 18 740 19 374 21 571 22449 25337 17642 20 613 21 220 27 655 19 442 14891 17 ss 23 237 17 ~45 13 556 18 639 21296 L ____ El mayo

    Nos referimos a la nformacln desorganizada de la tabla 2. i como datos sin procesar1 datos inicia!esj o no agrupados. Con un poco de investigacin se encuentra el precio ele venta (en dlares) ms bajo ($12 546) y el ms alto ($32 925), pero eso es casi todo. Es difcil determinar cul es el precio tpico. Tambin es difcil visualizar dnde tienden a presentarse los precios tpicos de venta. Los datos srnp!es se interpretan con mayor 'fa-cilidad si se organizan en una distrbucin de frecuencias.

    Paso i: Determinar el nmero de clases. El objetivo es usar su'ficientes grupos, o ciases, que ind!quen la forma de la distribucin. Aqu se necesita algl1n crite-rio. Demasladas clases o muy pocas pueden no revelar la forma bsica del con-junto de datos. En el problema de ios precios de venta ele los vehculos, por ejemplo, tres clases no permitiran una mejor comprensin de la dist:-!bucin de los datos (ver la iabla 2.2).

    TABLA 2 .. 2 Eje111plo con 11111y pocas clsscs.

    Precio de venta de~ vehiculo (en dlares) 12 ooo hasta 21 ooo 21 000 hasta 30 000 30 000 hasta 39 000

    Tota!

    !\lmero de vehicUJlos

    48 30 2

    80

    Una receta til para detern1inar el nmero de clases es la regla "2 a la k". Esta regla su-giere utilizai como nmero de ciases el menor nl!mero (k) tal que 2'' (en palabras, dos elevado a la potencia k) sea mayor que el nl!mero de observaciones (n).

    En el ejemplo de la agencia Whitner Pontiac se vendieron 80 vel1culos, de manera que n ~ 80. Si tomamos k ~ 6, lo que significara usar 6 clases, entonces 26 ~ 64 es me-nor que 80. Por tanto 6 clases no son suficientes. Si escogemos k = 7, entonces 27 = 128, que es mayor que 80. En consecuencia, el nir1ero de clases que se recomienda considerar es 7.

    23

    Paso 2: Determinar e! intervalo o amplitud. Generaln1ente el intervalo o amplitud de las clases debe ser el mismo para tocias ellas. Todas las clases juntas deben cubrir por lo 111enos la distancia que hay desde e! 111enor hasta el mayor valor que se tiene en los datos sin procesar. Expresando esto 111ediante una frmula tene111os:

  • 24 Capi!t1lo 2

    donde i es el intervalo de clase, Hes el mayor va!or observado, L es el menor valor ob-servado y k es el 111.Jmero de clases.

    De nuevo en el caso de la agencia Whitner Pontiac, ios valores n1enor y mayor son 12 546 y 32 925 dlares respectivamente. Si necesitamos 7 clases, el intervalo total de-ber ser (32 925 - 12 546) "" 2 9-1 i dlares. En la prctica este valor se redondea hacia arriba a algn ml1ltiplo de i O o de 1 OO. En este caso se puede asignar el valor de 3 000 dlares como extensn del intervalo.

    Los intervalos de clase desiguales o-frecen problemas al representar en forn1a grf-ca la distribucin y al hacer algunos de los c!culos, como veremos en captulos poste-riores. Sin en1bargo, en algunos casos pueden ser necesarios intervalos de ciase desiguales para evitar un gran nmero de clases vacas, o casi vacas. Tai es el caso en la tab!a 2.3. El servicio de Recaudacin de Impuestos (Interna! Revenue Service, IRS) en Estados Unidos, utiiiz intervalos de clase de tan1aos desiguales para reportar el ingre-so bruto ajustado de las deciaraciones de in1puestos individuales. Si e! JRS hubiera uti-lizado un mismo intervalo de clase, por ejemplo 1 000 dlares, se habran necesitado ms de 000 clases para abarcar todos !os ingresos. Una distribucin de frecuencias con i 000 clases sera difcil de interpretar. En este caso, la distribucin de frecuencias se interpreta con mayor facilidad, a pesar de la desigualdad de las clases. Asimismo, note que el n\Jmero de declaraciones, o "frecuencia", se reporta en n1illares. Esto tam-bin hace que la informacin sea n1s con1prensibie.

    TABLA 2.3 Ingresos brutos ajustados de las declaraciones de in1pucstos incli,,idualcs.

    1

    !\lmero de dec!aracii:mes Ingresos brutos ajustados (en miles de rU:iia!res)

    o $ 2 000 135 $ 2 ooo hasta 3 000 3 399

    3 000 hasta 5 000 8175 5 ooo hasta O 000 19740

    1O000 hasta i5 000 15 539 15 000 hasta 25 000 14944 25 000 hasta 50000 4451 50 000 hasta 100 000 699

    100 ooo hasta 500 000 162 500 000 hasta 1 000 000 3

    $1 ooo ooo y ms

    Paso 3: Establecer !os lmites de cada c!ase. Es necesario establecer ln1ites de clase claros de n1anera que cada observacin pertenezca slo a una clase. Esto significa que se deben evitar los lmites de clase que se sobrepongan o que no sean claros, Por ejemplo, clases (en dlares) como las siguientes: - 300 - 1 400, y 1 400 - 1 500, no deben usarse porque no es ciara si ei valor de 'I 400 dlares pertenece a la primera o a la segunda clase. Con frecuencia, se usan clases co-mo estas: 1 300 - 1 400 y 1 500 - 1 600, pero tambin pueden llevar a confusin si no se establece la convencin de redondear hacia arriba todos los valores ma-yores que o igu_a!es a 1 450 para que pertenezcan a la segunda clase, y edon-dear hacia abajo los valores n1enores que i 450 para que pertenezcan a la primera clase. En este texto usaren1os el siguiente formato (en dlares): i 300 a 1 400, y 1 400 a 1 500, y as sucesivamente, De este modo es claro que 1 399 dlares pertenece a la pri111era clase, y 1 400 dlares a la segunda. Se redondea el intervalo de clase hacia arriba para obtener un tamao de cla-se adecuado, abarcando una ampltud mayor que !a necesaria. Por ejemplo, en

  • La esta.clstica en accin

    a kis l~

  • 26 Gapil1lo 2

    4. Dos de ios vehculos se vendieron en n1s de 30 000 dlares, y 8 se vendieron en menos ele -15 000 dlares.

    Al presentar esta in-formacin al seor VVh