Estadistica Basica 1

download Estadistica Basica 1

of 160

  • date post

    18-Jul-2015
  • Category

    Documents

  • view

    302
  • download

    0

Embed Size (px)

Transcript of Estadistica Basica 1

Estad stica Bsica a con R y RCommander

Estad stica Bsica a con R y RCommander(Versin Febrero 2008) o Autores: A. J. Arriaza Gmez o F. Fernndez Palac a n M. A. Lpez Snchez o a M. Muoz Mrquez n a S. Prez Plaza e A. Snchez Navas a

Copyright c 2008 Universidad de Cdiz. Se concede permiso para copiar, distribuir y/o a modicar este documento bajo los trminos de la Licencia de Documentacin Libre de e o GNU, Versin 1.2 o cualquier otra versin posterior publicada por la Free Software Founo o dation. Una traduccin de la licencia est incluida en la seccin titulada Licencia de o a o Documentacin Libre de GNU. o

Copyright c 2008 Universidad de Cdiz. Permission is granted to copy, distribute and/or a modify this document under the terms of the GNU Free Documentation License, Version 1.2 or any later version published by the Free Software Foundation. A copy of the license is included in the section entitled GNU Free Documentation License.

Edita: Servicio de Publicaciones de la Universidad de Cdiz a C/ Dr. Maraon, 3 n 11002 Cdiz a http://www.uca.es/publicaciones

ISBN: Depsito legal: o

Indice general

Prlogo o 1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . o 2. History (Histrico) o

V V

. . . . . . . . . . . . . . . . . . . . . . VIII

3. Licencia de Documentacin Libre de GNU . . . . . . . . . IX o 4. GNU Free Documentation License . . . . . . . . . . . . . . XIX

1

Comenzando con R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . o 2. Instalacin de R y RCommander . . . . . . . . . . . . . . o 3. Ejecucin de Rcmdr . . . . . . . . . . . . . . . . . . . . . . o

1 1 3 4

2

Anlisis Exploratorio de Datos Unidimensional . . . . a 1. La organizacin de la informacin . . . . . . . . . . . . . . o o

5 6

II

Indice general 2. Naturaleza de los caracteres: Atributos y Variables . . . . 8

3. Anlisis de atributos . . . . . . . . . . . . . . . . . . . . . 11 a 4. Anlisis de variables ordenadas . . . . . . . . . . . . . . . . 13 a 5. Anlisis de variables de escala . . . . . . . . . . . . . . . . 17 a 6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

3

Anlisis Exploratorio de Datos multidimensional . . . 23 a 1. Tipos de relaciones entre caracteres . . . . . . . . . . . . . 24 2. Anlisis de relaciones entre dos atributos . . . . . . . . . . 25 a 3. Anlisis de relaciones entre dos variables . . . . . . . . . . 31 a 4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

4

Distribuciones de Probabilidad . . . . . . . . . . . . . . . . . . . . 55 1. Distribuciones discretas . . . . . . . . . . . . . . . . . . . . 58 2. Distribuciones continuas . . . . . . . . . . . . . . . . . . . 64 3. Generacin de valores aleatorios . . . . . . . . . . . . . . . 73 o 4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

5

Inferencia clsica en poblaciones Normales . . . . . . . . . 81 a 1. Conceptos fundamentales . . . . . . . . . . . . . . . . . . . 81

III 2. Inferencias sobre una poblacin . . . . . . . . . . . . . . . 85 o 3. Inferencias sobre dos poblaciones . . . . . . . . . . . . . . 88

4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

6

Inferencia no paramtrica. Diagnosis del modelo . . . 97 e 1. Pruebas de aleatoriedad . . . . . . . . . . . . . . . . . . . . 97 2. Pruebas de bondad de ajuste . . . . . . . . . . . . . . . . . 99 3. Contrastes de localizacin y escala . . . . . . . . . . . . . . 106 o 4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110

7

Introduccin al Anlisis de la Varianza . . . . . . . . . . . . 113 o a 1. Conceptos bsicos . . . . . . . . . . . . . . . . . . . . . . . 113 a 2. Diagnosis del modelo . . . . . . . . . . . . . . . . . . . . . 114 3. Test de la F . . . . . . . . . . . . . . . . . . . . . . . . . . 116 4. Alternativa no paramtrica. Test de Kruskal Wallis . . . . 119 e 5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

A

Ficheros de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

B

Tabla de medidas estad sticas . . . . . . . . . . . . . . . . . . . . . 125

C

Tabla de modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

IV

Estad stica Bsica con R y R-commander a (Versin Febrero 2008) o Autores: A. J. Arriaza Gmez, F. Fernndez Palac o a n, M. A. Lpez Snchez, M. Muoz Mrquez, S. Prez Plaza, o a n a e A. Snchez Navas a c 2008 Servicio de Publicaciones de la Universidad de Cdiz a http://knuth.uca.es/ebrcmdr

Prlogo o1. Introduccin o

La Universidad de Cdiz es pionera en Espaa en la bsqueda de a n u soluciones de conocimiento abierto, consciente de que es la forma ms a eciente de lograr sus objetivos institucionales relacionados con la docencia y la investigacin. En concreto, el Punto 1 del Art o culo 2 de sus Estatutos, que describe los nes esenciales de la institucin, establece coo mo objetivo fundamental: La creacin, desarrollo, transmisin y cr o o tica de la ciencia, la tcnica y la cultura y su integracin en el patrimonio e o intelectual heredado. Mientras que en el Punto 6 del mismo art culo dice: Acoger, defender y promover los valores sociales e individuales que le son propios, tales como la libertad, el pluralismo, el respeto de las ideas y el esp ritu cr tico, as como la bsqueda de la verdad. u La creacin de la Ocina de Software Libre (OSLUCA) el 15 de o marzo de 2004, la aprobacin de la Normativa para el intercambio de o informacin institucional el 27 de septiembre de 2004 y la utilizacin o o de herramientas de formato abierto en las aplicaciones de comunicacin o y gestin de la Universidad, son actuaciones que ponen de maniesto o el decidido apoyo del Equipo de Gobierno de la UCA a las soluciones basadas en formatos abiertos. Desde un plano mucho ms modesto, bajo el auspicio del Vicea rrectorado de Tecnolog de la Informacin e Innovacin Docente y as o o a travs de la Oficina de Software Libre de la Universidad de e

VI Cdiz (OSLUCA), nace el Proyecto R UCA. Dicho proyecto, cuyas l a neas principales de actuacin pueden consultarse en la pgina web del proyeco a to http://knuth.uca.es/R, contempla, entre otras acciones, la elaboracin de material para la docencia y la investigacin, siendo en el primero o o de estos aspectos, el docente, en el que se enmarca este manual. En la misma l nea que nuestros rganos de gobierno, pensamos que o una institucin como la Universidad debe preocuparse por proveer a sus o miembros de las mejores herramientas para desarrollar su tarea, en aras de la mejora global del conocimiento. Pero la creacin de conocimiento se o ver muy mermada si se emplean soluciones tecnolgicas que se ofrecen a o como cajas negras, es decir que no pueden ser analizadas ni modicadas, y que adems limita fuertemente el uso que se haga de los resultados a que se consigan a partir de ellas. El uso de software propietario en reas como la Estad a stica, donde existen alternativas con igual o mejor calidad con licencia libre, no slo o tiene consecuencias negativas desde un punto de vista econmico, sino o que supone un autntico harakiri intelectual, porque limita el ejercicio e de uno de los aspectos que mejor caracterizan a nuestra institucin: su o esp ritu anal tico y cr tico, cmo se va a fomentar ese esp o ritu con el uso de herramientas absolutamente hermticas?, y si alguien consiguiera e descifrarlas y manipularlas se convertir formalmente en un delincuente. a Centrndonos en los aspectos intr a nsecos de la cuestin, cuando o nos planteamos confeccionar este manual, tuvimos claro que no quer amos ensear a manejar un programa, sino a hacer anlisis estad n a sticos con el apoyo de una herramienta que facilitara el clculo y la aplicacin de los a o procedimientos. De ah el nombre del libro: Estad stica bsica con R y a Rcmdr. La decisin de elegir R fue fcil, ningn otro programa en la actuao a u lidad rene las condiciones de madurez, cantidad de recursos y manejabiu lidad que posee R, adems de ser el que tiene una mayor implantacin a o en la comunidad cient ca. El incorporar la interfaz grca de usuario a (GUI) Rcmdr pretende, en primera instancia, facilitar el manejo de R y, en segundo lugar, servir como generador de instrucciones R. Es posible

0.1 Introduccin o

VII

que muchos de nuestros alumnos no necesiten otro nivel de uso que el que proporciona Rcmdr, pero unos pocos y la mayor del personal a investigador, una vez superado el respeto inicial a la herramienta, se decantarn por manejarse directamente con la consola de R, creando y a editando instrucciones con una evidente econom de recursos y, lo que a es ms importante, con un control total sobre los procedimientos que en a cada momento se van a aplicar. Respecto a los contenidos, el libro pretende abarcar las necesidades prcticas de un programa bsico de estad a a stica, y as salvo el primer , cap tulo, donde se presenta de forma muy sucinta el software, el resto est dedicado a los tpicos habituales de un curso introductorio: Anlisis a o a Exploratorio en una y dos Dimensiones, Distribuciones de Probabilidad, Inferencia Paramtrica y no Paramtrica y Anlisis de la Varianza de e e a un Factor. El esquema de presentacin de los temas incluye una breve o descripcin de los conceptos, la resolucin de una serie de ejemplos con o o la ayuda de R y la propuesta de ejercicios para evaluar los conocimientos adquiridos. Al objeto de facilitar el uso del software, los primeros cap tulos estn soportados bsicamente sobre la interfaz Rcmdr. A partir del a a cap tulo 5 aumenta el uso de funciones construidas directamente en el indicador de mandatos, en parte por necesidad