Audiovisual de estad. inf.

263
UAEM UAPCI Universidad Autónoma del Estado de México. Licenciatura en Logística Unidad Académica Profesional de Cuautitlán Izcalli. Segundo Semestre “Estadística Inferencial” M. en C.T.C. Gabriela Gaviño Ortiz. e-mail: [email protected] [email protected]

description

Es una presentación de introducción a la estadìstica

Transcript of Audiovisual de estad. inf.

Page 1: Audiovisual de estad. inf.

UAEM UAPCI

Universidad Autónoma del Estado de México.

Licenciatura en Logística

Unidad Académica Profesional de Cuautitlán Izcalli.

Segundo Semestre

“Estadística Inferencial”

M. en C.T.C. Gabriela Gaviño Ortiz.

e-mail:[email protected]

[email protected]

Page 2: Audiovisual de estad. inf.

UAEM UAPCI

Temario de Estadística Inferencial.

Page 3: Audiovisual de estad. inf.

UAEM UAPCI

Formar profesionales capaces de enfrentar el continuo cambio de la ciencia y las disciplinas, permitiéndoles desarrollar las habilidades de aprendizaje necesarias para adaptarse y alcanzar las necesidades cambiantes de la comunidad donde servirán.

Objetivo General al utilizar la Metodología de Aprendizaje Basado en Problemas

Metodología a usar en la clase de Estadística Inferencial

Page 4: Audiovisual de estad. inf.

UAEM UAPCI

Metodología de Aprendizaje Basado en Problemas (ABP)

Su esencia es la integración interdisciplinaria y la libertad para explorar lo que todavía no conoce. Centrándolo en el proceso de aprendizaje.

Metodología ABP

Clarificación de Términos

Definición del problema

Lluvia de ideas

Discusión y categorización de ideas.

Definición de los objetivos de aprendizaje

Búsqueda de la información

Reporte de resultados

Organización del grupo

Docente

Moderador.

Alumnos

Page 5: Audiovisual de estad. inf.

UAEM UAPCI

Rol del Moderador

Moderador

Es quien dirige que el proceso de discusión y retroalimentación se lleve a cabo de forma respetuosa y organizada.

Deberá mostrar su liderazgo en el equipo de trabajo y promover que los integrantes participen oportuna y pertinentemente durante la definición, análisis y síntesis del problema.

Será el responsable de garantizar que los objetivos de aprendizaje representen las necesidades de conocimiento propias y de los compañeros.

Page 6: Audiovisual de estad. inf.

UAEM UAPCI

1. Organización del grupo para la Metodología (ABP)

Se conforman grupos de 8 o 10 estudiantes. Cada grupo, deberá nombrar a un alumno moderador, cuya labor es servir de enlace entre el grupo.

Se espera que el moderador de cada grupo pase la asistencia y que sea capaz de asumir una posición de conducción del grupo.

Page 7: Audiovisual de estad. inf.

UAEM UAPCI

Cada grupo recibirá un problema diferente, preparado por el docente, relacionado con el módulo a tratar, basado en casos reales.

Los alumnos dispondrán alrededor de 6 momentos para investigar sobre el caso, utilizando la metodología de aprendizaje basado en problemas. Al término del proceso, los alumnos deberán efectuar una presentación al curso, con el contenido de su trabajo.

1. Organización del grupo para la Metodología (ABP)

Page 8: Audiovisual de estad. inf.

UAEM UAPCI

Este primer paso es presentado para la clarificación de conceptos o términos imprecisos o no comprendidos. Éste es el momento para preguntar todas aquellas palabras que aparezcan en el problema de las cuales el estudiante desconoce su significado.

Si el problema del texto en su conjunto no es claro, éste es el momento para mencionarlo, con la finalidad de clarificarlo en conjunto con el grupo.

Paso 1: Clarificación de términos

Page 9: Audiovisual de estad. inf.

UAEM UAPCI

Cada uno de los participantes tratará de definir cuál es realmente el problema. A través de una pregunta que requiera de alguna explicación y que de pie a la discusión de la información que cada cual posea.

Este paso y el anterior se deben de llevar a cabo el primer día de la actividad. El tutor debe aportar retroalimentación sobre la definición del problema.

Paso 2: Definición del problema

Page 10: Audiovisual de estad. inf.

UAEM UAPCI

La lluvia de ideas será utilizada para expresar toda la información que poseen con claridad y seguridad con respecto al problema; es decir, representa todos los conocimientos que saben y que están relacionados con el problema que se les presentó.

Permite el análisis del problema. No debe incluir especulaciones, ni inferencias. El estudiante debe aportar y explicar al menos tres ideas no repetidas al grupo.

Paso 3: Lluvia de Ideas

Page 11: Audiovisual de estad. inf.

UAEM UAPCI

Después de haber leído las aportaciones de cuando menos dos de los compañeros, el alumno puede comenzar con la discusión del problema. Cualquier comentario que no sea claro o con el que no se esté de acuerdo, deberá ser discutido en este paso. Este es también el tiempo para comenzar a responder preguntas que hayan sido enviadas por los compañeros, acerca de la aportación o acerca del problema en general.

La clasificación de las ideas siempre deberán estar basadas en al menos tres aportaciones realizadas en el tercer paso incluyendo la del alumno.

Paso 4: Discusión y categorización de ideas:

Page 12: Audiovisual de estad. inf.

UAEM UAPCI

Este paso es muy importante porque responde a lo que se necesita saber para comprender el(los) concepto(s) por aprender a partir del problema.

Esta fase permitirá establecer qué información se necesita buscar para aprenderla y compartirla con los compañeros. Este paso debe quedar claro y todos los integrantes del grupo estarán de acuerdo.

Los objetivos de aprendizaje serán un punto de evaluación del proceso, a la vez que determinará sobre el contenido de la búsqueda de información, tarea que deberán realizar a continuación.

Paso 5: Definición de los objetivos de aprendizaje:

Page 13: Audiovisual de estad. inf.

UAEM UAPCI

Para poder lograr los objetivos de aprendizaje es conveniente leer de nuevo los objetivos que se han propuesto en el paso anterior.

Paso 6: Búsqueda de la información:

Page 14: Audiovisual de estad. inf.

UAEM UAPCI

Para compartir los resultados de su búsqueda en relación con los objetivos de aprendizaje. Esta es la parte más importante del proceso, porque en este paso se demostrarán los conocimientos que se han adquirido a partir de la búsqueda de información.

Con esta información el moderador construye una síntesis del nuevo conocimiento adquirido y se evalúa la ejecución de cada uno de los integrantes durante el proceso por medio de una lista de comprobación, evaluaciones, etc.

Paso 7: Reporte de resultados

Page 15: Audiovisual de estad. inf.

UAEM UAPCI

6. Utiliza recursos y materiales relevantes efectivamente.7. Utiliza internet u obtiene información y evidencia apropiada8. Aplica conocimientos para resolver los problemas planteados.

9. Organiza y prepara la sesión en pequeños grupos de trabajo10. Comparte opiniones de forma activa en el grupo de trabajo.11. Comparte imágenes, texto y otras informaciones relevantes.

12. Expresión oral suficientemente clara para ser entendido.

14. Utiliza herramientas de presentacion (PPT) de forma efectiva.15. Contribuye armoniosamente al trabajo, es tolerante.

13. Acepta y proporciona feedback constructivista.

Abs

olut

amen

te d

e ac

uerd

o

De

acue

rdo

Indi

fere

nte

En d

esac

uerd

o

Abs

olut

amen

te e

n de

sacu

erdoEvaluación de experticia en el ABP

Profesor → Alumno.

Apreciacion Critca

Utilización de recursos del aprendizaje

Trabajo Grupal

Actitudes y Habilidades comunicacionales

Comentarios:

1. Clarifica, define y analiza los problemas2. El estudiante es capaz de proponer hipotesis.3. Identifica los objetivos del aprendizaje4. Demustra puntos de vista coherentes con el tema.5. Demuestra procesos de construccion del pensamiento.

Page 16: Audiovisual de estad. inf.

UAEM UAPCI

6. Utiliza recursos y materiales relevantes efectivamente.7. Utiliza internet u obtiene información y evidencia apropiada8. Aplica conocimientos para resolver los problemas planteados.

9. Organiza y prepara la sesión en pequeños grupos de trabajo10. Comparte opiniones de forma activa en el grupo de trabajo.11. Comparte imágenes, texto y otras informaciones relevantes.

Trabajo Grupal

Comentarios: Haga comentarios constructivos sobre el desempeño del profesor. ¿Cuáles son las principales fortaleas del profesor? ¿Cuáles son las principales debilidades del profesor? Desde su punto de vista ¿Qué puntos de la sesión de ABP deberí fortalecer el profesor?

1. Entiende los objetivos del proceso del ABP y asiste a los grupos focales en la respuesta de los objetivos y de los aprendizajes.2. Incentiva el pensamiento critico y feedback del alumnado.3. Identifica los objetivos del aprendizaje4. Demustra puntos de vista coherentes con el tema.5. Demuestra procesos de construccion del pensamiento.

Utilización de recursos del aprendizaje

Evaluación de experticia en el ABP Alumno → Profesor.

Abs

olut

amen

te

de a

cuer

do

De

acue

rdo

Indi

fere

nte

En d

esac

uerd

o

Abs

olut

amen

te

en d

esac

uerd

o

Apreciacion Critca

Page 17: Audiovisual de estad. inf.

UAEM UAPCI

Información de investigación (3) 45% Propuestas iniciales (3) 15% Puestas en común 15% Autoevaluación del proceso 15% Asistencia, Participación y puntualidad 10% Total 100%

Paso 8: Evaluación de los estudiantes

Page 18: Audiovisual de estad. inf.

UAEM UAPCI

Asistir de manera obligatoria a las sesiones presenciales Llegar a tiempo a las sesiones presenciales. Entrega a tiempo los informes y las propuestas de los problemas Cumplir los compromisos adquiridos durante las sesiones de discusión: Cada uno de los informes de investigación y propuestas iniciales se podrán repetir un máximo de 2 veces. Prepararse bien para la participación en las sesiones bien sea aportando información oralmente o por escrito. Desarrollar una actitud de colaboración hacia sus compañeros. Participar activamente en las sesiones de clase Tener una actitud positiva y constructiva. Diferenciar las personas de sus opiniones y de las situaciones.

Los Compromisos

Page 19: Audiovisual de estad. inf.

UAEM UAPCI

Primera parte: Problema concreto descrito en una página. Definición conjunta de los objetivos de aprendizaje (propios). Trabajo de campo: acopiar información sobre el problema. Entrega de la propuesta inicial: qué investigo, cómo lo hago y para qué lo hago.

Segunda parte: Puesta en común del avance en el abordaje del problema. Redefinición de los objetivos de aprendizaje. Acopio de la información sobre el problema y Evaluación de la calidad de la información recolectada. Compartir lo vivido en el proceso y cómo aprovechar las experiencias de aproximación al problema.

Tercera parte: En esta sesión se da la oportunidad para que cada equipo comparta el proceso y los resultados de su investigación. El informe final describe el problema analizado, la información primaria y secundaria recolectada, el análisis realizado con las ideas e información pertinentes, y las limitaciones del trabajo. Extensión 3 cuartillas.

Proceso para cada problema

Page 20: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del Muestreo

I. Población y muestras1.2 Inferencia Estadística1.3 Muestreo con y sin remplazo1.4 Muestras aleatorias1.5 Parámetros poblacionales1.6 Distribución muestral (de medias, de proporciones,

de diferencia y sumas)1.7 Distribución de Frecuencias.

Page 21: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del Muestreo

Objetivo General de la Unidad

Proporcionar al alumno una apreciación para la correcta comprensión de las técnicas muestrales y de las distribuciones muestrales.

Page 22: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del Muestreo

1.1 Población y muestras

En estadística, por lo general confiamos en una muestra para realizar inferencias acerca del grupo de donde fue seleccionada. Al grupo mayor de datos se le denomina Población

Objetivo especifico:

Conocer diferentes tipos de muestreo para obtener las muestras de la población y construir estimaciones acerca de las características de una población mediante la información contenida en una muestra.

Page 23: Audiovisual de estad. inf.

UAEM UAPCI

Ejemplo 1.1Eres contratado por el Instituto Federal Electoral para que investigues la percepción que tienen los ciudadanos acerca de la honestidad de los procedimientos de elecciones en México.Preguntas Guía ¿A que ciudadanos les preguntarías su percepción? ¿Cuál seria la muestra? ¿Cuál es seria la población?

Ejemplo 1.2 Un profesor de estadística inferencial quiere saber las calificaciones que obtuvieron sus alumnos en probabilidad y estadística. En la primera clase del curso les pregunta a los diez estudiantes sentados en la primera fila sus calificaciones en esa asignatura. Concluye, con base en las respuestas recibidas, que el grupo obtuvo muy buenas calificaciones. Preguntas Guía¿Cuál es la muestra? ¿Cuál es la población? ¿Puedes identificar cualquier problema relacionado con la forma en que el profesor selecciono la muestra?

Page 24: Audiovisual de estad. inf.

UAEM UAPCI

Ejemplo 1.3 Un profesor de deportes esta interesado en determinar el rendimiento promedio de los estudiantes en una carrera con obstáculos. Ocho estudiantes de su clase se apuntan como voluntarios, después de observar su desempeño, el profesor concluye que sus estudiantes pueden realizar exitosamente la prueba.

Preguntas Guía¿Cuál es la muestra? ¿Cuál es la población?¿Puedes identificar cualquier problema relacionado con la forma en que se selecciono la muestra?

Page 25: Audiovisual de estad. inf.

UAEM UAPCI

Ejemplo 1.4

Una investigadora esta interesada en estudiar las experiencias de adolescentes hijos de familia en comparación con los hijos de padres divorciados. Obtiene una lista de adolescentes de 16 años de dad, de las oficinas del Registro Civil de la Ciudad de Monterrey y selecciona dos subconjuntos de individuos para su estudio. Primero, elige a todos aquellos que su apellido empieza por Z. Luego, a dodos los adolescentes cuyo apellidos que empiezan con A. debido a que muchos registros muestran apellidos que empiezan con A, selecciona a uno si y a otro no, y así sucesivamente. Por ultimo, envía una encuesta por correo a las personas seleccionadas y compara las características de los adolescentes hijos de familia con los hijos de padres divorciados.

Preguntas Guía

¿Cuál es la muestra?¿Cuál es la población? ¿Puedes identificar cualquier problema relacionado con la forma en que se selecciono la muestra?

Page 26: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del Muestreo

Resultados

Resultado Ejercicio 1.1: No resultaría práctico preguntarle a cada uno de los ciudadanos mexicanos su percepción acerca de esta cuestión. En lugar de esto, sería más fácil entrevistar a un número pequeño de ciudadanos y, a partir de sus respuestas, realizar inferencias acerca de lo que piensan todos los ciudadanos del país. Las personas a las que realmente se les preguntó constituyen nuestra muestra, la cual se seleccionó de la población formada por todos los ciudadanos de la República en edad de votar. Los procedimientos matemáticos mediante los cuales convertimos la información proporcionada por una muestra en suposiciones inteligentes acerca de la población es el campo de estudio de la inferencia estadística.

Page 27: Audiovisual de estad. inf.

UAEM UAPCI

Resultados.

Una muestra es un subconjunto de la población. En el caso de la percepción ante los procedimientos de elección, seleccionaremos una muestra de unos cuantos miles de mexicanos, de los millones que hay en el país en edad de votar. La selección de la muestra es crucial , ya que debe representar a la población y no solo a un segmento de esta en detrimento de otro.

Por ejemplo un error sería seleccionar en la muestra sólo ciudadanos del estado de Michoacán. Si la muestra está constituida sólo por michoacanos, entonces no puede usarse para inferir la percepción de todos los votantes del país. El mismo problema se presentará si en la muestra solo hubiera miembros de un partido en particular (por ejemplo panistas).

La inferencia estadística se basa en la suposición de que la muestra es aleatoria. Para nuestro caso, tendremos confianza en nuestra muestra que represente a los diferentes segmentos de la sociedad en las proporciones que más se aproxime a las reales (a condición que la muestra sea lo suficientemente grande).

Page 28: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del Muestreo

Resultados

Resultado Ejercicio 1.2:

La población está formada por todos los estudiantes de la clase y la muestra se conformó con los diez estudiantes sentados al frente.

Esta muestra probablemente no es representativa por la tendencia que existe a que los más aplicados se sienten al frente y éstos alcancen las más altas calificaciones. Por tanto la muestra puede proporcionar una calificación promedio más alta que la que realmente le corresponde al grupo.

Page 29: Audiovisual de estad. inf.

UAEM UAPCI

Resultados

Ejemplo 1.3:

La población son todos los estudiantes del grupo. La muestra se conformo con ocho voluntarios. La selección de la muestra fue deficiente porque los voluntarios son probablemente más hábiles en realizar la prueba que el resto de los estudiantes.

Los estudiantes sin habilidad casi con seguridad no se anotaron como voluntarios. además, nada se dice del género de los voluntarios. Por ejemplo: ¿Cuántas voluntarias hubo?.Esto puede afectar el resultado, adicionalmente al hecho de que la muestra no es representativa.

Page 30: Audiovisual de estad. inf.

UAEM UAPCI

Ejemplo 1.4:

En el ejemplo 1.4 la población esta formada por todos los adolecentes de 16 años registrados civilmente en la ciudad de monterrey es decir esto no puede representar a todos los adolescentes de esta edad, a demás de seleccionar aquellos jóvenes cuyo apellido empieza con z no da igual probabilidad a cada individuo de ser seleccionado. Hay otras razones por las que seleccionar solo apellidos que empiecen con z puede dar como resultado una muestra sesgada.

También pueden observarse deficiencias al seleccionar a las personas con apellidos que inician con A. una deficiencia adicional par estos últimos es que el procedimiento de uno si, uno no rechaza personas por el simple hecho de estar junto a las personas seleccionadas. Solo esta deficiencia nos dice que la muestra no fue seleccionada de acuerdo con un muestreo aleatorio simple.

Resultados

Page 31: Audiovisual de estad. inf.

UAEM UAPCI

Conclusiones.

El muestreo se utiliza ampliamente en la logística como medio para reunir información útil acerca de una población. Se reúnen datos de muestras y secan conclusiones acerca de la población como parte del proceso de estadística Inferencial.

Razones para muestreo:Tomar una muestra en lugar de llevar a cabo un censo ofrece varias ventajas:

1.La muestra puede ahorrar dinero2.La muestra puede ahorrar tiempo3.P ara recursos dados, la muestra puede ampliar el alcance del estudio.4.Como proceso de investigación a veces es destructivo, la muestra puede ahorrar el producto.5.Si el acceso a la población es imposible, la muestra es la única opción.

Page 32: Audiovisual de estad. inf.

UAEM UAPCI

Tarea.

Complementar los ejercicios del 1.1 al 1.4, conforme a la Metodología ABP

Bibliografía: •(Aguilar Márquez A, 2010,p. 4). Introducción a la Inferencia Estadística. ,•Black Ken, 2010, cap 7, p. 220). Estadística en los Negocios

Page 33: Audiovisual de estad. inf.

UAEM UAPCI

La estadística, ciencia o rama de las Matemáticas que se ocupa de recoger datos, analizarlos y organizarlos, y de realizar las predicciones que sobre esos datos puedan deducirse, tiene dos vertientes básicas:

1.2 Inferencia Estadística

I. Teoría del Muestreo

Page 34: Audiovisual de estad. inf.

UAEM UAPCI

a) Estadística descriptiva: A partir de ciertos

datos, los analiza y organiza. Es aquí donde tiene sentido calcular la media, mediana, moda, desviación, media, desviación típica, etc.

I. Teoría del Muestreo

Page 35: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del Muestreo

b) Estadística Inferencial: Se ocupa de predecir, sacar conclusiones, para una población tomando como base una muestra (es decir , una parte) de dicha población. Como todas las predicciones, siempre han de hacerse bajo un cierto grado de fiabilidad o confianza. Será esta última vertiente de la estadística la que estudiemos en este tema.

Page 36: Audiovisual de estad. inf.

UAEM UAPCI

1.2 Inferencia Estadística

I. Teoría del Muestreo

La inferencia estadística o estadística Inferencial es una parte de la Estadística que comprende los métodos y procedimientos para hacer inferencias de una población, a partir de una pequeña parte de la misma (muestra).

Page 37: Audiovisual de estad. inf.

UAEM UAPCI

Revisión de La tarea

Recordatorio y/o preguntas de la clase anterior:

Con tus palabras define que es una muestra

¿Que es una población?

¿Cuando es conveniente utilizar una muestra y cuando un censo?

¿Por que razones es conveniente utilizar una muestra?

I. Teoría del Muestreo

Page 38: Audiovisual de estad. inf.

UAEM UAPCI

Objetivo de la Clase:

Identificar las ventajas y desventajas que ofrecen algunas técnicas de muestreo probabilístico.

I. Teoría del Muestreo

Page 39: Audiovisual de estad. inf.

UAEM UAPCI

En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos de una población), se selecciona una muestra, entendiendo por tal una parte representativa de la población.

I. Teoría del Muestreo

Introducción

Page 40: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del Muestreo

El muestreo es por lo tanto una herramienta de la investigación científica, cuya función básica es determinar que parte de una población debe examinarse, con la finalidad de hacer inferencias sobre dicha población.

Page 41: Audiovisual de estad. inf.

UAEM UAPCI

I.3 Muestreo con o sin Remplazo

I. Teoría del Muestreo

Una muestra probabilística es una muestra extraída de una población, de manera tal que todo miembro de la población tenga una probabilidad conocida de ser incluido en la muestra.

Page 42: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del Muestreo

Si se extrae una muestra de tamaño n de una población N, de manera tal que toda muestra posible de tamaño n tenga la misma probabilidad de ser seleccionada, la muestra recibe el nombre de muestra aleatoria simple.

Page 43: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del Muestreo

I.3 Muestreo con o sin Remplazo

Con reemplazo.

Si un elemento se extrae de la población y posteriormente se regresa a la misma, tiene la posibilidad de quedar incluido otra vez en la muestra en otra extracción.

Page 44: Audiovisual de estad. inf.

UAEM UAPCI

Sin reemplazo.

Si el elemento extraído no se regresa a la población entonces, solamente formará parte de la muestra una sola vez.

I. Teoría del Muestreo

Page 45: Audiovisual de estad. inf.

UAEM UAPCI

Ejemplo:

Si sacamos un número de una urna, podemos volverlos en ella o no, antes de la siguiente extracción. En el primer caso, ese número puede salir de nuevo mas veces, mientras que en el segundo pueda salir cada numero una vez.

Estos dos tipos de muestras se llaman, respectivamente, Muestras con reposición y muestra sin reposición

I.3 Muestreo con o sin Remplazo

I. Teoría del Muestreo

Page 46: Audiovisual de estad. inf.

UAEM UAPCI

Las poblaciones son finitas o infinitas.

Si por ejemplo, sacamos 10 bolas sucesivamente, sin reposición, de una urna que contiene 100 bolas, estamos tomando muestra de población finita; mientras que si lanzamos 50 veces una moneda contamos el numero de caras, estamos ante una muestra de población infinita. 

I.3 Muestreo con o sin Remplazo

I. Teoría del Muestreo

Page 47: Audiovisual de estad. inf.

UAEM UAPCI

Una población finita en la que se efectúa muestra con reposición, puede considerarse infinita teóricamente, ya que puede tomar cualquier numero de muestras sin agotarla.

Para muchos efectos prácticos, una población muy grande se puede considerar como si fuera infinita.

I. Teoría del Muestreo

Page 48: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del Muestreo

I.3 Muestras Aleatorias

Muestra Aleatoria. Es una muestra sacada de una población de unidades, de manera que todo elemento de la población tenga la misma probabilidad de selección y que las unidades diferentes se seleccionen independientemente.

Page 49: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del Muestreo

Muestreo Aleatorio Simple

Este tipo de muestreo requiere que cada elemento de la población tenga la misma probabilidad de ser seleccionado en la muestra.

I.3 Muestras Aleatorias

Page 50: Audiovisual de estad. inf.

UAEM UAPCI

El procedimiento empleado es el siguiente:

1) Se asigna un número a cada individuo de la población.

2) A través de algún medio mecánico (bolas dentro de una bolsa, tablas de números aleatorios, números aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerido.

Muestreo Aleatorio Simple

I. Teoría del Muestreo

Page 51: Audiovisual de estad. inf.

UAEM UAPCI

Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la población que estamos manejando es muy grande.

Muestreo Aleatorio Simple

I. Teoría del Muestreo

Page 52: Audiovisual de estad. inf.

UAEM UAPCI

Este procedimiento exige, como el anterior, numerar todos los elementos de la población, pero en lugar de extraer n números aleatorios sólo se extrae uno.

I. Teoría del Muestreo

Muestreo aleatorio sistemático:

Page 53: Audiovisual de estad. inf.

UAEM UAPCI

Se parte de ese número aleatorio i, que es un número elegido al azar, y los elementos que integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k.

I. Teoría del Muestreo

Muestreo aleatorio sistemático:

Page 54: Audiovisual de estad. inf.

UAEM UAPCI

Siendo k el resultado de dividir el tamaño de la población entre el tamaño de la muestra: k= N/n. El número i que empleamos como punto de partida será un número al azar entre 1 y k.

I. Teoría del Muestreo

Muestreo aleatorio sistemático:

Page 55: Audiovisual de estad. inf.

UAEM UAPCI

El riesgo en este tipo de muestreo está en los casos en que se dan periodicidades en la población ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una homogeneidad que no se da en la población.

I. Teoría del Muestreo

Muestreo aleatorio sistemático:

Page 56: Audiovisual de estad. inf.

UAEM UAPCI

Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son varones y los 5 últimos mujeres, si empleamos un muestreo aleatorio sistemático con k=10 siempre seleccionaríamos o sólo hombres o sólo mujeres, no podría haber una representación de los dos sexos.

I. Teoría del Muestreo

Muestreo aleatorio sistemático:

Page 57: Audiovisual de estad. inf.

UAEM UAPCI

Muestreo Estratificado

Ya que el muestreo aleatorio simple por lo general no asegura una muestra representativa, un método de muestreo conocido como muestreo aleatorio estratificado se usa algunas veces para lograr que la muestra represente mejor a la población. El método puede ser utilizado siempre y cuando la población tenga distintos estratos o grupos.

I. Teoría del Muestreo

Page 58: Audiovisual de estad. inf.

UAEM UAPCI

Muestreo Estratificado

En el muestreo estratificado necesitas identificar a los miembros de la muestra, que pertenecen a cada grupo, entonces muestreas aleatoriamente cada uno de estos subgrupos, de tal manera que los tamaños de estos, en la muestra, sean proporcionales a sus tamaños en la población.

I. Teoría del Muestreo

Page 59: Audiovisual de estad. inf.

UAEM UAPCI

Con este muestreo se asegura de que todos los estratos de interés estarán representados adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarán parte de la muestra.

En ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la población. (Tamaño geográfico, sexos, edades,...).

I. Teoría del Muestreo

Muestreo Estratificado

Page 60: Audiovisual de estad. inf.

UAEM UAPCI

Supón que estas interesado en la opinión de los trabajadores del CEDIS, acerca del servicio del transporte. Tienes el tiempo y los recursos para entrevistar a 200 trabajadores. Estos se pueden dividir respecto al turno.

Es posible que los trabajadores de la tarde tengan un punto de vista muy diferente sobre el servicio de transporte.

Ejemplo:

I. Teoría del Muestreo

Page 61: Audiovisual de estad. inf.

UAEM UAPCI

Si el 70% de los trabajadores son del turno matutino, tiene sentido asegurarse que el 70% de la muestra este constituida por trabajadores de ese turno. Entonces, tu muestra de 200 trabajadores tendrá 140 trabajadores del turno matutino y 60 trabajadores del turno Vespertino.

La proporción de trabajadores de los dos turnos en la muestra y en la población (total de trabajadores del CEDIS) sería igual.

Ejemplo:

I. Teoría del Muestreo

Page 62: Audiovisual de estad. inf.

UAEM UAPCI

Muestreo aleatorio por conglomerados:

Los métodos presentados hasta ahora están pensados para seleccionar directamente los elementos de la población, es decir, que las unidades muéstrales son los elementos de la población.

I. Teoría del Muestreo

Page 63: Audiovisual de estad. inf.

UAEM UAPCI

Muestreo aleatorio por conglomerados:

En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la población que forman una unidad, a la que llamamos conglomerado. Las unidades hospitalarias, los departamentos universitarios, una caja de determinado producto, etc., son conglomerados naturales.

I. Teoría del Muestreo

Page 64: Audiovisual de estad. inf.

UAEM UAPCI

Muestreo aleatorio por conglomerados:

En otras ocasiones se pueden utilizar conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los conglomerados son áreas geográficas suele hablarse de "muestreo por áreas"

I. Teoría del Muestreo

Page 65: Audiovisual de estad. inf.

UAEM UAPCI

El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de conglomerados (el necesario para alcanzar el tamaño muestral establecido) y en investigar después todos los elementos pertenecientes a los conglomerados elegidos.

Muestreo aleatorio por conglomerados:

I. Teoría del Muestreo

Page 66: Audiovisual de estad. inf.

UAEM UAPCI

Muestreos mas sofisticados

Algunas veces no es posible utilizar un muestreo aleatorio simple. Supón que algunas ciudades de la forntera concursan en la Aduana para meter sus negocios de exportación e importación de productos como son: Piedras Negras, Nuevo Laredao, Acuña, Reynosa etc.

Imagina que te contratan para evaluar si la mayoría de los habitantes de Acuña prefiere Acuña o Piedras Negras como ciudad seleccionada. Dado lo impráctico de obtener la opinión de todos y cada uno de los habitantes, debes determinar una muestra de esta población. Pero en este momento te das cuenta de la dificultad de realizar un muestreo aleatorio simple.

I. Teoría del Muestreo

Page 67: Audiovisual de estad. inf.

UAEM UAPCI

Muestreos mas sofisticados

Por ejemplo, si te basas en el registro Federal Electoral como vas a contactar a aquellos individuos que no votan; si es con base en los directorios telefónicos, como vas a localizar a los que no tienen teléfono incluso entre las personas que aparecen el los directorios telefónicos ¿como puedes identificar a los que acaban de mudarse del estado?

I. Teoría del Muestreo

Page 68: Audiovisual de estad. inf.

UAEM UAPCI

¿Qué haces con el hecho de que desde el inicio del estudio otras personas han establecido su residencia en el estado etc. Por esta razón se han desarrollado otras clases de técnicas de muestreo.

Asignación Aleatoria

En la investigación experimental, las poblaciones por lo general son hipotéticas. Por ejemplo, para comparar la efectividad de un nuevo analgésico que se planea introducir en el mercado no existe una población real de individuos que tomen la medicina.

I. Teoría del Muestreo

Page 69: Audiovisual de estad. inf.

UAEM UAPCI

En este caso la población se define con gente con algún grado de dolor y se toma una muestra aleatoria de esta población.

La muestra en forma aleatoria se divide en dos grupos; a un grupo se le asigna la condición de tratamiento (analgésico) y al otro grupo el control (placebo). La división aleatoria en dos grupos se denomina asignación aleatoria.

I. Teoría del Muestreo

Page 70: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del Muestreo

La asignación aleatoria es critica para la validez de un experimento. Por ejemplo, considera el sesgo que se produce si los primeros 20 individuos seleccionados se asignan al grupo experimental y los siguientes 20 al grupo control. Es posible que los sujetos que se seleccionaron al final tiendan a tener mayor nivel de dolor que los primeros, sin ninguna otra razón mas que el azar.

Page 71: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del Muestreo

En este caso, el resultado seria que el grupo experimental tendrá menor dolor que el grupo control, aun antes de que se administre la medicina.

En una investigación experimental de este tipo, la falta de asignación aleatoria de los sujetos a los grupos es generalmente mas grave que tener una muestra no aleatoria. La falta de aleatorización invalida los resultados experimentales; las muestras no aleatorias solo restringen la generalización de los resultados.

Page 72: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del Muestreo

Tamaño de la Muestra

Recuerda que la definición de una muestra seleccionada al azar es aquella en la cual cada elemento de la población tiene la misma probabilidad de ser seleccionado. Las muestras escogidas al azar especialmente si el tamaño de la muestra es pequeño no son representativas de la población.

Page 73: Audiovisual de estad. inf.

UAEM UAPCI

Tamaño de la Muestra

Solo una muestra grande es probable que sea representativa de la población. Por esta razón la inferencia estadística toma en cuenta el tamaño de muestra cuando se generalizan los resultados encontrados en las muestras.

I. Teoría del Muestreo

Población

Muestra

Page 74: Audiovisual de estad. inf.

UAEM UAPCI

Determinación del tamaño de muestra

La cuestión de que tan grande tomar una muestra surge inmediatamente en la planificación de cualquier investigación o experimento.

Tomar una muestra mas grande de lo necesario para alcanzar los resultados deseados, es un desperdicio de recursos, mientras que muestras muy pequeñas pueden conducir a conclusiones erróneas.

I. Teoría del Muestreo

Page 75: Audiovisual de estad. inf.

UAEM UAPCI

El tamaño idóneo de la muestra depende del grado de precisión que se quiera alcanzar con el estudio.

Dos medidas sirven para determinar el grado de precisión:

Error de Muestreo: Es la diferencia real entre la media de la muestra y la media real poblacional (e)

Nivel de Confianza: Es el numero de veces, en porcentaje (z), o tanto por uno, que obtendremos un resultado situado entre unos limites determinados.

I. Teoría del Muestreo

Page 76: Audiovisual de estad. inf.

UAEM UAPCI

1. Factor de elevación es el cociente entre el tamaño de la población y el tamaño de la muestra.

2. Factor de muestreo: es el cociente entre el tamaño de la muestra y el tamaño de la población.

Representa el número de elementos que hay en la población por cada elemento de la muestra.

nN

Si se multiplica por 100, obtenemos el porcentaje de la población que representa la muestra.

n

N

I. Teoría del Muestreo

Page 77: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del MuestreoTIPOS DE

MUESTREO CARACTERISTICAS VENTAJAS DESVENTAJAS

Se selecciona una muestra

de tamaño n de una población de N unidades, cada elemento tiene una probabilidad de inclusión

igual y conocida de n/N

Sencillo y de fácil comprensión. · Cálculo rápido de medias y varianzas. · Se basa en la teoría estadística, y por tanto existen paquetes informáticos para analizar los datos

Requiere que se posea de antemano un

listado completo de toda la población. Cuando se trabaja con muestras pequeñas es posible que no represente a la población adecuadamente.

Aleatorio Simple

Sistemático

Conseguir un listado de los N elementos de la población Determinar tamaño muestral n. Definir un intervalo k= N/n. Elegir un número aleatorio, r, entre 1 y k (r= arranque aleatorio). Seleccionar los elementos de la lista.

Fácil de aplicar. · No siempre es necesario tener un listado de toda la población. · Cuando la población está ordenada siguiendo una tendencia conocida, asegura una cobertura de unidades de todos los tipos.

Si la constante de muestreo está asociada con el fenómeno de interés, las estimaciones obtenidas a partir de la

muestra pueden contener sesgo de selección

Page 78: Audiovisual de estad. inf.

UAEM UAPCI

TIPOS DE MUESTREO CARACTERISTICAS VENTAJAS DESVENTAJAS

Estratificado

En ciertas ocasiones resultará conveniente estratificar la muestra según ciertas variables de interés. Para ello debemos conocer la composición estratificada de la población objetivo a hacer un muestreo. Una vez calculado el tamaño muestral apropiado, este se reparte de manera proporcional entre los

distintos estratos definidos en la población usando una simple regla de tres.

Tiende a asegurar que la muestra represente adecuadamente a la población en función de unas variables seleccionadas. · Se obtienen estimaciones más precisa · Su objetivo es conseguir una muestra lo más semejante posible a la población en lo que a la o las variables estratificadoras se refiere.

Se ha de conocer la distribución en la población de las variables utilizadas para

la estratificación.

Conglomerados

Se realizan varias fases de muestreo sucesivas. La necesidad de listados de las unidades de una etapa se limita a aquellas unidades de muestreo seleccionadas en la etapa anterior.

Es muy eficiente cuando la población es muy grande y dispersa. · No es preciso tener un listado de toda la oblación, sólo de las unidades primarias de muestreo.

El error estándar es mayor que en el muestreo aleatorio simple o estratificado. · El cálculo del error estándar es complejo.

Page 79: Audiovisual de estad. inf.

UAEM UAPCI

Tarea: Entregar para la siguiente clase 5 casos por equipo en los que se aplique los tipos de muestreo vistos el día de hoy.

Bibliografía:

•(Aguilar Márquez A, 2010,). Introducción a la Inferencia Estadística. ,•Black Ken, 2010, cap 7.). Estadística en los Negocios

Mesografía:

http://www.estadistica.mat.uson.mx/Material/elmuestreo.pdf

http://uproimni.blogspot.com/2008/03/tipos-de-muestreo.html

Page 80: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del Muestreo

1.5 Parámetros Poblacionales

Introducción

Una característica importante de cualquier población es su posición, es decir, donde esta situada con respecto al eje horizontal. En nuestro caso, es importante saber si los datos se agrupan alrededor de cierta cantidad.

Una manera de obtener un dato numérico que nos de idea de la posición de nuestra población es calcular el promedio o media de todas las observaciones.

Page 81: Audiovisual de estad. inf.

UAEM UAPCI

Este importante parámetro nos permite efectuar comparaciones entre distintas poblaciones.

Ejemplo: Si tuviéramos una población formada por mediciones de peso de mujeres de 30 años, otra de peso de varones de 40 años y una tercera de peso de niños de 8 años, es indudable que los promedios van a ser diferentes.

I. Teoría del Muestreo

1.5 Parámetros Poblacionales

ℳ= ∑ x i

N

Page 82: Audiovisual de estad. inf.

UAEM UAPCI

El promedio, entonces, nos esta diciendo que las tres poblaciones son diferentes y también en que medida difieren.

Ahora, si tuviéramos una población de varones con peso promedio 70 kg. Y otra población de varones con el mismo promedio ¿se puede afirmar que ambas poblaciones son equivalentes?

I. Teoría del Muestreo

1.5 Parámetros Poblacionales

Page 83: Audiovisual de estad. inf.

UAEM UAPCI

Para responder esta pregunta necesitamos tener medidas de la dispersión de la población de datos.

No es lo mismo si en nuestra población encontramos que todos los valores están entre 75 y 90 kg. que si están entre 60 y 105 kg., aunque el promedio sea el mismo.

I. Teoría del Muestreo

1.5 Parámetros Poblacionales

Page 84: Audiovisual de estad. inf.

UAEM UAPCI

Es necesario agregar alguna idea de la dispersión de los valores.

Una manera es a través del Rango de las observaciones, es decir, el valor Máximo y el Valor Mínimo de los datos de la población.

Una manera mas precisa de dar idea de la dispersión de valores de una población es a través de la varianza o su raíz cuadrada, que es la Desviación Standard

I. Teoría del Muestreo

1.5 Parámetros Poblacionales

Page 85: Audiovisual de estad. inf.

UAEM UAPCI

Ejemplo:

Calculemos la varianza y la Desviación estándar de un número pequeño de datos para ilustrar el calculo.

Supongamos que se midió la altura de 10 pacas de ropa de mujer en un almacén y se obtuvieron los valores

I. Teoría del Muestreo

1.5 Parámetros Poblacionales

Page 86: Audiovisual de estad. inf.

UAEM UAPCI

El promedio de estas observaciones es:

Si a cada una de las observaciones le restamos el promedio, obtenemos los Residuos.

I. Teoría del Muestreo

1.5 Parámetros Poblacionales

= 163.2 cm

Page 87: Audiovisual de estad. inf.

UAEM UAPCI

Los residuos también nos dan una idea de la dispersión de las observaciones individuales alrededor del promedio. Si el valor absoluto de los residuos es grande, es porque los valores están muy dispersos.

xi xi -x

I. Teoría del Muestreo

1.5 Parámetros Poblacionales

Page 88: Audiovisual de estad. inf.

UAEM UAPCI

Si el valor absoluto de los residuos es pequeño, significa que las observaciones individuales están muy cerca del promedio, y por lo tanto, hay poca dispersión.

Pero nosotros necesitamos un solo número que nos provea información acerca de la dispersión de los valores

I. Teoría del Muestreo

1.5 Parámetros Poblacionales

Page 89: Audiovisual de estad. inf.

UAEM UAPCI

Si sumamos los residuos, como algunos son positivos y otros negativos, se cancelarían entre si, con lo cual perdemos la información acerca de la dispersión. Entonces, los elevamos al cuadrado:

xi xi -x (xi –x)2

I. Teoría del Muestreo

1.5 Parámetros Poblacionales

Page 90: Audiovisual de estad. inf.

UAEM UAPCI

Si ahora sumamos los residuos elevados al cuadrado, tenemos un número donde se centra toda la información de la dispersión de la población.

Suma de Cuadrados

Este número, es dependiente del número de datos N, y por tanto no nos sirve para comparar poblaciones con distinto número de observaciones.

I. Teoría del Muestreo

1.5 Parámetros Poblacionales

Page 91: Audiovisual de estad. inf.

UAEM UAPCI

Pero si dividimos la suma de cuadrados entre N, tenemos un número que es independiente del número de observaciones, que se denomina Varianza:

I. Teoría del Muestreo

1.5 Parámetros Poblacionales

Page 92: Audiovisual de estad. inf.

UAEM UAPCI

Las formulas anteriores son las que se aplican al calculo de la varianza y desviación estándar de una población de datos. Mas adelante veremos que las formulas a aplicar en el caso de una muestra son ligeramente diferentes.

La varianza es un número que nos permite comparar poblaciones. Cuando la dispersión de las observaciones es grande, el valor de los residuos será grande

I. Teoría del Muestreo

1.5 Parámetros Poblacionales

Page 93: Audiovisual de estad. inf.

UAEM UAPCI

Entonces aumenta la suma de cuadrados de los residuos y por lo tanto la varianza. También se utiliza la raíz cuadrada de la varianza:

I. Teoría del Muestreo

1.5 Parámetros Poblacionales

Page 94: Audiovisual de estad. inf.

UAEM UAPCI

La desviación estándar o desviación típica tiene las mismas unidades que la variable con la que estamos trabajando, en nuestro caso el centímetro.

Tanto la varianza como la desviación estándar nos permiten comparar el grado de dispersión de distintas poblaciones.

I. Teoría del Muestreo

1.5 Parámetros Poblacionales

Page 95: Audiovisual de estad. inf.

UAEM UAPCI

La media, varianza y desviación estándar de una población o universo se denominan parámetros de la población y en general se designan con letras griegas:

Media:

Varianza:

Desviación Estándar:

I. Teoría del Muestreo

1.5 Parámetros Poblacionales

Page 96: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del Muestreo

En el caso de una muestra, la media, varianza y desviación estándar se denomina estadísticos y se utilizan letras de nuestro alfabeto:

Media

Varianza

Desviación Estándar muestrales

1.5 Parámetros Poblacionales

Page 97: Audiovisual de estad. inf.

UAEM UAPCI

El calculo de varianza y la desviación estándar de una muestra de n observaciones se realiza con una formula levemente diferente que la ya vista para la varianza y desviación estándar de una población:

1.5 Parámetros Poblacionales

I. Teoría del Muestreo

Varianza

Desviación estándar n – 1.

Page 98: Audiovisual de estad. inf.

UAEM UAPCI

En lugar de dividir entre n, el número total de

observaciones en la muestra, dividimos entre n – 1.

Este valor, n – 1, son los Grados de Libertad de la muestra. En general, cuando tenemos una muestra de n observaciones, se dice que la misma tiene n – 1 grados de libertad.

1.5 Parámetros Poblacionales

I. Teoría del Muestreo

Page 99: Audiovisual de estad. inf.

UAEM UAPCI

La media, varianza y desviación estándar de una muestra, en general, no van a coincidir con los mismos parámetros de la población de la cual se extrajo la muestra (aunque usemos la misma formula para calcular la varianza muestral y poblacional).

1.5 Parámetros Poblacionales

I. Teoría del Muestreo

Page 100: Audiovisual de estad. inf.

UAEM UAPCI

Si extraemos n muestras de una población, vamos a obtener n promedios muestrales distintos del promedio de la población y n varianzas muestrales distintas de la varianza de la población.

Esto se debe a que una población o universo tiene un número muy grande de datos, mientras que una muestra son solo algunos pocos datos extraídos de ese universo.

1.5 Parámetros Poblacionales

I. Teoría del Muestreo

Page 101: Audiovisual de estad. inf.

UAEM UAPCI

Cuando sacamos una segunda, tercera, … etc. muestras, los datos extraídos no tienen por que ser los mismos que en la primer muestra.

Por lo tanto, el promedio y la varianza de las muestras van a ser distintos para las distintas muestras, y distintos de la media y la varianza de la población de las cual se extrajeron las muestras.

1.5 Parámetros Poblacionales

I. Teoría del Muestreo

Page 102: Audiovisual de estad. inf.

UAEM UAPCI

Ejercicio 1:

Los pesos ( en libras ) de una muestra de cinco cajas enviadas por el servicio de mensajería UPS es:

12 6 7 3 10

a)Obtenga la amplitud de la variación

b) Calcule la media, la varianza y desviación estándar.

I. Teoría del Muestreo

Page 103: Audiovisual de estad. inf.

UAEM UAPCI

Utiliza la computadora para encontrar la varianza muestral y desviación estándar muestral de los siguientes datos.

Utiliza la computadora para hallar la varianza poblacional y desviación estándar poblacional para los siguientes datos.

I. Teoría del Muestreo

Ejercicio 2

Page 104: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del Muestreo

1.6 Distribución muestral de medias

Objetivo de la clase: Examinar las posibilidades de una media muestral y tratar de determinar de que manera estan distribuidas.

Page 105: Audiovisual de estad. inf.

UAEM UAPCI

1.6 Distribución muestral de medias

I. Teoría del Muestreo

Page 106: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del Muestreo

8.25

Page 107: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del Muestreo

Page 108: Audiovisual de estad. inf.

UAEM UAPCI

1 2 3 4 5 6 7 8 9 10

1 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 1,10

2 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 2,10

3 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 3,10

4 4,1 4,2 4,3 4,4 4,5 4,6 4,7 4,8 4,9 4,10

5 5,1 5,2 5,3 5,4 5,5 5,6 5,7 5,8 5,9 5,10

6 6,1 6,2 6,3 6,4 6,5 6,6 6,7 6,8 6,9 6,10

7 7,1 7,2 7,3 7,4 7,5 7,6 7,7 7,8 7,9 7,10

8 8,1 8,2 8,3 8,4 8,5 8,6 8,7 8,8 8,9 8,10

9 9,1 9,2 9,3 9,4 9,5 9,6 9,7 9,8 9,9 9,10

10 10,1 10,2 10,3 10,4 10,5 10,6 10,7 10,8 10,9 10,10

I. Teoría del Muestreo

Page 109: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del Muestreo

1 1 1/100 0.011.5 2 2/100 0.022 3 3/100 0.03

2.5 4 4/100 0.043 5 5/100 0.05

3.5 6 6/100 0.064 7 7/100 0.07

4.5 8 8/100 0.085 9 9/100 0.09

5.5 10 10/100 0.16 9 9/100 0.09

6.5 8 8/100 0.087 7 7/100 0.07

7.5 6 6/100 0.068 5 5/100 0.05

8.5 4 4/100 0.049 3 3/100 0.03

9.5 2 2/100 0.0210 1 1/100 0.01

Total 100 100/100 1

Frecuencia Frecuencia relativax

Page 110: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del Muestreo

Distribución de la población

Distribución muestral de la media para n=2 x

Page 111: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del Muestreo

Media de la distribución muestral

Page 112: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del Muestreo

Page 113: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del Muestreo

Page 114: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del Muestreo

Page 115: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del Muestreo

Page 116: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del Muestreo

Z=x µ

= 40.5 - 41.5

2.5

√ 50

= -2.86

= 42- 41.5

2.5

√ 50

= 1.43

Buscando en la tabla z (- +)

= - 0.0021

= 0.9236

0.9236 - 0.0021 = 0.9215

= 92.15%

Page 117: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del Muestreo

Page 118: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del Muestreo

Page 119: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del Muestreo

Page 120: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del Muestreo

Page 121: Audiovisual de estad. inf.

UAEM UAPCI

A veces, al analizar una muestra, un investigador escoge usar la proporción muestral, denotada como p, si la investigación produce datos mensurables como es peso, distancia, tiempo e ingreso, la media muestral es a veces la estadística mas selecta pero.

Si la investigación resulta en artículos contables como por ejemplo, cuantas personas de una muestra escogen la marca del Dr. Papper como su refresco o cuantas personas de una muestra tienen un horario flexible de trabajo, la proporción muestral a veces es la mejor estadística.

I. Teoría del Muestreo

Page 122: Audiovisual de estad. inf.

UAEM UAPCI

Mientras que la media se calcula al promediar un conjunto de valores, la proporción muestral se calcula al dividir la frecuencia con la cual una característica dada se presenta en una muestra entre el numero de elementos de la muestra

I. Teoría del Muestreo

X= número de elementos de una muestra que tienen la característica.

n = número de elementos de la muestra

P= Xn

^

Page 123: Audiovisual de estad. inf.

UAEM UAPCI

En una muestra de 100 trabajadores de un CEDIS, 30 trabajadores pertenecen a un sindicato. El valor de p para esta característica, sindicalizados es de 30/100 y es igual a 0.30. en una muestra de 500 negocios en zonas comerciales peatonales, si 10 son zapaterías entonces la proporción muestral de zapaterías es de 10/500 =0.02.

I. Teoría del Muestreo

Page 124: Audiovisual de estad. inf.

UAEM UAPCI

La proporción muestral es una estadística de gran uso y suele calcularse sobre preguntas que comprendan respuestas si o no. Por ejemplo, ¿tiene usted al menos educación secundaria? ¿Es usted predominantemente diestro? ¿Es usted mujer? ¿Pertenece usted a una asociación de estudiantes de logística? ¿Cómo usa un investigador la proporción muestral en el análisis?.

I. Teoría del Muestreo

Page 125: Audiovisual de estad. inf.

UAEM UAPCI

El teorema de limite central aplica a proporciones muestrales en que la distribución normal se aproxima a la forma de distribución de proporciones muestrales. Si n.p>5y n.q>5 ¿p es la proporción poblacional y q =1-p?. La media de proporciones muestrales para todas las muestras de tamaño n sacadas al azar de una población p (la proporción poblacional) y la desviación estándar de proporciones muestrales es:

p.q/n

I. Teoría del Muestreo

A veces llamada error estándar de la proporción. Las proporciones muestrales también tienen una formula de Z

FORMULA DE Z PARA PROPORCIONES

MUESTRALES PARA

P= Proporción Muestraln= tamaño muestralP= proporción poblacionalq= 1-p

n.p>5y n.q>5

^

Z=

^P - P

p.q/n

Page 126: Audiovisual de estad. inf.

UAEM UAPCI

Suponga que 60% de los contratistas eléctricos de una región usan una marca particular de alambre ¿Cuál es la probabilidad de tomar una muestra aleatoria de tamaño 120 de estos contratistas eléctricos y encontrar que el 0.50 o menos usan la marca de alambre? Para este problema:

p= 0.60 p=.50 y n=120

La formula de z proporciona:

Z=

^

.50-.60

.60*.40

120

= -.10/.0447 = -2.24 = .0125

Page 127: Audiovisual de estad. inf.

UAEM UAPCI

I. Teoría del Muestreo

TAREA

Page 128: Audiovisual de estad. inf.

UAEM UAPCI

En el estudio del contenido de la grasa en la leche light. Supón que el contenido medio de grasa en cada envase de un litro se distribuye en forma normal con una media de 10g y una desviación estándar de 2.5g. ¿Cuáles son los parámetros de distribución muestral de la media para un tamaño de muestra de 9 envases?

I. Teoría del Muestreo

Page 129: Audiovisual de estad. inf.

UAEM UAPCI

σx

Recordemos que la sección de la distribución muestral de la media vimos que la media de la distribución muestral es µ, y el error estándar de la media viene dada por

Para nuestro ejemplo, la distribución muestral de la media tiene una media de 10 y una desviación estándar de 2.5/3=0.83 observa que la desviación estándar de la distribución muestral es el error estándar.

10 – (1.96)(0.83)= 8.4 10 + (1.96)(0.83)= 11.6

I. Teoría del Muestreo

Page 130: Audiovisual de estad. inf.

UAEM UAPCI

108.4 11.6

Estos limites se calcularon sumando y restando 1.96 que es el valor de z de la tabla que le corresponde al 95% del área de una distribución normal con centro en la media de la distribución; el error estándar de la media es 0.83.

Ya que el 95% de la distribución se encuentra entre 10± 1.6 unidades. Y es la probabilidad de que la media calculada a partir de una muestra dada no se aleje mas de 1.6 de 10 es 0.95.

I. Teoría del Muestreo

Page 131: Audiovisual de estad. inf.

UAEM UAPCI

Universidad Autónoma del Estado de México.

Licenciatura en Logística

Unidad Académica Profesional de Cuautitlán Izcalli.

Unidad 2

“Estadística Inferencial”

M. en C.T.C. Gabriela Gaviño Ortiz.e-mail: [email protected]

[email protected]

Page 132: Audiovisual de estad. inf.

UAEM UAPCI

2. Teoría de Estimación

2.1 Estimación de Intervalos de confianza y parámetros poblacionales.

Objetivo: Calcular los intervalos de confianza y los parámetros poblacionales.

Page 133: Audiovisual de estad. inf.

UAEM UAPCI

2. Teoría de Estimación

2.1 Estimación de Intervalos de confianza y parámetros poblacionales.

Intervalo de Confianza: Es un rango de valores dentro del cual el analista puede declarar, con alguna confianza, que esta el parámetro poblacional. Los intervalos de confianza pueden ser de dos colas o de una cola. Presentaremos solo intervalos de confianza de dos colas.

Page 134: Audiovisual de estad. inf.

UAEM UAPCI

¿Cómo se construyen los intervalos de confianza?

Como resultado del teorema de limite central, la siguiente formula de z para medias muestrales puede usarse cuando los tamaños muestrales son grandes, cualquiera que sea la forma de la distribución poblacional o para tamaños mas pequeños si la población esta normalmente distribuida.

Z=x µ

2. Teoría de Estimación

Page 135: Audiovisual de estad. inf.

UAEM UAPCI

Al reacomodar esta formula algebraicamente para despejar µ tendremos:

Z=x µ

2. Teoría de Estimación

µ = X - z

Debido a que una media muestral puede ser mayor o menor que la media poblacional, z puede ser:

x ± zNegativa o positiva. Por tanto, la siguiente expresión se obtiene la formula de intervalo de confianza para estimarµ con tamaños muestrales grandes.

Page 136: Audiovisual de estad. inf.

UAEM UAPCI

100 (1 – α) % DE INTERVALO DE CONFIANZA PARA ESTIMAR µ

x ± zα/2

O bien

x - zα/2 ≤ µ ≤ x + zα/2

Donde:

α = área bajo la curva normal fuera del área de intervalo de confianza

α/2 = área en un extremo (cola) de la distribución fuera del intervalo de confianza

2. Teoría de Estimación

Page 137: Audiovisual de estad. inf.

UAEM UAPCI

Usamos α para localizar el valor de z para construir el intervalo como se ve en la figura. Debido a que la tabla normal estándar esta basada entre una z de 0 y z α/2, el valor de la tabla z se encuentra al localizar el área. .5000 – α/2, que es la parte de la curva normal entre la parte media de la curva y una de las colas. ]

(.5000 – α/2)

α = Área sombreada0

1 – αConfianza

α/2α/2

-Z α/2 Z α/2

2. Teoría de Estimación

Page 138: Audiovisual de estad. inf.

UAEM UAPCI

La formula del intervalo de confianza sirve para obtener un rango (intervalo) dentro del cual pensamos con alguna confianza que esta situada la media poblacional.

µ

95%Confianza

α/2= .025α/2= .025 Z = -1.96.4750

Z = +1.96.4750

2. Teoría de Estimación

Page 139: Audiovisual de estad. inf.

UAEM UAPCI

No es seguro que la media poblacional esté en el intervalo a menos que tengamos un intervalo de confianza de 100% que sea infinitamente ancho. Sin embargo, podemos asignar una probabilidad de que el parámetro (en este caso, µ) esta situado dentro del intervalo. La formula siguiente se puede presentar como un enunciado de probabilidad.

x - zα/2 ≤ µ ≤ x + zα/2 =1- αР

2. Teoría de Estimación

Page 140: Audiovisual de estad. inf.

UAEM UAPCI

para determinar un intervalo de confianza de 95% paraσ = 46, n =85 y z =1.96, el investigador estima el promedio de duración por llamada e incluye el valor de z en la formula.

x= 153

2. Teoría de Estimación

Una compañía de telefonía celular, mediante un investigador desea estimar el numero medio poblacional de minutos utilizados por usuario residencial por mes, tomados de la muestra de 85 cuentas se determino que la media muestral son 153 minutos. Calcular un intervalo de confianza dentro del cual el investigador esta relativamente confiado de que la media poblacional real esta localizada.

Page 141: Audiovisual de estad. inf.

UAEM UAPCI

153 -1.96 ≤ µ ≤ 153 +1.96 46 85

46 85

153 - 9.78

≤ µ ≤ 153 +9.78

143 .22 ≤ µ ≤ 162.78

El intervalo de confianza se construye de la estimación puntual, que en este problema es 153 minutos y el error de esta estimación que es de ± 9.78 minutos. El intervalo de confianza resultante es 143 .22 ≤ µ ≤ 162.78. el investigador de la compañía de telefonía celular tiene 95% de confianza de que la duración promedio de una llamada para la población sea entre 143.22 y 162.78 minutos.

2. Teoría de Estimación

Page 142: Audiovisual de estad. inf.

UAEM UAPCI

Se llevó a cabo una encuesta de compañías estadounidenses que hacen negocios en la india. Una de las preguntas de la encuesta fue: ¿aproximadamente cuantos años ha estado negociando su empresa con empresas de la india? Una muestra aleatoria de 44 respuestas a esta pregunta dio una media de 10.455 años. Suponga que la desviación estándar poblacional para esta pregunta es 7.7 años. Con el uso de esta información, construya un intervalo de confianza de 90% para el numero medio de años que una compañía negocia con la india para la población de empresas estadounidenses que comercian con sus empresas.

2. Teoría de Estimación

Page 143: Audiovisual de estad. inf.

UAEM UAPCI

Solución

Aquí, n = 44, X = 10.455, y σ = 7.7 para determinar el valor de Zα/2, dividida a la mitad el 90% de confianza, o tome .5000 – α/2 = .5000 - 0500. la distribución Z de X alrededor de µ, contiene .4500 del área en cada lado de µ, o ½ (90%). El cuadro del apéndice A.5 proporciona un valor de Z de 1.645 y para el área de. .4500 . El intervalo de confianza es:

2. Teoría de Estimación

Page 144: Audiovisual de estad. inf.

UAEM UAPCI

x - zα/2 ≤ µ ≤ x + zα/2

10.455 -1.645 ≤ µ ≤ 10.455 +1.645 7.7 44

7.7 44

10.455 -1.91 ≤ µ ≤ 10.455 +1.91

8.545

≤ µ ≤ 102.365

P [ 8.545 ≤ µ ≤ 102.365] = .90

I. Teoría de Estimación

Page 145: Audiovisual de estad. inf.

UAEM UAPCI

Estimar los diferentes tipos de intervalos de confianza, en sus diferentes modalidades.

2.1.1 Intervalo de confianza para estimar µ cuando σ se desconoce y n es grande.

En la mayor parte de los ejemplos la desviación estándar se desconoce como en el ejemplo de la telefonia celular, la duración promedio de una llamada es desconocida. La probabilidad de que la desviación estándar poblacional sea alta también se desconozca. Entonces, ¿como se maneja este dilema?.

A continuación se muestra la formula del intervalo de confianza para estimar µ con muestras grandes cuando se use la desviación muestral estándar.

x ± zα/2 Sn

Objetivo Específico:

Page 146: Audiovisual de estad. inf.

UAEM UAPCI

x - zα/2 Sn x + zα/2

Sn

≤ µ ≤

Como ejemplo, suponga que una empresa de Logística estadounidense que renta camiones de carga desea estimar el numero promedio de millas que recorren por día cada uno de los camiones de carga rentados en California. Una muestra aleatoria de 110 camiones de carga rentados en California revela que la distancia de viaje media muestral es de 85.5 millas, con una desviación muestral estándar de 19.3 millas. Calcule un intervalo de confianza para estimar µ.

Aquí, n = 110X = 85.5S = 19.3. para un nivel de 99% de confianza se obtiene un valor de Z de 2.575. El intervalo de confianza es:

2. Teoría de Estimación

Page 147: Audiovisual de estad. inf.

UAEM UAPCI

x - zα/2 Sn x + zα/2

Sn

≤ µ ≤

85.5 - 2.575 19.3

110 85.5 + 2.575 19.3

110≤ µ ≤

≤ µ ≤ 85.5 + 4.7 85.5 – 4.7

80.8 ≤ µ ≤ 90.2

La estimación puntual indica que el numero promedio de millas recorridas por día en un camión de carga rentado en California es de 85.5, con 99 % de confianza, estimamos que la media poblacional esta entre 80.8 y 90.2 millas por día.

2. Teoría de Estimación

Page 148: Audiovisual de estad. inf.

UAEM UAPCI

2. Teoría de Estimación

2.2 Intervalo de Confianza para Estimar la proporción poblacional.

Las compañías gastan miles de pesos en calcular la proporción de artículos producidos que son defectuosos. Las oportunidades de segmentación del mercado provienen de un conocimiento de la proporción de varias características demográficas en clientes potenciales. Es posible usar métodos semejantes a los anteriores vistos para estimar la proporción poblacional.

El teorema de limite central para proporciones muestrales usa la siguiente formula ya vista.

Page 149: Audiovisual de estad. inf.

UAEM UAPCI

Z=

^P - P

p.q/n

Donde q es igual a 1 – p. Recuerde que esta formula se puede aplicar solo cuando n . p y n . q son mayores a 5.

De la fórmula anterior resulta :p – Zα/2 ≤ p ≤ p + Zα/2 n

p.q^^

np.q^^^ ^

Donde:p^

= proporción muestral.

q^

= 1 - p^

p = proporción muestral.

n = proporción muestral

Y esta fórmula es la estimación puntual y ± Z α/2 n

^^p.q Es el error de

estimación

2. Teoría de Estimación

Page 150: Audiovisual de estad. inf.

Ejemplo

Una empresa dedicada al transporte y distribución de mercancías, tiene una plantilla de 50 trabajadores. Durante el último año se ha observado que 25 trabajadores han faltado un solo día al trabajo, 20 trabajadores han faltado dos días y 5 trabajadores han faltado tres días. Si se toma una muestra aleatoria, con reemplazamiento, de tamaño dos (X1, X2) del total de la plantilla, calcular:

1. La distribución de probabilidad del número de días que ha faltado al trabajo un empleado, su media y su varianza. 2. Distribución de probabilidad del estadístico media muestral. 3. La distribución de probabilidad del estadístico varianza muestral. 4. La media y varianza del estadístico media muestral. 5. La probabilidad de que el estadístico media muestral, sea menor que 2. 6. La media y varianza del estadístico varianza muestral. 7. La probabilidad de que el estadístico varianza muestral, sea menor o igual que 0.5.

Page 151: Audiovisual de estad. inf.

Solución 1 X: Número de días que ha faltado un empleado elegido aleatoriamente de la plantilla total.

xiP(X=xi)

1 P(X=1)=P(1) 25/50 0.5

2 P(X=2)=P(2) 20/50 0.43 P(X=3)=P(3) 5/50 0.1

50 trabajadores.

25 han faltado 1 día 20 han faltado 2 días 5 han faltado 3 días.

N

i iXN 1

1

Han faltado 25 una vez, 20 dos veces y 5 tres veces, por lo que el total de faltas es 80

6.180501

25(1)+20(2)+5(3)=80

N=50 tamaño de la población

Page 152: Audiovisual de estad. inf.

6.15080

50154025

505

35020

25025

1

)()(1

xExPxN

i ii

N

i iXN 1

22 1

2222 6.1356.12206.1125501 =0.44

)(22

ii

i xXPx

478.01.06.134.06.125.06.11 222

Page 153: Audiovisual de estad. inf.

Debido a ello y σ2 serán consideradas como la media y la varianza poblacional, respectivamente.

Ambas variables aleatorias X1 y X2 tienen la misma distribución de probabilidad que la de la variable aleatoria X, correspondiente a la población. Pero como nos interesa obtener la distribución de probabilidad de estadístico media muestral ocupamos la fórmula:

X1: Variable aleatoria correspondiente al número de días que falta el primer trabajador seleccionado.

X2: Variable aleatoria correspondiente al número de días que falta el segundo trabajador seleccionado.

Seleccionamos una muestra aleatoria, con reemplazamiento, de tamaño dos (X1, X2) :

2121

XXX

Para tener las distribuciones de probabilidad de los estadísticos X y S2 muestral necesitaremos tener los diferentes valores que puede tomar y sus probabilidades. Para ello empezaremos obteniendo las posibles muestras, con reemplazamiento, de tamaño dos.

Solución 2

Page 154: Audiovisual de estad. inf.

(Xi,Xj) X=(Xi+Xj)/2 s2 P(X1,X2)1,1 (1+1)/2 1 0.00 0.251,2 (1+2)/2 1.5 0.50 0.21,3 (1+3)/2 2 2.00 0.052,1 (2+1)/2 1.5 0.50 0.22,2 (2+2)/2 2 0.00 0.162,3 (2+3)/2 2.5 0.50 0.043,1 (3+1)/2 2 2.00 0.053,2 (3+2)/2 2.5 0.50 0.043,3 (3+3)/2 3 0.00 0.01

Para obtener las probabilidades correspondientes a los diferentes valores muestrales, tendremos en cuenta que las variables X1 y X2 son independientes, pues el muestreo se hizo con reemplaza-miento.

01.0)3(

08.004.004.0)5.2(

26.005.016.005.0)2(

4.02.02.0)5.1(

25.0)1(

XP

XP

XP

XP

XP La información que nos proporciona la tabla la utilizamos para obtener la distribución de probabilidad del estadístico media muestral X.

Valor del estadístico X P(X=x)1 0.25

1.5 0.42 0.26

2.5 0.083 0.01

)()(),( 2121 XPXPXXP

Page 155: Audiovisual de estad. inf.

Luego la distribución de probabilidad del estadístico varianza muestral S2 está dada por

0.02222

121

5.05.115.1212

1

0.2232112

1

5.05.125.1112

1

0111112

1

)(1

1

22

22

22

22

22

22

i

i xxn

s

Valor del estadístico s2 P(s2)0.00 0.420.50 0.482.00 0.10

Para el cálculo de la media y varianza del estadístico media muestral tendremos en cuenta su distribución de probabilidad dada.

6.1

01.0)3(08.0)5.2(26.0)2(50.0)5.1(25.0)1(

i

ix xXPxXE

22.0

01.06.1325.06.11

)(6.1

22

2

22

ii

i

x

xXPx

XEXE

Solución 3

Solución 4

Page 156: Audiovisual de estad. inf.

Al considerar la distribución de probabilidad del estadístico media muestral X podemos calcular

65.040.025.0

)5.1()1()2(

XPXPXP

Al considerar la distribución de probabilidad del estadístico media muestral S2 podemos calcular

44.0

1.00.2)48.0(5.042.00.0

)( 22222

ii

issSPssE

32.0

10.044.00.248.044.05.042.044.00.0 222

222

22222

2

2

i

iSsSPs

SESESVar

i

S

Solución 5

Solución 6

Page 157: Audiovisual de estad. inf.

Basándonos en la distribución de probabilidad del estadístico varianza muestral S2 se tiene que

90.048.042.0

)5.0()0.0()5.0( 222

SPSPSP

Con este ejemplo, queda de manifiesto que incluso para muestras de tamaño pequeño y estadísticos con pocos valores se hace pesado la obtención de la distribución de probabilidad de los estadísticos muestrales.

Solución 7

Page 158: Audiovisual de estad. inf.

MEDIA VARIANZA DE ALGUNOS ESTADÍSTICOS

En el Ejemplo anterior hemos obtenido: - La media, , y varianza σ2, poblacional. - Los estadísticos media X y varianza S2 muestral. - La media y varianza de los estadísticos media muestral X, y varianza muestral S2 para una muestra de tamaño n = 2.

Page 159: Audiovisual de estad. inf.

1. Es decir, que la media del estadístico media muestral es igual a la media de la población.

2. Es decir, que la media del estadístico varianza muestral es igual a la varianza de la población.

3. Es decir, que la varianza del estadístico media muestral es igual a la varianza de la población dividida por el tamaño de la muestra, n.

XEXE

XVarSE 2

2

XVarXVar

Page 160: Audiovisual de estad. inf.

UAEM UAPCI

Como ejemplo, un estudio de 87 Centros de distribución logística seleccionados al azar con una operación de telemercadeo, revelo que 39% de los CEDIS muestreados usaron telemercadeo para ayudarlos en el procesamiento de pedidos. Con el uso de esta información ¿como podría un investigador estimar la proporción poblacional de dichos CEDIS de telemercadeo que usa su operación de telemercadeo para ayudarlas en el procesamiento de pedidos? Con 95% de confianza.

Ejemplo 1:

Page 161: Audiovisual de estad. inf.

UAEM UAPCI

La proporción muestral, p = 0.39, es la estimación puntual de la proporción poblacional p. Para n= 87 y p = .39, se puede calcular un intervalo de confianza de 95% para determinar la estimación de intervalo de p. el valor de Z para 95% de confianza es 1.96. El valor de q = 1- p = 1 – 0.39 = 0.61. la estimación de intervalo de confianza es:

^

^^

^

2. Teoría de Estimación

Page 162: Audiovisual de estad. inf.

UAEM UAPCI

0.39 – 0.10 ≤ p ≤ 0.39 + 0.10

0.29 ≤ p ≤ 0.49

P [0.29 ≤ p ≤ 0.49] = 0.95

0.39 – 1.96 ≤ p ≤ 87(0.39)(0.61

0.39 + 1.9687

(0.39)(0.61

p – Zα/2 ≤ p ≤ p + Zα/2 np.q^^

np.q^^

^ ^

2. Teoría de Estimación

Page 163: Audiovisual de estad. inf.

UAEM UAPCI

Coopers & Librand encuestaron a 210 ejecutivos de alto nivel de compañías pequeñas pero de rápido crecimiento. Solo el 51% de estos ejecutivos tenían un plan de sucesión de administración en vigor.

Un vocero de Cooper & Librand dijo que muchas compañías no se preocupan por la sucesión de administración a menos que sea un problema inmediato. No obstante, el éxito inesperado de un líder corporativo puede alterar y desorganizar una compañía el tiempo suficiente para hacer que pierda su ritmo de trabajo.

Utilice los datos para calcular un intervalo de confianza del 92% el valor de Z.04=1.75 para estimar la proporción de todas las compañías pequeñas de rápido crecimiento que tienen un plan de sucesión de administración.

Ejemplo 2:

Page 164: Audiovisual de estad. inf.

UAEM UAPCI

La estimación puntual es la proporción muestral dada como 0.51 Se estima que 0.51 o 51% de todas las compañías pequeñas de rápido crecimiento tienen un plan de sucesión de administración. Si se ve que la administración puntual podría cambiar con otra selección muestral, calculamos un intervalo de confianza. El valor de n = 210; p = -51 y q = 1- p = 0 .49. Como el nivel de confianza es de 92%. el valor de Z.04=1.75. El intervalo de confianza se calcula como:

^ ^ ^

Solución:

p – Zα/2 ≤ p ≤ p + Zα/2 np.q^^

np.q^^

^ ^

Page 165: Audiovisual de estad. inf.

UAEM UAPCI

p – Zα/2 ≤ p ≤ p + Zα/2 np.q^^

np.q^^

^ ^

0.51 – 1.75 ≤ p ≤ 210(0.51)(0.49

0.51 + 1.75210

(0.51)(0.49

0.51 – 0.06 ≤ p ≤ 0.51 + 0.06

0.45 ≤ p ≤ 0.57

P [0.45 ≤ p ≤ 0.57] = 0.92

Se estima con 92% de confianza que la proporción de la población de compañías pequeñas de rápido crecimiento que tienen un plan de sucesión de administración es entre .45 y .57.

Solución:

Page 166: Audiovisual de estad. inf.

UAEM UAPCI

2.3 Intervalo de Confianza para Estimar Varianza Poblacional.

(n-1) S2

X2α/2

≤ σ2 ≤ (n-1) S2

X2 1- α /2

g l = n - 1

El valor de (α) = 1 – (nivel de confianza expresado como proporción). Por tanto, si estamos construyendo un intervalo de confianza y α es 10% del área y se expresa en forma de proporción: α = 0.10. ¿Cómo se puede usar esta formula para estimar la varianza poblacional desde una varianza muestral?

2. Teoría de Estimación

Page 167: Audiovisual de estad. inf.

UAEM UAPCI

Suponga que una muestra de 8 cilindros de aluminio de 7 cm. de una muestra se miden en su diámetro, resultando los siguientes valores:

6.91cm. 6.93cm. 7.01cm. 7.02cm.7,05cm. 7.00cm. 6.98cm. 7.01cm.

Al estimar una varianza poblacional a partir de estos valores debe calcularse la varianza muestral. Este valor es S2 = 0.0022125 Si una estimación puntual es todo lo que se necesita la estimación puntual es la varianza muestral, 0.0022125 sin embargo, si se ve que es probable que la estimación puntual cambie de una muestra a otra buscamos construir una estimación de intervalo. Para esto debemos conocer los grados de libertad y los valores de la ji cuadradas. Como n = 8, los grados de libertad son gl = n-1=7. ¿Cuales son los valores de ji cuadrada para completar la información necesaria en la formula anterior.

2. Teoría de Estimación

Page 168: Audiovisual de estad. inf.

UAEM UAPCI

Suponga que estamos construyendo un intervalo de confianza del 90% el valor de α es 1 - 0.90 = 0.10 es la parte del área bajo la curva de ji cuadrada que esta fuera del intervalo de confianza.

Esta área exterior es necesaria por que los valores del cuadro ji cuadrada proporcionados en el apéndice A 8 se escriben en la lista de acuerdo con el área de la cola derecha de la distribución. En un intervalo de confianza de 90, α/2 o 0.05 del área esta en la cola derecha de la distribución y 0.05 esta en la cola izquierda de la distribución.

2. Teoría de Estimación

Page 169: Audiovisual de estad. inf.

UAEM UAPCI

El valor de ji cuadrada para el área de 0.05 de la cola derecha de la distribución se puede obtener directamente del cuadro al usar los grados de libertad que en este caso son 7.

Entonces la ji cuadrada del lado derecho, X2.05,7 , es

14.0671, ya que la tabla 8 es una lista de valores de ji cuadrada para aéreas de cola derecha, el valor de ji cuadrada para la cola izquierda debe obtenerse para determinar cuanta área esta a la derecha de la cola izquierda.

2. Teoría de Estimación

Page 170: Audiovisual de estad. inf.

UAEM UAPCI

Si 0.05 esta a la izquierda del intervalo de confianza, entonces 1- .05 = .95 del área que esta a la derecha de la cola izquierda. Este calculo es consistente con la expresión 1- α/2 por tanto la ji cuadrada para la cola izquierda es X2

.95,7 = 2.16735.

X20.05,7

= 14.0671X20.95,7

= 2.16735

.05.05.95

2. Teoría de Estimación

Page 171: Audiovisual de estad. inf.

UAEM UAPCI

(n-1) S2

X2α/2

≤ σ2 ≤(n-1) S2

X2 1- α /2

(7)(.0022125)

14.0671≤ σ2 ≤

(7)(.0022125)

2.16735

0.001101 ≤ σ2 ≤ 0.007146

P[0.001101 ≤ σ2 ≤ 0.007146] = .90

El intervalo de confianza dice que con 90% de confianza la varianza poblacional esta entre .001101 y .007146. la probabilidad de que la varianza poblacional este en este intervalo es .90

2. Teoría de Estimación

Page 172: Audiovisual de estad. inf.

UAEM UAPCI

Universidad Autónoma del Estado de México.

Licenciatura en Logística

Unidad Académica Profesional de Cuautitlán Izcalli.

Unidad 3

“Estadística Inferencial”

M. en C.T.C. Gabriela Gaviño Ortiz.e-mail: [email protected]

[email protected]

Page 173: Audiovisual de estad. inf.

UAEM UAPCI

Objetivo de Aprendizaje:

Comprobar hipótesis en una población, con

la que podrá “probar” o “desaprobar” varias

teorías sobre fenómenos de negocios o

procesos logísticos.

3. Pruebas de Hipótesis y estadísticos

Page 174: Audiovisual de estad. inf.

UAEM UAPCI

El concepto de prueba de hipótesis esta en el corazón de la estadística Inferencial, y el uso de estadísticas para “probar” o “desaprobar” afirmaciones depende de este concepto.

Con la prueba de hipótesis, los investigadores de negocios pueden estructurar problemas en forma tal que puedan usar evidencia estadística para probar varias teorías sobre procesos logísticos y negocios.

3.1 Conceptos básicos para la prueba de hipótesis.

Page 175: Audiovisual de estad. inf.

UAEM UAPCI

En el campo de la logística, quienes toman decisiones están tratando de encontrar respuestas a preguntas como las siguientes:

1. ¿Que forma de embalaje es mas económica y confiable para embarcar un producto?.

2. ¿Que método gerencial motiva mejor a empleados en la industria de la logística?.

3. ¿Cual es la mejor forma de vincular bases de datos de clientes. Para la rápida recuperación de información útil?.

3.1 Conceptos básicos para la prueba de hipótesis.

Page 176: Audiovisual de estad. inf.

UAEM UAPCI

Con frecuencia se llama a investigadores para que den ideas e información a quienes toman decisiones para ayudarlos a contestar estas preguntas.

En la búsqueda de respuestas a preguntas y al tratar de encontrar explicaciones que se presentan en la logística, los investigadores a veces crean hipótesis que se pueden estudiar y explorar.

Las hipótesis son explicaciones tentativas de un principio que opera en la naturaleza.

3.1 Conceptos básicos para la prueba de hipótesis.

Page 177: Audiovisual de estad. inf.

UAEM UAPCI

Tipos de hipótesis

• Hipótesis de investigación

• Hipótesis Estadística

• Hipótesis sustantiva

Aun cuando buena parte de la atención estará en la prueba de hipótesis estadística, también es importante para quienes toman decisiones entender bien hipótesis de investigación.

3.2 Las Mejores Pruebas de hipótesis.

Page 178: Audiovisual de estad. inf.

UAEM UAPCI

• Hipótesis de investigación

Son un enunciado de lo que el investigador piensa que será el resultado de un experimento o un estudio.

Antes de emprender estudios, los investigadores con frecuencia tienen alguna idea o teoría basada en la experiencia o trabajo previo en lo referente a que resultará en el estudio.

3.2 Las Mejores Pruebas de hipótesis.

Page 179: Audiovisual de estad. inf.

UAEM UAPCI

La implementación de un método de calidad, en manufacturas dará como resultado una mayor productividad en una organización.

El precio de chatarra es buen indicador del índice de producción industrial seis meses después.

Los hombres de negocios se preguntan constantemente entre ellos para realizar hipótesis de investigación semejantes respecto a las relaciones, métodos y técnicas de negocios.

Ejemplos

3.2 Las Mejores Pruebas de hipótesis.

Page 180: Audiovisual de estad. inf.

UAEM UAPCI

Estas hipótesis pueden llevar a quienes toman decisiones a nuevas y mejores formas de lograr metas, para probar formalmente hipótesis de investigación por lo general son mejor expresarlas con hipótesis estadísticas.

• Hipótesis de Estadísticas

Para probar científicamente hipotesis de investigación, es necesario establecer una estructura formal de hipotesis que utilice hipotesis estadísticas.

3.2 Las Mejores Pruebas de hipótesis.

Page 181: Audiovisual de estad. inf.

UAEM UAPCI

Todas las hipotesis estadísticas constan de dos partes, una hipotesis nula y una hipotesis alternativa.

La hipótesis nula: Expresa que existe la condición nula, es decir no ocurre nada nuevo, la vieja teoría todavía es verdadera y el sistema esta bajo control.

La hipótesis alternativa: Expresa que la nueva teoría es verdadera, hay nuevos estándares, el sistema esta fuera de control, y/o algo esta pasando.

3.2 Las Mejores Pruebas de hipótesis.

Page 182: Audiovisual de estad. inf.

UAEM UAPCI

Suponga que la harina envasada por un fabricante se vende por peso; y se supone que un tamaño particular de paquete promedia 40 onzas.

Suponga que el fabricante desea hacer una prueba para determinar si su proceso de empaque está fuera de control, ¿Cómo probar el peso de los paquetes?.

La hipotesis nula para este experimento es que el peso promedio de los paquetes de harina sea 40 onzas. (no hay problema). La hipótesis alternativa es que el promedio no sea de 40 onzas (proceso fuera de control).

Ejemplo:

Page 183: Audiovisual de estad. inf.

UAEM UAPCI

El simbolismo común para representar la hipotesis nula como H0 y la hipotesis alternativa como Ha . La hipotesis nula y la hipotesis alternativa para el ejemplo de harina, se pueden expresar también con el uso de estos símbolos

y µ para la media poblacional como:

H0: µ= 40 onzas

Ha: µ ≠ 40 onzas

3.2 Las Mejores Pruebas de hipótesis.

Page 184: Audiovisual de estad. inf.

UAEM UAPCI

Suponga que una compañía logística tiene 18% de participación de mercado. No obstante, debido a un mayor esfuerzo de mercadeo, los directores de la compañía piensan que el porcentaje de mercado de la compañía es ahora mas de 18%, y les gustaría probarlo.

Ejemplo:

Page 185: Audiovisual de estad. inf.

UAEM UAPCI

La hipótesis nula es que el porcentaje del mercado es todavía 18% o que quizá ha caído por abajo del 18%.

La conversión de 18% a una proporción y el uso de p para representar la proporción poblacional, resulta en la siguiente hipótesis nula. H0: p ≤ 0.18 y la hipótesis alternativa es la proporción poblacional es ahora mayor a 0.18: Ha: p > 0.18

Ejemplo:

Page 186: Audiovisual de estad. inf.

UAEM UAPCI

Por tanto, en esta forma, las hipotesis estadísticas para el problema de participación en el mercado se pueden escribir:

H0: p = 0.18

Ha: p > 0.18

Aun cuando el signo “<“ no esta incluido en la hipotesis nula, se supone que esta ahí, adaptaremos este método y solo se escribirá con un signo = en lugar de con un signo direccional ≤ o ≥ .

Ejemplo:

Page 187: Audiovisual de estad. inf.

UAEM UAPCI

Las hipotesis estadísticas se escriben para que produzcan una prueba de una cola o dos colas.

Las hipotesis que ya se mostraron para el problema de paquetes de harina son de dos colas:

H0: µ = 40 onzas

Ha: ≠ 40 onzas.

3.3 Pruebas de hipótesis de una y dos colas.

Page 188: Audiovisual de estad. inf.

UAEM UAPCI

En el ejemplo de harina, si el proceso esta “fuera de control”, los directores de la planta podrán no saber si las maquinas están llenando de mas o de menos los paquetes y están interesados en probar cualquiera de las dos posibilidades.

Las pruebas de dos colas siempre usan = y ≠ en las hipótesis estadísticas y son sin dirección por que la hipótesis alternativa encuentra la posibilidad de (>) o (< ).

3.3 Pruebas de hipótesis de una y dos colas.

Page 189: Audiovisual de estad. inf.

UAEM UAPCI

H0: p = 0.18

Ha: p > 0.18

Las hipotesis mostradas para el problema de participación de mercado son de una cola

3.3 Pruebas de hipótesis de una y dos colas.

Las pruebas de una cola siempre son direccionales y la hipótesis alternativa usa, ya sea, el signo mayor que ( >) o menor que (< ).

Page 190: Audiovisual de estad. inf.

UAEM UAPCI

Una prueba de una cola solo debe usarse cuando el investigador conoce con toda seguridad que el resultado de un experimento va a ocurrir solo en una dirección o que el investigador solo esta interesado en una dirección del experimento como en el caso del problema de la participación en el mercado.

3.3 Pruebas de hipótesis de una y dos colas.

Page 191: Audiovisual de estad. inf.

UAEM UAPCI

En problemas de una cola, el investigador esta tratando de “demostrar” que algo es mas viejo, mas joven, mas alto, mas bajo, mas, menos, mayor, etc. Estas palabras son consideradas “direccionales” por que indican la dirección del interés del investigador.

3.3 Pruebas de hipótesis de una y dos colas.

Page 192: Audiovisual de estad. inf.

UAEM UAPCI

Prueba de hipotesis para una media poblacional con el uso del estadístico Z.

Una de las pruebas mas elementales es una prueba respecto a la media poblacional.

Un investigador podría estar interesado en hacer una prueba para determinar si un valor medio establecido o aceptado para una industria es todavía verdadero, o en probar un valor medio hipotético para una nueva teoría o producto.

3.4 Pruebas relativas a medias, varianzas y proporciones.

Page 193: Audiovisual de estad. inf.

UAEM UAPCI

Una compañía de productos de computación establece un servicio telefónico para ayudar a clientes a darles apoyo técnico.

El promedio de tiempo de espera durante horas hábiles es de 37minutos pero una contratación reciente de personal agrego consultores técnicos al sistema y la gerencia considera que el tiempo promedio de espera se redujo y desean demostrarlo.

3.4 Pruebas relativas a medias, varianzas y proporciones.

Ejemplo:

Page 194: Audiovisual de estad. inf.

UAEM UAPCI

Otras situaciones de negocios que resultan en pruebas de hipotesis de una sola media podrían incluir lo siguiente:

• Una empresa de inversión financiera desea hacer una prueba para determinar si el promedio de cambio por hora en el índice dow jones, en un periodo de 10 años, es + 0.25.

3.4 Pruebas relativas a medias, varianzas y proporciones.

Page 195: Audiovisual de estad. inf.

UAEM UAPCI

• Una compañía fabricante desea hacer una prueba para determinar si el promedio del grueso de una botella de plástico es 2.4 milímetros.

• Una tienda de venta al menudeo desea hacer una prueba para determinar si la edad promedio de sus clientes es menor a 40 años.

3.4 Pruebas relativas a medias, varianzas y proporciones.

Page 196: Audiovisual de estad. inf.

UAEM UAPCI

Z=x +

La siguiente formula puede usarse para probar hipotesis sobre una sola media poblacional si el tamaño de la muestra es grande (n ≥ 30) para cualquier población y para muestras pequeñas (n<30) si se sabe que x está normalmente distribuida.

3.4 Pruebas relativas a medias, varianzas y proporciones.

σ

Page 197: Audiovisual de estad. inf.

UAEM UAPCI

Una encuesta de contadores públicos titulados de Estados Unidos, encontró que el ingreso neto promedio para un contador propietario único es de 74,914 dólares.

Como esta encuesta tiene ahora mas de 7 años de antigüedad, un investigador de contabilidad desea probar esta cifra al probar una muestra aleatoria de 112 contadores propietarios únicos en Estados Unidos, para determinar si cambio esta cantidad de ingreso neto.

Ejemplo 1:

3.4 Pruebas relativas a medias, varianzas y proporciones.

Page 198: Audiovisual de estad. inf.

UAEM UAPCI

Para hacerlo, el investigador podría usar los 8 pasos de prueba de hipótesis. Suponga que 14,530 dólares es la desviación estándar poblacional de ingresos netos de contadores propietarios únicos.

3.4 Pruebas relativas a medias, varianzas y proporciones.

Page 199: Audiovisual de estad. inf.

UAEM UAPCI

1. Hacer hipotesis

En el paso uno deben establecer las hipótesis.

Como el investigador esta probando para determinar si la cantidad ha cambiado, la hipotesis alternativa es que el ingreso medio neto no es 74,914 dólares. La hipotesis nula es que la media todavía es igual a 74,914 dólares. Estas hipotesis son:

H0: µ = 74914

Ha: µ ≠ 74914

Paso 1:

Page 200: Audiovisual de estad. inf.

UAEM UAPCI

2. Prueba

El paso dos es para determinar la prueba estadística apropiada y distribución muestral.

Como el tamaño de la muestra es grande (n = 112) y el investigador esta usando la media muestral

como el estadístico, la prueba z de la formula es la estadística de prueba adecuada.

Z=x µ

Paso 2:

Page 201: Audiovisual de estad. inf.

UAEM UAPCI

3. Porcentaje de error tipo I

El paso tres se especifica el porcentaje de error tipo I o α = 0.05. en el paso cuatro se expresa la regla de decisión.

Como la prueba es de dos colas y α = 0.05, hay una área de α/2 .025 en cada una de las colas de distribución. Por tanto, la región de rechazo esta en los dos extremos de la distribución con 2.5% del área en cada una.

Paso 3 y 4:

Page 202: Audiovisual de estad. inf.

UAEM UAPCI

Hay un área de 0.4750 entre la media y cada uno de los valores críticos que separan las colas de distribución (la región de rechazo) de la región de aceptación. Al usar esta área de 0.4750 y la tabla del apéndice A. 5 se puede obtener el valor critico de z.

Zα/2= ± 1.96

Paso 3 y 4:

La figura muestra el problema con regiones de rechazo y los valores críticos de z.

Page 203: Audiovisual de estad. inf.

UAEM UAPCI

La regla de decisión es que si los datos reunidos producen un valor z mayor a 1.96 o menos de -1.96, la estadística de prueba esta en una de las regiones de rechazo y la decisión es rechazar la hipótesis nula.

Si el valor z calculado de los datos esta entre -1.96 y + 1.96, la decisión es aceptar la hipotesis nula por que el valor de z calculado esta en la región de aceptación.

Paso 4:

Page 204: Audiovisual de estad. inf.

UAEM UAPCI

El paso cinco es reunir los datos.

Suponga que los 112 contadores que responden producen una media muestral de 78695 dólares.

En el paso seis el valor de la prueba estadística se calcula con el uso de x = 78695, n = 112, σ = 14530 y una hipotética de µ es igual a 74914.

78695 - 74914 Z =

14530

112

= 2.75

Paso 5 y 6

Page 205: Audiovisual de estad. inf.

UAEM UAPCI

0.0

Región de Aceptación α/2= .025α/2= .025

Región de rechazo

Región de rechazo

- 1.96 +1.96

µ= 74914

x

z

Page 206: Audiovisual de estad. inf.

UAEM UAPCI

Como esta estadística de prueba z = 2.75, es mayor que el valor critico de z en la cola superior de la distribución, z = +1.96, la conclusión estadística alcanzada en el paso 7 del proceso de prueba de hipotesis es rechazar la hipotesis nula.

La estadística de prueba calculada se conoce a veces como valor que observa.

Por lo tanto el valor que se observa de z para este problema es 2.75 y el valor critico de z para este problema es 1.96.

Paso 7:

Acción

Page 207: Audiovisual de estad. inf.

UAEM UAPCI

8. Determinación de la implicación

En el paso ocho se toma la decisión gerencial ¿ que significa este resultado? Estadísticamente, el investigador tiene suficiente evidencia para rechazar la cifra de 74914 como el verdadero promedio nacional de ingreso neto para contadores públicos propietarios únicos.

Paso 8:

Page 208: Audiovisual de estad. inf.

UAEM UAPCI

Aun cuando el investigador realizo una prueba de dos colas la evidencia reunida indica que el promedio nacional pudo haber aumentado. La media muestral de 78695 es 3781 mas alta que la media nacional que se prueba.

Page 209: Audiovisual de estad. inf.

UAEM UAPCI

El investigador puede concluir que el promedio nacional es mas que antes, pero como los 78695 es solo una media muestral. No ofrece garantía de que el promedio nacional para todos los contadores públicos propietarios únicos sea de 3781 mas.

Si se construye un intervalo de confianza con los datos muestrales, de 78695 seria la estimación puntual. Otras muestras podrían producir diferentes medias muestrales.

Page 210: Audiovisual de estad. inf.

UAEM UAPCI

Desde el punto de vista gerencial, este hallazgo estadístico puede significar que los contadores serán mas costosos de contratar ya sea como un empleado de tiempo completo o como consultores. Puede significar que los servicios de consultoría han subido de precio.

Page 211: Audiovisual de estad. inf.

UAEM UAPCI

Para contadores nuevos, puede significar el potencial para mayor potencia de ingreso.

Si la media muestral de $78,695 es el nuevo promedio poblacional medio para el año 2002, podría representar un aumento de $ 3,781 sobre un periodo de 7 años. Este aumento puede o no ser sustantivo, dependiendo del punto de vista de uno.

Page 212: Audiovisual de estad. inf.

UAEM UAPCI

Formula para probar hipótesis acerca de µ con una población finita

Z=x µ

N- nN- 1

Page 213: Audiovisual de estad. inf.

UAEM UAPCI

En el ejemplo del ingreso neto de contadores públicos, suponga que solo 600 contadores públicos propietarios únicos practican su profesión en Estados Unidos.

Una muestra de 112 contadores tomada de una población de solo 600 contadores es 18.67% del total de la población y, por tanto, es mucho mas probable que sea representativa de la población que una muestra 112 contadores tomada de una población de 20mil contadores (.56% de la población). El factor de correlación finita toma en cuenta esta diferencia y considera un aumento en el valor que se observa de z. el valor que se observa de z cambiara a:

Page 214: Audiovisual de estad. inf.

UAEM UAPCI

Z=x µ

N- n

N- 1

=78695 - 74914

14530

112600 - 112

600 - 1

=3781

1239.2= 3.05

El uso del factor de corrección finita aumento el valor que se observa de z de 2.75 a 3.05. la decisión de rechazar la hipótesis nula no cambia con esta información. Sin embargo, de vez en cuando el factor de corrección finita puede hacer la diferencia entre rechazar y aceptar la hipótesis nula.

σn

Page 215: Audiovisual de estad. inf.

UAEM UAPCI

En un intento por determinar por que el servicio a clientes es importante para gerentes en el Reino Unido, unos investigadores entrevistaron a directores de plantas manufactureras en Escocia.

Una de las razones propuestas es que el servicio a clientes sirve para retener clientes. En una escala de 1 a 5, donde 1 es bajo y 5 alto, quienes respondieron la encuesta clasificaron esta razón mas alto que cuales quiera de las otras, con una respuesta media de 4.30.

Page 216: Audiovisual de estad. inf.

UAEM UAPCI

Alfa se establece en .05. se reúnen datos y se obtienen los siguientes resultados. Utilice estos datos y los ocho pasos de prueba de hipótesis para determinar si gerentes de estados Unidos clasifican esta razón significativamente mas bajo que la media de 4.30 alcanzada en el Reino Unido.

Ejercicio

Suponga que investigadores de Estados Unidos piensan que gerentes de manufactura estadounidenses clasificarían esta razón también como alta y harían una prueba de hipótesis para demostrar su teoría.

Page 217: Audiovisual de estad. inf.

UAEM UAPCI

3 4 5 5 4 5 5 4 4 4 44 4 4 4 5 4 4 4 3 4 44 3 5 4 4 5 4 4 4 5

Paso 1 se establecen hipótesis.

Debido a que los investigadores de Estados Unidos están interesados solo en “demostrar” que la cantidad media es menor en Estados Unidos, la prueba es de una cola. La hipótesis alternativa es que la media poblacional es menor a 4.30. La hipótesis nula expresa el caso de igualdad.

Solución

Page 218: Audiovisual de estad. inf.

UAEM UAPCI

H0: µ = 4.30

Ha: µ < 4.30

Paso 2 Determinar la prueba estadística apropiada cuando esta es:

Z=x µ

S

n

Page 219: Audiovisual de estad. inf.

UAEM UAPCI

Paso 3. Especificar la clasificación de error Tipo 1.

α = .05

Paso 4. Expresar la regla de decisión. Debido a que esta prueba es de una cola, el valor de z critico se encuentra al buscar .5000 - .0500 = .4500 como el área en la tabla del Apéndice A.5.

El valor critico de la estadística de prueba es z0.05 = -1.645 para rechazar la hipótesis nula. La región de rechazo y valor critico se pueden describir como en el siguiente diagrama.

Page 220: Audiovisual de estad. inf.

UAEM UAPCI

Z= 0.0

Región de Aceptaciónα= .05

Región de rechazo

Z.05= - 1.645 +1.96

µ= 4.30

x

z

Xc= 4.133

Page 221: Audiovisual de estad. inf.

UAEM UAPCI

Paso 5

Paso 5. Reunir los datos muestrales.Paso 6. Calcular el valor de la estadística de prueba:

X = 4.156

Z =4.156 – 4.30

S = .574

.574

32

= -1.42

Page 222: Audiovisual de estad. inf.

UAEM UAPCI

Acción

Paso 7 expresa la conclusión estadística.

Debido a que el estadístico de prueba que se observa no es menor que el valor critico y no esta en la región de rechazo, la conclusión estadística es que la hipótesis nula no puede ser rechazada.

Page 223: Audiovisual de estad. inf.

UAEM UAPCI

Paso 8

8. Toma de la decisión gerencial

La prueba no tiene suficiente evidencia para concluir que gerentes de Estados Unidos piensan que es menos importantes usar servicio a clientes, como para retener mas clientes, de lo que piensan gerentes del Reino Unido.

El servicio a clientes es una herramienta importante para retener clientes en ambos países, según los gerentes

Page 224: Audiovisual de estad. inf.

UAEM UAPCI

Uso del método del valor de p: El estadístico de prueba que se observa es Z= -1.42. De la tabla del apéndice A.5, la probabilidad de obtener un valor de Z de al menos este extremo cuando la hipótesis nula es verdadera es .5000 - .4222 = .0778.

Por tanto, la hipótesis nula no puede ser rechazada en α = 0.05 porque el valor Más pequeño de alfa para el cual se puede rechazar la hipótesis Nula es 0.0778.

Page 225: Audiovisual de estad. inf.

UAEM UAPCI

Uso del método del valor crítico: ¿Para qué valor de la media muestral ( o más extremo) sería rechazada la hipótesis nula?

Esta media muestra crítica se puede determinar con el uso del valor critico de z asociado con α, z 0.05 = -1.645. debido a que la regla de decisión debe establecerse antes de reunir datos, es necesario una desviación estándar poblacional o una estimación de una de estudios anteriores. Con fines de ilustración, usaremos la desviación estándar muestral calculada previamente en este calculo ( sea la σ = .574).

Page 226: Audiovisual de estad. inf.

UAEM UAPCI

Zc=xc

µ

σn

=-1.645xc 4.30

.574

32

xc = 4.133

Page 227: Audiovisual de estad. inf.

UAEM UAPCI

La regla de decisión es que una media muestral menor a 4.133 seria necesaria para rechazar la hipótesis nula. Como la media obtenida de los datos muestrales es 4.156 los investigadores no rechazan la hipótesis nula.

El diagrama precedente incluye una escala con la media muestral critica y la región de rechazo para el método del valor critico.

Page 228: Audiovisual de estad. inf.

UAEM UAPCI

1 a. Usa los datos proporcionados para probar las siguientes hipótesis.

H0: µ = 25 Ha: µ ≠ 25

x = 28.1 n = 57 s =8.46 α = .01

b. Usa el método de valor p para llegar a una conclusión estadística.

Ejercicios

Page 229: Audiovisual de estad. inf.

UAEM UAPCI

2 . Usa los datos proporcionados para probar las siguientes hipótesis.

H0: µ = 7.48 Ha: µ < 7.48

x = 6.91 n = 96 s = 1.21 α = .01

Page 230: Audiovisual de estad. inf.

UAEM UAPCI

3 . Usa los datos proporcionados para probar las siguientes hipótesis.

H0: µ = 1200 Ha: µ ≥ 1200

x = 1215 n = 113 s = 100 α = .10

b. Usa el método de valor p para obtener los resultados.

c. Despeje el valor critico requerido para rechazar la media.

Page 231: Audiovisual de estad. inf.

UAEM UAPCI

3.5 Pruebas de bondad de ajuste .

La distribución bínomiomial es aquella en la que podrían ocurrir solo dos posibles resultados en un experimento de un solo intento. Una extensión de la distribución binomial es la distribución multinomial en la que pueden ocurrir mas de dos posibles resultados en un solo intento.

Page 232: Audiovisual de estad. inf.

UAEM UAPCI

La prueba de ji cuadrada de bondad de ajuste se usa para analizar probabilidades de intentos de distribución multinomial a lo largo de una sola dimensión.

Por ejemplo, si la variable en un estudio es la clase económica con tres posibles resultados de clase de ingreso bajo, de ingreso medio y de ingreso alto, la única dimensión es la clase económica y los tres posibles resultados son tres clases.

3.5 Pruebas de bondad de ajuste .

Page 233: Audiovisual de estad. inf.

UAEM UAPCI

En cada intento puede ocurrir uno y solo uno de los resultados. En otras palabras, una unidad de familia debe estar clasificada ya sea como clase de ingreso bajo, de ingreso medio o de ingreso alto y no puede estar en mas de una clase.

La prueba de ji cuadrada de bondad de ajuste compara las frecuencias de categorías esperadas o retoricas de una distribución poblacional con las frecuencias observadas o reales de una distribución para determinar si existe diferencia entre lo que se esperaba y lo que se observo.

3.5 Pruebas de bondad de ajuste .

Page 234: Audiovisual de estad. inf.

UAEM UAPCI

Ejemplo:

En una industria de papel los fabricantes pueden usar la prueba de ji cuadrada de bondad de ajuste para determinar si la demanda de papel sigue una distribución uniforme todo el año. La formula siguiente se usa para calcular una prueba de ji cuadrada de bondad de ajuste.

3.5 Pruebas de bondad de ajuste .

ƒe

( ƒo – ƒe) 2

x2= ∑

Donde:

ƒo Frecuencia de valores observados

ƒe Frecuencia de valores esperados

K Número de categorías

c Número de parámetros estimados desde los

datos de muestra.

gl = k – l - c

Page 235: Audiovisual de estad. inf.

UAEM UAPCI

Esta formula compara la frecuencia con los valores observados con la frecuencia de los valores esperados. La prueba pierde un grado de libertad por que el número total de frecuencias esperadas debe ser igual al numero de frecuencias observadas; esto es, el total observado tomado de la muestra se usa como el total para frecuencias esperadas.

Page 236: Audiovisual de estad. inf.

UAEM UAPCI

Además, en algunos ejemplos el parámetro poblacional por ejemplo: λ, µ o σ, se estima a partir de los datos de las muestras para determinar la distribución de frecuencia de valores esperados. Cada vez que ocurra esta estimación se pierde un grado de libertad adicional.

Page 237: Audiovisual de estad. inf.

UAEM UAPCI

Como regla, si una distribución uniforme se usa como distribución esperada o si se presenta una distribución esperada de valores, se usan k – 1 grados de libertad en la prueba. Al probar para determinar si una distribución observada es de Poisson los grados de libertad son k – 2 por que se pierde un grado de libertad a adicional al estimar λ.

Al probar para determinar si una distribución observada es normal, los grados de libertar son k – 3 por que se pierden dos grados de libertad adicional al estimar la µ, σ desde los datos de muestra observados.

Page 238: Audiovisual de estad. inf.

UAEM UAPCI

Karl Pearson introdujo la prueba de distribucion de ji cuadrada en 1900, la cual es la suma de los cuadrados de k variables aleatorias independientes y por tanto nunca puede ser menor a cero; se extienden indefinidamente en la dirección positiva. Asociados por los grados de libertad gl. Para pequeños valores de gl la distribucion de ji cuadrada esta considerablemente sesgada a la derecha (valores positivos).

Page 239: Audiovisual de estad. inf.

UAEM UAPCI

Cuando el grado de libertad gl aumenta, la distribución de ji cuadrada se aproxima a la curva normal.

Ejemplo 1

¿Cómo puede aplicarse la prueba de ji cuadrada de bondad de ajuste en diversas situaciones en la logística?. Una encuesta de consumidores de Estados Unidos dirigida por the wall street journal y NBC hizo la pregunta: en general, como calificaría el nivel de servicio que proporcionan los negocios estadounidenses. La distribución de respuesta a esta pregunta se muestra como sigue:

Page 240: Audiovisual de estad. inf.

UAEM UAPCI

Excelente 8%Muy bueno 47%Regular 34%Malo 11%

Suponga que la gerente de una tienda desea averiguar si los resultados de esta encuesta de clientes se aplico en los supermercados de su ciudad. Para hacerlo, entrevista al azar a 207 consumidores seleccionados, cuando salen de supermercados en distintas partes de la ciudad. Las categorías de respuesta son excelente, muy bueno, regular y malo. Las respuestas en este estudio se presentan en la tabla siguiente:

Page 241: Audiovisual de estad. inf.

UAEM UAPCI

Construcción de valores esperados para el estudio de satisfacción de servicio:

RespuestaFrecuencia esperada (ƒe ) (Proporción por total muestral)

Proporción esperada

Excelente 0.08 (0.08) (207) = 16.56Muy buena 0.47 (.47)(207) = 97.29Regular 0.34 (.34) (207) = 70.38Mala 0.11 (.11) (207) = 22.77 207.00

Tabla 12.2

Page 242: Audiovisual de estad. inf.

UAEM UAPCI

Respuesta Frecuencia observada (ƒo)

Excelente 21Muy buena 109Regular 62Mala 15

La gerente puede usar una prueba de ji cuadrada de bondad de ajuste para determinar si la frecuencia en las respuestas de esta encuesta son iguales que la frecuencia que se esperaría con base en la encuesta nacional

Tabla 12.1

Page 243: Audiovisual de estad. inf.

UAEM UAPCI

Hipótesis:

Paso 1: Las hipótesis para este ejemplo son:

Ho: La distribución observada no es igual que la distribución esperada.Ha: la distribución observada no es igual que la distribución esperada.

Prueba:

Paso 2 : la prueba estadística que se usa es:

( ƒo – ƒe) 2

x2= ∑ ƒe

Page 244: Audiovisual de estad. inf.

UAEM UAPCI

Paso 3: utlice α = .05

Paso 4: las pruebas de ji cuadrada de bondad de ajuste son de una cola por que una de ji cuadrada de cero indica un acuerdo perfecto entre las distribuciones. Cualquier desviación diferente de cero que ocurra en la dirección positiva solo por que la ji cuadrada esta determinada por una suma de valores cuadrados y nunca puede ser negativa.

Page 245: Audiovisual de estad. inf.

UAEM UAPCI

Con cuatro categorías en este ejemplo (excelente, muy bueno, regular y malo), k = 4 . Los grados de libertad son k – 1 por que la distribución esperada esta dada: k – 1 = 4 – 1 = 3. para α =.05 y gl = 3, el valor critico de ji cuadrada es:

X2 .05,3 = 7.815

Después de analizar los datos, una ji cuadrada observada > 7.815 debe calcularse para rechazar la hipótesis nula.

Paso 5 los valores observados reunidos en los datos de las muestras de la tabla 12.1 suman 207.00. Entonces n = 207.

Page 246: Audiovisual de estad. inf.

UAEM UAPCI

Se dan las proporciones esperadas, pero las frecuencias deben calcularse al multiplicar las proporciones esperadas por el total de las muestras de las frecuencias observadas como se ve en la tabla 12.2.

Paso 6. la de ji cuadrada de bondad de ajuste se puede calcular entonces como se muestra en la tabla 12.3

calculo de la ji cuadrada para el ejemplo de satisfaccion de servicio

Respuesta ƒo ƒe (ƒo - ƒe )2

Ƒe

Excelente 21 16.56 1.19Muy buena 109 97.29 1.41Regular 62 70.38 1.00Mala 15 22.77 2.65

207 207.00 6.25

Page 247: Audiovisual de estad. inf.

UAEM UAPCI

Acción:

Paso 7. como el valor observado de ji cuadrada de 6.25 es no mayor que el valor critico de 7.815 en la tabla, la gerente de la tienda aceptara la hipótesis nula.

Implicaciones:

Paso 8. los datos reunidos en la muestra de 207 compradores de supermercados indican que la distribución de respuestas de compradores de supermercado, en la ciudad de la gerente no es significativamente diferente al de la distribución de respuestas de la encuesta nacional.

La gerente de la tienda puede concluir que sus clientes no parecen tener actitudes diferentes de las personas que tomaron la encuesta.

Page 248: Audiovisual de estad. inf.

UAEM UAPCI

Región de aceptación

X2 observada = 6.25X2

.05,3 = 7.815

α = .05

Page 249: Audiovisual de estad. inf.

UAEM UAPCI

•Las pruebas de ji cuadrada de bondad de ajuste son de una cola y son solo números positivos.•La formula siguiente se usa para calcular una prueba de ji cuadrada de bondad de ajuste.

Las pruebas de ji cuadrada, de bondad de ajuste .

•La prueba pierde un grado de libertad por que el número total de frecuencias esperadas debe ser igual al numero de frecuencias observadas.

gl = k-1

( ƒo – ƒe) 2

x2= ∑ ƒe

Page 250: Audiovisual de estad. inf.

UAEM UAPCI

4. Análisis de regresión y correlación múltiple

El objetivo Especifico:

Analizar el grado de la relación existente entre variables utilizando modelos matemáticos y representaciones gráficas. Así pues, para representar la relación entre dos o más variables desarrollaremos una ecuación que permitirá estimar una variable en función de la otra.

Por ejemplo, ¿en qué medida, un aumento de los gastos en publicidad hace aumentar las ventas de un determinado producto?, ¿cómo representamos que la bajada de temperaturas implica un aumento del consumo de la calefacción?

Page 251: Audiovisual de estad. inf.

UAEM UAPCI

En ocasiones nos puede interesar estudiar si existe o no algún tipo de relación entre dos variables aleatorias.

En particular, nos interesa cuantificar la intensidad de la relación lineal entre dos variables. El parámetro que nos da tal cuantificación es el coeficiente de correlación lineal de Pearson r, cuyo valor oscila entre –1 y +1 :

Correlación Lineal

Page 252: Audiovisual de estad. inf.

UAEM UAPCI

Correlación Lineal

Page 253: Audiovisual de estad. inf.

UAEM UAPCI

Como se observa en los diagramas anteriores, el valor de r se aproxima a +1 cuando la correlación tiende a ser lineal directa (mayores valores de X significan mayores valores de Y), y se aproxima a –1 cuando la correlación tiende a ser lineal inversa.

Es importante notar que la existencia de correlación entre variables no implica causalidad. ¡Atención!: si no hay correlación de ningún tipo entre dos v.a., entonces tampoco habrá correlación lineal, por lo que r = 0. Sin embargo, el que ocurra r = 0 sólo nos dice que no hay correlación lineal.

Correlación Lineal

Page 254: Audiovisual de estad. inf.

UAEM UAPCI

El siguiente diagrama resume el análisis del coeficiente de correlación entre dos variables:

Correlación Lineal

Page 255: Audiovisual de estad. inf.

UAEM UAPCI

4. Análisis de regresión y correlación múltiple

En la regresión lineal simple, nosotros predecimos valores de una variable a partir de otra. A la variable que estamos prediciendo se le llama variable dependiente y nos referimos a ella como Y. La variable en la que estamos basando nuestras predicciones se llama variable independiente (o predictora) y nos referimos a ella como X.

Cuando existe solamente una variable independiente, el método se conoce como regresión simple. En la regresión lineal simple los valores de Y, cuando se grafican como una función de X, se ajuntan a una línea recta.

4. 1 Introducción a la regresión

Page 256: Audiovisual de estad. inf.

UAEM UAPCI

En la figura siguiente se grafican los datos de la tabla . Se puede observar que existen una relación positiva entre la variable X y la variable Y. Si se estuviera tratando de predecir la variable Y, tomando como predictor a X, cuando mas alto sea el valor de X, más alto será el valor de Y.

4. Análisis de regresión y correlación múltiple

X Y

1.00 1.00

2.00 2.00

3.00 1.30

4.00 3.75

5.00 2.25

5

1

2

1

4

32

3

4

5

Y

X

Diagrama de dispersión para los datos de la tabla.

Page 257: Audiovisual de estad. inf.

UAEM UAPCI

La regresión lineal consiste en encontrar la línea recta que mejor se ajuste a estos puntos. La línea que mejor se ajusta se llama línea de regresión. En la figura siguiente la línea diagonal es la línea de regresión y representa los valores estimados o predichos de Y, para cada valor posible de X.

Las líneas verticales, desde los puntos (que representan los valores observados) hasta la línea de regresión, representan los errores de predicción o de estimación. Como se puede observar, el triangulo se encuentra muy cerca de la línea de regresión, por lo que su error de predicción es muy pequeño. En contraste, el cuadrado está más alejado de la línea de regresión; por tanto su error de predicción es mas grande.

4. Análisis de regresión y correlación múltiple

Page 258: Audiovisual de estad. inf.

UAEM UAPCI

El error de predicción para un punto dado es el valor del punto menos el valor estimado (el valor en la línea). En la tabla siguiente se muestran los valores estimados (Y) y los errores de estimación (Y-Y). Por ejemplo, el primer punto tiene un valor Y de 1.00, y el valor estimado es 1.21; por tanto, el error de estimación es -0.21.

4. Análisis de regresión y correlación múltiple

^^

51 32 4 X

1

2

4

3

5

Y

Diagrama de dispersión de los datos. Los puntos son los datos reales, la línea recta representa las predicciones; las líneas verticales entre los puntos y la línea recta representan los errores de predicción.

4. 1.1 Diagrama de dispersión

1.00

2.00

1.30

3.75

2.25

Page 259: Audiovisual de estad. inf.

UAEM UAPCI

No hemos especificado qué significa “línea de mejor ajuste”. El criterio mas utilizado para definir la línea de mejor ajuste es el que la define como la línea que minimiza la suma de los errores cuadrados de estimación.

Éste es el criterio que fue utilizado para encontrar la línea en la figura siguiente. La última columna de la tabla muestra el cuadrado de los errores de estimación. La suma de los cuadrados de los errores de la estimación que se muestra en la tabla es el valor mínimo que se puede encontrar con cualquier línea de regresión.

4. Análisis de regresión y correlación múltiple

Page 260: Audiovisual de estad. inf.

UAEM UAPCI

4. Análisis de regresión y correlación múltiple

X Y Y Y-Y (Y - Y) 2

1.00 1.00 1.210 -0.210 0.044

2.00 2.00 1.635 0.365 0.133

3.00 1.30 2.060 -0.760 0.578

4.00 3.75 2.485 1.265 1.600

5.00 2.25 2.910 -0.660 0.436

^ ^^

Valores estimados ( Y ) y los errores estimados (Y – Y).^ ^

Page 261: Audiovisual de estad. inf.

UAEM UAPCI

La formula para la línea de regresión es:

Y = b X + aDonde Y es el valor estimado o la predicción de Y, b es la pendiente de la línea y a es donde la línea intercepta al eje Y. la ecuación para la línea de la figura anterior es:

Y’ = 0.425x + 0.785

Para X = 1Y’ = (0.425) (1) + 0.785 = 1.21

Para X = 2

Y = (0.425) (2) + 0.785 = 1.64^

^

4. Análisis de regresión y correlación múltiple

Page 262: Audiovisual de estad. inf.

UAEM UAPCI

A raíz de la llegada de las computadoras, la regresión lineal se calcula utilizando software estadístico. Sin embargo, los cálculos son relativamente fáciles y se describen aquí para quien este interesado. Vamos a realizar los cálculos con los datos de la tabla. X es la media de X, Y es la media de Y, sx es la desviación estándar de X, sy es la desviación estándar de Y, y r es la correlación entre X y Y

X Y sx sy r

3 2.06 1.581 1.072 0.627

Tabla. Estadísticas para el cálculo de la línea de regresión

4. Análisis de regresión y correlación múltiple

Page 263: Audiovisual de estad. inf.

UAEM UAPCI

La pendiente b se puede calcular como sigue:

b = r X Sy

Sx

y el intercepto, a, se puede calcular como

a = y - bx

Para nuestros datos, b = 0.627 X 1.072

1581= 0.425

a = 2.06 – (0.425) (3) = 0.785

Observa que los cálculos se han desarrollado para estadísticos muestrales, en lugar de hacerse para parámetros de una población. Las fórmulas son las mismas; simplemente usa los valores de la media, desviación estándar y correlación poblacional

4. Análisis de regresión y correlación múltiple