Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico...

43
Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María

Transcript of Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico...

Page 1: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Estadística Computacional0. Introducción

Ricardo Ñanculef AlegríaUniversidad Técnica Federico Santa María

Page 2: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Porqué Estadística?

Page 3: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Porqué Estadística?

Cómo interpretamos esta estadística??

(a) ¿Qué significa prevalencia?(b) ¿Cuál es la muestra?(c) ¿Cuál es el crecimiento natural de la población en Chile?

Page 4: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Porqué Estadística?

3,7 3,94,7

5,65,0 5,3

7,0

0

1

2

3

4

5

6

7

8

9

10

1994 1996 1998 2000 2002 2004 2006

Evolución del Consumo de Marihuana según estudio del CONACE

Page 5: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Porqué Estadística?

Tendencia de la Percepción de Riesgo en el consumo habitual de Marihuana y Cocaína según estudio del CONACE

74 7262

81 82 81

0

20

40

60

80

100

2002 2004 2006

Perc. de Riesgo MARIHUANA Perc. de Riesgo COCAÍNA

Page 6: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Porqué Estadística?

Page 7: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Porqué Estadística?

Relación causa-efecto: estrés → aumento de la muerte fetal

(a) Cómo se valida una conclusión de esta naturaleza? (b) Se han descartado otras variables? Cigarrillo? Edad?(c) Qué tan significativo es el contraste de la dos muestras?

Page 8: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

(a) Simulemos 100 pacientes: 37 casos de muerte fetal y 63 casos de ausencia de muerte fetal (36.5% muerte fetal marginal)

(b) Seleccionamos aleatoriamente un grupo de tamaño 33 y otro de tamaño 67 (33% estrés observado)

(c) Diferencias en las tasas de muerte fetal

Grupo 1 Grupo 2 Selección aleatoria 1: 38% 36% Selección aleatoria 2: 34% 40% Selección aleatoria 3: 32% 39% Selección aleatoria 4: 41% 34% Selección aleatoria 5: 37% 38%

Hagamos un experimento casero …

Page 9: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Grupo 1 Grupo 2

Selección aleatoria 1: 38% 36% Selección aleatoria 2: 34% 40% Selección aleatoria 3: 32% 39% Selección aleatoria 4: 41% 34% Selección aleatoria 5: 37% 38%

Puede ser aleatoria la diferencia observada por los científicos daneses? Independiente de la respuesta, Cuidado con la significancia de las diferencias: una diferencia del 7% es perfectamente aleatoria!!

Resultados del experimento casero …

Page 10: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Estadística: Fundamental para comprender mucha de la información que recibimos a diario y comunicar información de manera efectiva

Page 11: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Estadística: El 99% de las decisiones que se toman en el mundo dependen las conclusiones que se puedan obtener de una muestra

Page 12: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Estadística: Aceptar una innovación en un escenario con incertidumbre en un pasa por conseguir un argumento estadístico que soporte su conveniencia

Page 13: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Qué es la Estadística?

wikipedia.org:

La estadística es una rama de la matemática que se refiere a la recolección, estudio e interpretación de los datos obtenidos en un estudio. Es aplicable a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales (…) y usada en la toma de decisiones en áreas de negocios e instituciones gubernamentales.

Page 14: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Estadística: Conjunto de herramientas para tomar y analizar datos de manera de obtener información acerca de un fenómeno sobre el que existe incertidumbre

Page 15: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Qué es la Estadística? Dos conceptos fundamentales: muestra y población

• Población o Población Objetivo: conjunto de elementos sobre los que queremos hacer afirmaciones• Muestra: subconjunto de la población que se extrae para ser estudiado

Page 16: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Qué es la Estadística? Dos conceptos fundamentales: muestra y población• Población Muestral o Marco Muestral: conjunto de elementos de la población suceptible de ser muestreada. Ejemplo:

Page 17: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Qué es la Estadística? Dos conceptos fundamentales: muestra y población

• Población Objetivo?• Marco Muestral?• Muestra?

Page 18: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Estadística: Set de herramientas para análisis (?) de datos. • Estadística Descriptiva: métodos de recolección, descripción, visualización y resumen de datos.Explicar qué ocurre la muestra.

• Estadística Inferencial: formulación de modelos explicativos o prospectivos.

• Generalizar hacia la población muestral.• Proyectar una variable en el tiempo. • Validez de las generalizaciones y proyecciones.

Page 19: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Estadística Descriptiva¿Cómo recolectar los datos?

Page 20: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Estadística Descriptiva¿Cómo recolectar los datos?

Page 21: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Estadística Descriptiva¿Cómo organizar y presentar los datos?

Page 22: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Estadística Descriptiva¿Cómo resumir los datos?

• niveles medios• tendencias • variabilidad• rangos

Las variables son variables: cómo dar cuenta de ellas de manera compacta

Page 23: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

La Estadística Descriptiva se ocupa de cómo recolectar datos y presentarlos de manera informativa

Page 24: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Inferencia Estadística¿Cómo generalizar desde los datos?

• Formulando modelos de cómo las variables cambian, que den cuenta de su aleatoriedad o incertidumbre

• Ejemplo: Distribución de Poisson: Poi(λ)

Page 25: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Inferencia EstadísticaNaturaleza de un Modelo

• Marcos conceptuales que ayudan a entender un fenómeno representándolo de manera simplificada• Exactitud o validez de un modelo• Más que verdadero útil

Page 26: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Inferencia Estadística¿Cómo generalizar desde los datos?

• Los modelos estadísticos nos ayudan a ordenar fenómenos que parecen no tener orden o causa clara

• Nos ayudan a modelar la incertidumbre inherente a la mayoría de los sistemas complejos: grandes grupos de personas, sistemas financieros, la biosfera, el macro mundo como emergencia del mundo atómico

• Por lo tanto nos ayudan a decidir bajo un escenario de incertidumbre

Page 27: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Inferencia Estadística¿Cómo generalizar desde los datos?

Un Modelo Estadístico Simple:Sea X la distancia (m) a la que se acerca el mar de una línea de referencia segura. Medimos X en varias oportunidades:

S = {15, 12, 10, 10, 12, 8, 10, 4, 4, 2, 3, 4, 10, 10, 12, 15, 14, 12, 12, 1, -0.5, 0.5,12, 10, 8, 5, 5, 1}

*Olas en la costa de Donostia (San Sebastián), en el País Vasco.

Page 28: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Inferencia Estadística¿Cómo generalizar desde los datos?

Un Modelo Estadístico Simple:Sea X la distancia (m) a la que se acerca el mar de una línea de referencia segura

1. X < 0.1m el 1% del tiempo2. 0.1 < X < 2m el 5% del tiempo3. 2 < X < 4m el 30% del tiempo4. X > 4 el 64% del tiempo

* Nilómetro

Page 29: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Inferencia Estadística¿Cómo generalizar desde los datos?

Modelo Estadístico de ServicioSea T el tiempo que pasa entre que dos votantes son atendidos. Notamos que en 1 hora votan más o menos 20 personas y que T > T0 = 1 minuto

)(40 0

401

)( TtetP

Probabilidad de T = t

*Elecciones 2006 en Venezuela

Page 30: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Inferencia Estadística¿Cómo generalizar desde los datos?

• Formulando modelos• Formulando hipótesis acerca de la población y contrastando su validez

¿Cuál es la Hipótesis?¿Cómo la escribimos?

Page 31: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Inferencia Estadística

Si X mide la comprensión lectora en la población de niños que ven (T) mucha televisión (1) versus una cantidad moderada (2)

(Hipótesis A) X1 < X2

(Hipótesis B) X1 ≠ X2

(Hipótesis C) X = 10 – alpha*T

Page 32: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Estadística Análisis de Hipótesis y Modelos

• Cuál es la validez de los modelos e hipótesis más allá de las muestras sobre las que podemos medir • Consistencia muestral ≠ validez poblacional• Significancia de las hipótesis o modelos

• Es foco de la estadística dar cuenta de las simplificaciones inherentes a los modelos? Sí y no: sensibilidad a los modelos estadísticos

Page 33: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

La Estadística Inferecial construye modelos e hipótesis que expliquen la variabilidad inherente a las observaciones

Page 34: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Estadística: Perspectiva Histórica

• del latín statisticum collegium ("consejo de Estado"), de su derivado italiano statista ("político") ó del alemán staat (“gobierno”).• Presente en todas las sociedades organizadas como herramienta administrativa (estudios demográficos, de renta, de productividad, de potencia bélica)• Nace con los censos de población y bienes

Page 35: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Estadística: Perspectiva Histórica

~

Censo del Pueblo de Israel1300 AC.

Page 36: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Estadística: Perspectiva Histórica

~

Censo del Pueblo de Israel1300 AC.

Page 37: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Estadística: Perspectiva Histórica • Siglo XIX: nace la estadística matemática

Page 38: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Estadística: Perspectiva Histórica • Fines del Siglo XX: Análisis Inteligente de Datos• Volúmenes gigantescos de datos, sin precedentes: observatorios, proyecto genoma, la web. • Análisis manual?: Estadística automatizada• Búsqueda de patrones en gigantescos volúmenes de datos: modelos estadísticos más algoritmos informáticos

Page 39: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Fobia a la Estadística?

Page 40: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Fobia a la Estadística?

Page 41: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Propósito número 1 de este curso:No más fobia a la estadística!

Page 42: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Propósito número 1 de este curso:No más fobia a la estadística!

• La estadística es muy sencilla si se aprenden bien los conceptos base.

• No se pide mucho:• Atención en clases.• Estudio en casa: unas hrs. A la semana bastan! • lr a la Ayudantía.

Page 43: Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Forma de Evaluación

• 2 certámenes (60%)• 1 nota de controles (15%)• 1 nota de laboratorio (25%) se exige aprobación• 1 exámen (eximición con 65)