Download - Experiencia educativa: Numero de laboratorio: Tarea 01 · PDF fileEn esta tarea 01 veremos alguna de las aplicaciones que se le puede dar a cada una de estas. Las funciones aquí mostradas

UV

Facultad de Ingeniería en

Electrónica y Comunicaciones

Nombre del alumno:

Erik Alan Fuentes Pérez

Experiencia educativa:

Procesamiento Analógico de Señales (PAS)

Numero de laboratorio:

Tarea 01

Nombre del docente:

Luis Javier Morales Mendoza

26 de febrero de 2014

1

Introducción

Una función de densidad de probabilidad caracteriza el comportamiento probable de una población

en tanto especifica la posibilidad relativa de que una variable aleatoria continua X tome un valor

cercano a x.

En esta tarea 01 veremos alguna de las aplicaciones que se le puede dar a cada una de estas.

Las funciones aquí mostradas fueron extraídas del software MATLAB en el cual nos ofrece una

diversa gama de distribuciones con las cuales podemos trabajar para poder generar algunas señales

o para obtener una señal a través de otra que sea aleatoria.

http://es.wikipedia.org/wiki/Variable_aleatoria

2

1.- Investigue por lo menos un ejemplo de aplicación de cada una de las Funciones de

Densidad de Probabilidad (PDF) graficadas en el Laboratorio.

Función Beta.

En años recientes, la distribución Beta ha encontrado aplicaciones importantes en la

inferencia bayesiana, donde los parámetros se consideran como variables aleatorias, y hay

necesidad de una densidad de probabilidad bastante “flexible” para el parámetro θ de la

distribución binomial, el cual solo toma valores distintos a cero en el intervalo desde 0

hasta 1. Con “flexible” queremos decir que la densidad de probabilidad pude tomar una

gran variedad de formas diferentes.

Función Binomial.

Esta distribución se aplica a situaciones en que en un número de intentos sólo pueden

ocurrir dos sucesos MECE, (mutualmente excluyentes y colectivamente exhaustivos).

Típicamente a estos sucesos se le denomina “éxito” y “fracaso”, asignándoles los números

1 y 0 respectivamente.

La v.a. de interés, X, es el número de veces que ocurre un éxito en un cierto número de

intento, N. N puede ser cualquier entero positivo y la v.a. X puede tomar el valor de

cualquier entero desde 0 a N. Para calcular las probabilidades de que ocurra cualquiera de

estos N+1 valores de X se deben cumplir dos condiciones: (1) la probabilidad de ocurrencia

del éxito no debe cambiar de intento a intento y (2) el resultado de cada uno de los N

intentos deben ser mutuamente independientes. Estas condiciones se cumplen rara vez de

manera estricta, pero existen situaciones reales suficientemente próximas a este ideal para

hacer útil la aplicación de la distribución binomial.

Una implicancia de la primera condición es que la ocurrencia de ciclos regulares (anual y

diario) debe ser tratada con cuidado separando los datos a analizar en períodos más breves

(meses o horas) dentro de los cuales la probabilidad de ocurrencia sea poco cambiante. La

segunda condición es más difícil de satisfacer por la persistencia de los fenómenos

meteorológicos en cuyo caso deben ser considerados como series de tiempo o extender los

períodos cubiertos por loas datos individuales hasta hacerlos efectivamente independientes,

por ejemplo precipitaciones anuales.

Algunas situaciones en las cuales se utiliza la distribución Binomial se plantean a

continuación:

- Se desarrolla una nueva variedad de maíz en una estación agrícola experimental. Se

plantan 20 semillas en un suelo de idéntica composición y se le dedican los mismos

3

cuidados. Se espera que germine el 90% de las semillas. Cuántas semillas se espera que

germinen?

- Diez individuos propensos a desarrollar tuberculosis, entran en contacto con un portador

de la enfermedad. Si la probabilidad de que la enfermedad se contagie del portador a un

sujeto cualquiera es de 0.10. Cuántos contraerán la enfermedad?

Función Chisquare.

La distribución de x^2 se utiliza en pruebas estadísticas que sirven para determinar si un

conjunto de valores experimentales de una magnitud (intensidad de lluvia, atenuación, etc.)

puede modelizarse con una distribución estadística dada.

Función Exponential.

Las aplicaciones más importantes de la distribución exponencial son aquellas situaciones en

donde se aplica el proceso de Poisson, es necesario recordar que un proceso de Poisson

permite el uso de la distribución de Poisson.

En el siguiente ejemplo se muestra una aplicación simple de la distribución exponencial en

un problema de confiabilidad. La distribución binomial también juega un papel importante

en la solución.

Suponga que un sistema contiene cierto tipo de componente cuyo tiempo de falla en años

está dado por la variable aleatoria T, distribuida exponencialmente con tiempo promedio de

falla . Sí 5 de estos componentes se instalan en diferentes sistemas, ¿cuál es la

probabilidad de que al menos 2 continúen funcionando después de 8 años?

Solución:

La probabilidad de que un determinado componente esté funcionando aún después de 8

años es:

La | nos indica que la integral se va a evaluar desde 8 hasta ¥

Sea x el número de componentes funcionando después de 8 años. Entonces mediante la

distribución Binomial,

n = 5

p = 0.20 = probabilidad de que un componente esté funcionando después de 8 años

q = 1-p = 0.80 = probabilidad de que un componente no funcione después de 8 años

4

(1)

Función Extreme Value.

La Teoría del Valor Extremo se aplica para la modelación de las colas de las distribuciones

con el objetivo de evitar los problemas derivados del ajuste global de un conjunto de datos

a través de un modelo único: aplicando la ley de los grandes números, o el teorema central

del límite, el ajuste de los valores centrales deja fuera del análisis aquellas situaciones que

escapan a la normalidad. La aplicación de un modelo individual que represente el

comportamiento de todos los datos puede no ser aceptable para los valores elevados. En

determinadas ocasiones las entidades aseguradoras se encuentran ante situaciones que

ponen en peligro la estabilidad y la solvencia de las mismas.

La Teoría del Valor Extremo puede ayudar, no a eliminar los sucesos que causan

consecuencias extremas gravosas, como las catástrofes, sino a predecirlos y, por tanto, a

ajustar mejor las primas, los recargos o a dotar mayores provisiones. La aplicación de la

Teoría del Valor Extremo también resulta de interés en campos como el reasegurador,

donde, fundamentalmente en los tratados no proporcionales, la cobertura se realiza

exclusivamente para niveles de siniestralidad altos.

Ello implica, por tanto, que en general la correcta tarificación del reaseguro no debe

realizarse sobre la base de los valores medios sino a partir de los valores extremos.

Función F.

El principal uso de esta función es el Análisis de Varianza, y es para cuando se necesita

comparar más de dos medias muéstrales a la vez. En estos casos la idea es detectar si el

efecto de uno o más tratamientos afecta a las muestras testeadas. En cambio, cuando se

tiene el caso de dos muestras, la idea es testear si hay homocedasticidad en las dos

poblaciones en estudio. Una vez verificado este supuesto, se puede avanzar más verificando

si hay diferencia entre las medias muéstrales, y así verificar si ambas muestras tienen igual

media y varianza, porque eso significa que en realidad provienen de la misma población

normal. Eso probaría que no hay efecto de un tratamiento si se lo compara con un placebo,

o que dos técnicas de laboratorio son equivalentes.

Función Gamma.

Sus aplicaciones, además de las de la exponencial, son en los procesos que requieren algún

tiempo para completar la realización de una tarea y el tiempo de mantenimiento de

maquinaria.

Para x > 0

5

(2)

Función Generalized Extreme Value.

La Teoría del Valor Extremo es una disciplina estadística que desarrolla un conjunto de

modelos y métodos tanto paramétricos como no paramétricos con el objeto de describir,

cuantificar y modelizar los casos raros los cuales se distribuyen, no bajo la ‘ley de los

grandes números’, sino bajo la ley de los pequeños números (‘law of the small numbers’).

Esta teoría ha experimentado un importante desarrollo en los últimos 50 años, gracias a su

aplicabilidad a múltiples disciplinas, como mercados financieros, sector asegurador,

ingenierías, biología, hidrología, medio ambiente, etc.

En el ámbito del seguro, el estudio de los extremos puede ayudar a responder varias

cuestiones como:

¿Cuál es el tiempo medio de espera hasta la ocurrencia de un siniestro de una determinada

cuantía elevada?

¿Cuál es la cuantía de siniestralidad probable en una cartera, dada una alta probabilidad,

por ejemplo 0,999; esto es, cual es la máxima pérdida probable esperada para los próximos

1.000 siniestros?

Función Generalized Pareto.

La distribución de Pareto aparece asociada a multitud de magnitudes naturales. Es

profusamente empleada para modelizar aspectos tales como: la distribución de la renta de

los individuos (cuando ésta supera un cierto umbral β); las reclamaciones de seguros; la

distribución de recursos naturales en zonas geográficas; el tamaño de las ciudades; el

numero de empleados de las empresas; las fluctuaciones de los precios en los mercados de

valores, entre otras. En algunos textos la encontramos exclusivamente asociada a la

distribución de los ingresos de los individuos: "la probabilidad de que la renta de un

individuo supere una cierta cantidad A es una variable aleatoria de Pareto (α=A,)".

Función Geometric.

La distribucion geométrica sirve para cuando se necesita estudiar el número del evento en

el que se produce el primer evento con éxito.

Permite calcular la probabilidad de que tenga que realizarse un numero k de ensayos para

obtener un éxito en el último ensayo, siendo p la probabilidad de obtener un éxito. Así

pues, esta distribución es un caso particular de la distribución binomial negativa para el

caso en que r=1

6

Se utiliza en la distribución de los tiempos de espera, de manera que si en los ensayos se

realiza a intervalos regulares de tiempo, esta variable aleatoria proporciona el tiempo

transcurrido hasta el primer éxito. Por ejemplo, encontrar la primera defectuosa, la primera

ocurrencia de un suceso, la llegada de un cliente a un lugar de servicio, la rotura de un

cierra pieza, etc.

Función Hyprgeometric.

La distribución hipergeométrica es especialmente útil en todos aquellos casos en los que se

extraigan muestras o se realizan experiencias repetidas sin devolución del elemento

extraído o sin retornar a la situación experimental inicial.

Sus aplicaciones están en áreas con uso considerable de muestreo de aceptación, pruebas

electrónicas y de aseguramiento de la calidad, fabricación de piezas, etc.

Función Loganormal.

La distribución log-normal se aplica a menudo en propagación, principalmente para

magnitudes relacionadas, bien con un nivel de potencia o de campo, bien con una duración.

En el caso de los niveles de potencia o de campo como suelen estar expresados sólo en

decibelios, se habla más bien de una distribución normal de los niveles. En el caso de

duraciones (por ejemplo, las duraciones de los desvanecimientos), la distribución log-

normal se utiliza explícitamente, pues la variable natural es el segundo o el minuto y no su

logaritmo.

Como la inversa de una variable que tiene una distribución log-normal tiene también la

misma distribución, ésta se aplica en ciertos casos a intensidades (inversas de la duración).

Por ejemplo, se utiliza para representar la distribución de las intensidades de la lluvia, al

menos para las intensidades de lluvia bajas y medias.

La distribución log normal se ajusta a ciertos tipos de fallos (fatiga de componentes

metálicos), vida de los aislamientos eléctricos, procesos continuos (procesos técnicos)

y datos de reparación y puede ser una buena representación de la distribución de los

tiempos de reparación. Es también una distribución importante en la valoración de sistemas

con reparación.

La distribución log normal es importante en la representación de fenómenos de efectos

Proporcionales, tales como aquellos en los que un cambio en la variable en cualquier punto

de un proceso es una proporción aleatoria del valor previo de la variable. Algunos fallos en

el programa de mantenimiento entran en esta categoría.

7

(3)

Frente a la distribución gaussiana, se puede considerar que la intervención de la

distribución log-normal significa que los valores numéricos de la variable resultan de la

acción de numerosas causas de poca importancia individual, pero que actúan con efecto

multiplicador.

Función Negative Binomial.

Esta distribución se aplica a situaciones en que en un número de intentos sólo pueden

ocurrir dos sucesos MECE, (mutualmente excluyentes y colectivamente exhaustivos).

Típicamente a estos sucesos se le denomina “éxito” y “fracaso”, asignándoles los números

1 y 0 respectivamente.

Función Noncentral F.

Encuentra enorme aplicación en la comparación de varianzas muéstrales. Las aplicaciones

de la distribución F se encuentran en problemas que implican dos o más muestras.

El estadístico F se define como la razón de dos variables aleatorias chi cuadradas

independientes, dividida cada una entre su número de grados de libertad. De aquí, podemos

escribir

Donde U y V son variables aleatorias independientes que tienen distribuciones chi

cuadradas con los grados de libertad correspondientes.

Función Noncentral t.

Se utiliza de manera extensa en problemas que tienen que ver con inferencias acerca de la

media de la población o en problemas que implican muestras comparativas.

Función Noncentral Chi-square.

En estadística, la distribución χ² (de Pearson), llamada Chi cuadrado o Ji cuadrado, es

una distribución de probabilidad continua con un parámetro que representa los grados de

libertad de la variable aleatoria

La distribución χ² tiene muchas aplicaciones en inferencia estadística. La más conocida es

la de la denominada prueba χ² utilizada como prueba de independencia y como prueba de

bondad de ajuste y en la estimación de varianzas. Pero también está involucrada en el

problema de estimar la media de una población normalmente distribuida y en el problema

http://es.wikipedia.org/wiki/Estad%C3%ADstica

http://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_probabilidad_continua

http://es.wikipedia.org/wiki/Grado_de_libertad_(estad%C3%ADstica)

http://es.wikipedia.org/wiki/Grado_de_libertad_(estad%C3%ADstica)

http://es.wikipedia.org/wiki/Variable_aleatoria

http://es.wikipedia.org/wiki/Inferencia_estad%C3%ADstica

http://es.wikipedia.org/wiki/Prueba_%CF%87%C2%B2

8

de estimar la pendiente de una recta de regresión lineal, a través de su papel en

la distribución t de Student.

En la industria farmacéutica se la usa para analizar la dispersión de los componentes de los

productos terminados. Todo remedio fabricado debe cumplir estrictas normas de calidad,

generalmente referidas al contenido en peso de sus principales componentes. Se usan dos

límites: el superior e inferior, dentro de los cuales se los debe mantener controlados. Este

rango de valores define la dispersión máxima admisible y lo ideal es que la dispersión de

los productos terminados sea bastante inferior a dicho rango. Ese control de la dispersión es

muy similar al explicado más arriba, para los bioquímicos.

Función Normal.

La distribución normal es de gran importancia en el análisis y cálculo de todos los aspectos

relacionados con datos experimentales y la mayoría de los métodos estadísticos básicos se

apoyan en la distribución normal.

Podemos entonces, resumir en tres razones la importancia de la distribución normal en la

estadística:

Numerosos fenómenos continuos parecen seguirla o se pueden aproximar mediante

ella.

Se puede utilizar para aproximar varias distribuciones discretas de probabilidad (La

binomial, hipergeométrica, Poisson) y de esta forma simplificar cálculos tediosos.

Proporciona la base para la inferencia estadística clásica por su relación con el

teorema central del límite.

La distribución normal tiene varias propiedades teóricas importantes, entre éstas se

encuentran:

1. Tiene ``forma de campana'' y es de apariencia simétrica.

2. Sus medidas de tendencia central (Media, mediana, moda) son idénticas y se

encuentran ubicadas en el centro de la curva

3. La variable aleatoria asociada con esta distribución tiene rango

infinito

4. El rango intercuartílico es igual a 4/3 de la desviación estándar.

Ejemplo:

Suponga que en un determinada empresa se analiza el tiempo que lleva a los trabajadores la

instalación de una determinada pieza del producto que fabrica, concluyendo que se

http://es.wikipedia.org/wiki/Regresi%C3%B3n_lineal

http://es.wikipedia.org/wiki/Distribuci%C3%B3n_t_de_Student

9

distribuye como una normal con un media de 30 minutos y una desviación estándar de 5

minutos. Con estos datos se pueden contestar preguntas como:

¿Cuántos minutos tienen que pasar antes de que el 10 por ciento de los trabajadores monten

la pieza?

Lo que debemos obtener aquí es el valor de la variable Z que deja en la cola izquierda de la

distribución el 10 por ciento. En las tablas obtendríamos un valor z0=-1,28. Este será el

valor triplicado, de manera que el valor de X será: x0=μ+z0 #=30- 1,28x5=23,6 minutos.

Otro ejemplo en el que se puede aplicar el uso de la distribución normal es el siguiente:

Suponga que el encargado de la tesorería de una empresa está interesado en el número de

días que transcurre entre la facturación y el pago de las cuentas a crédito. Una vez

recogidos los datos, se observa que el tiempo se distribuye aproximadamente como una

normal con una media y una variancia determinada. En este caso se podría responder a

preguntas como la siguiente: ¿Qué porcentaje de cuentas se pagará antes de x días? ¿Dentro

de cuántos días se pagará el 80 por ciento de las cuentas?

Función Poisson.

En el campo microbiológico, las variables con distribución Poisson están relacionadas en su

mayoría a procesos de conteo como el recuento de microorganismos viables por conteo en

plato o determinación del número más probable (NMP), así como a procesos relacionados

con la determinación de la probabilidad de mutación celular.

Cuando se busca realizar del recuento de microorganismos viables por conteo en plato o

determinar el número más probable (NMP), el suceso a observar será el número de colonias

bacterianas (UFC) desarrolladas sobre el plato de ajar o el número de tubos con crecimiento

bacteriano (positivos) y el intervalo corresponderá a la unidad de muestra analizada,

llámese gramo de suelo, o mililitro de un líquido analizado (agua, sangre, etc.).

En el caso de la determinación de la probabilidad de mutación bacteriana, el suceso será la

observación del número de bacterias mutantes (cada célula bacteriana mutante generará una

colonia en un medio de cultivo selectivo de dicha mutación) y el intervalo corresponderá a

la concentración bacteriana bajo observación, por ejemplo 2 10 células bacterianas.

Función Rayleigh.

La distribución de Rayleigh se aplica a una variable continua positiva no limitada. Está

ligada a la distribución gaussiana del modo siguiente.

La distribución de Rayleigh aparece asociada a la fiabilidad de sistemas a través de la

modelización del tiempo hasta el fallo de un dispositivo.

10

Función T.

Esta distribución tiene un papel fundamental en determinados contrastes de hipótesis

(pruebas sobre igualdad de medias), fuera de esta aplicación podría usarse para modelizar

la desviación de la media de una muestra respecto de la media de la población de la que

ésta procede.

La distribución t es útil para realizar inferencias acerca de la media poblacional cuando no

se conoce s y la población es normal, independiente del n, no obstante, aún cuando la

distribución sea un tanto sesgada, la t sigue siendo apropiada, esto se conoce como una

distribución robusta, es decir, a cambios moderados de los supuestos, el modelo sigue

siendo válido.

La distribución t se usa de manera extensa en problemas que tienen que ver con inferencia

acerca de la media de la población o en problemas que implican muestras comparativas (es

decir, en casos donde se trata de determinar si las medias de dos muestras son

significativamente diferentes).

Función Uniform.

En estadística, cuando se utiliza un p-value a modo de prueba estadística para una hipótesis

nula simple, y la distribución de la prueba estadística es continua, entonces la prueba

estadística esta uniformemente distribuida entre 0 y 1 si la hipótesis nula es verdadera.

La distribución uniforme resulta útil para muestrear distribuciones arbitrarias. Un método

general es el método de muestreo de transformación inversa, que utiliza la distribución de

probabilidad(CDF) de la variable aleatoria objetivo. Este método es muy útil en trabajos

teóricos. Dado que las simulaciones que utilizan este método requieren invertir la CDF del

variable objetivo, se han diseñado métodos alternativos para aquellos casos donde no se

conoce el CDF en una forma cerrada. Otro método similar es el rejection sampling.

Función Discrete Uniform.

Muchas veces, un experimento estadístico consiste en pruebas repetidas, cada una con dos

posibles resultados que se pueden etiquetar como éxito o fracaso.

La aplicación más obvia tiene que ver con la prueba de artículos a medida que salen de una

sección de montaje, donde cada prueba o experimento puede indicar si un artículo está

defectuoso o no. Podemos elegir definir cualquiera de los resultados como éxito.

Si los ensayos que se repiten son independientes y la probabilidad de éxito permanece

constante entre cada uno de ellos, esto da lugar a un proceso denominado proceso de

Bernoulli. Cada ensayo se llama experimento Bernoulli.

http://es.wikipedia.org/wiki/Estad%C3%ADstica

http://es.wikipedia.org/w/index.php?title=P-value&action=edit&redlink=1

http://es.wikipedia.org/wiki/Hip%C3%B3tesis_nula

http://es.wikipedia.org/wiki/Hip%C3%B3tesis_nula

http://es.wikipedia.org/wiki/M%C3%A9todo_de_muestreo_de_transformaci%C3%B3n_inversa

http://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_probabilidad

http://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_probabilidad

http://es.wikipedia.org/w/index.php?title=Rejection_sampling&action=edit&redlink=1

11

Función Weibull.

La distribución modela la distribución de fallos (en sistemas) cuando la tasa de fallos es

proporcional a una potencia del tiempo:

Un valor k<1 indica que la tasa de fallos decrece con el tiempo.

Cuando k=1, la tasa de fallos es constante en el tiempo.

Un valor k>1 indica que la tasa de fallos crece con el tiempo.

La distribución de Weibull se utiliza en:

Análisis de la supervivencia

Reliability engineering

En ingeniería, para modelar procesos estocásticos relacionados con el tiempo de

fabricación y distribución de bienes

Teoría de valores extremos

Meteorología

Para modelar la distribución de la velocidad del viento

En telecomunicaciones

En sistemas de radar para simular la dispersión de la señal recibida

En seguros, para modelar el tamaño de las pérdidas

http://es.wikipedia.org/wiki/An%C3%A1lisis_de_la_supervivencia

http://es.wikipedia.org/w/index.php?title=Reliability_engineering&action=edit&redlink=1

http://es.wikipedia.org/w/index.php?title=Teor%C3%ADa_de_valores_extremos&action=edit&redlink=1

http://es.wikipedia.org/wiki/Meteorolog%C3%ADa

http://es.wikipedia.org/wiki/Radar

http://es.wikipedia.org/wiki/Seguros

12

2.-Determine la ecuación correspondiente de la media (μ) y la varianza (σ^2) usando el

primer (m1) y el segundo (m2) momento de probabilidad de la PDF tipo Rayleigh.

(Vea Anexo 01)

Solución: su expresión matemática se define como

Dado que el primer momento de la probabilidad es equivalente en la PDF normal, se

deduce que

El segundo momento de probabilidad se define como

Ahora, sustituyendo la (1) en (3) se obtiene

Para resolver la integral, se usa la herramienta conocida como la función gamma, la cual es

definida como

Por lo tonto, al comparar el argumento de la función exponencial (4) con el del (5) se deduce que la

función para el cambio de variable es

Por otra parte, se puede ver que el intervalo de (4) es de [- ,+ ] y como la integral es simétrica,

entonces, se deduce que el intervalo puede ser transformado a dos veces de [0, + ]

13

Diferenciando (6)

Ahora se observa en (6) que cuando, x → + , u→+ . Arreglando la (4) se llega a

Simplificando, eliminando la variable x de la (8), se llega a

Cambiando l forma de (9)

Al comparar la (10) con la (5) se observa que ambas son my similares con la excepción de

la potencia de la variable u, por lo que se deduce que,

Por lo que el valor de z =2, es decir

Para encontrar l valor de es necesario emplear algunas propiedades de la función

gamma las cuales son:

14

Entonces empleando la (15) en la de (12) se llega a

Y usando la (15) se llega a

Introduciendo este resultado en la (12) se obtiene finalmente el resultado del segundo

momento de probabilidad

Para deducir el valor de a varianza se tiene que

Por lo tanto, como , se llega a