UV
Facultad de Ingeniería en
Electrónica y Comunicaciones
Nombre del alumno:
Erik Alan Fuentes Pérez
Experiencia educativa:
Procesamiento Analógico de Señales (PAS)
Numero de laboratorio:
Tarea 01
Nombre del docente:
Luis Javier Morales Mendoza
26 de febrero de 2014
1
Introducción
Una función de densidad de probabilidad caracteriza el comportamiento probable de una población
en tanto especifica la posibilidad relativa de que una variable aleatoria continua X tome un valor
cercano a x.
En esta tarea 01 veremos alguna de las aplicaciones que se le puede dar a cada una de estas.
Las funciones aquí mostradas fueron extraídas del software MATLAB en el cual nos ofrece una
diversa gama de distribuciones con las cuales podemos trabajar para poder generar algunas señales
o para obtener una señal a través de otra que sea aleatoria.
2
1.- Investigue por lo menos un ejemplo de aplicación de cada una de las Funciones de
Densidad de Probabilidad (PDF) graficadas en el Laboratorio.
Función Beta.
En años recientes, la distribución Beta ha encontrado aplicaciones importantes en la
inferencia bayesiana, donde los parámetros se consideran como variables aleatorias, y hay
necesidad de una densidad de probabilidad bastante “flexible” para el parámetro θ de la
distribución binomial, el cual solo toma valores distintos a cero en el intervalo desde 0
hasta 1. Con “flexible” queremos decir que la densidad de probabilidad pude tomar una
gran variedad de formas diferentes.
Función Binomial.
Esta distribución se aplica a situaciones en que en un número de intentos sólo pueden
ocurrir dos sucesos MECE, (mutualmente excluyentes y colectivamente exhaustivos).
Típicamente a estos sucesos se le denomina “éxito” y “fracaso”, asignándoles los números
1 y 0 respectivamente.
La v.a. de interés, X, es el número de veces que ocurre un éxito en un cierto número de
intento, N. N puede ser cualquier entero positivo y la v.a. X puede tomar el valor de
cualquier entero desde 0 a N. Para calcular las probabilidades de que ocurra cualquiera de
estos N+1 valores de X se deben cumplir dos condiciones: (1) la probabilidad de ocurrencia
del éxito no debe cambiar de intento a intento y (2) el resultado de cada uno de los N
intentos deben ser mutuamente independientes. Estas condiciones se cumplen rara vez de
manera estricta, pero existen situaciones reales suficientemente próximas a este ideal para
hacer útil la aplicación de la distribución binomial.
Una implicancia de la primera condición es que la ocurrencia de ciclos regulares (anual y
diario) debe ser tratada con cuidado separando los datos a analizar en períodos más breves
(meses o horas) dentro de los cuales la probabilidad de ocurrencia sea poco cambiante. La
segunda condición es más difícil de satisfacer por la persistencia de los fenómenos
meteorológicos en cuyo caso deben ser considerados como series de tiempo o extender los
períodos cubiertos por loas datos individuales hasta hacerlos efectivamente independientes,
por ejemplo precipitaciones anuales.
Algunas situaciones en las cuales se utiliza la distribución Binomial se plantean a
continuación:
- Se desarrolla una nueva variedad de maíz en una estación agrícola experimental. Se
plantan 20 semillas en un suelo de idéntica composición y se le dedican los mismos
3
cuidados. Se espera que germine el 90% de las semillas. Cuántas semillas se espera que
germinen?
- Diez individuos propensos a desarrollar tuberculosis, entran en contacto con un portador
de la enfermedad. Si la probabilidad de que la enfermedad se contagie del portador a un
sujeto cualquiera es de 0.10. Cuántos contraerán la enfermedad?
Función Chisquare.
La distribución de x^2 se utiliza en pruebas estadísticas que sirven para determinar si un
conjunto de valores experimentales de una magnitud (intensidad de lluvia, atenuación, etc.)
puede modelizarse con una distribución estadística dada.
Función Exponential.
Las aplicaciones más importantes de la distribución exponencial son aquellas situaciones en
donde se aplica el proceso de Poisson, es necesario recordar que un proceso de Poisson
permite el uso de la distribución de Poisson.
En el siguiente ejemplo se muestra una aplicación simple de la distribución exponencial en
un problema de confiabilidad. La distribución binomial también juega un papel importante
en la solución.
Suponga que un sistema contiene cierto tipo de componente cuyo tiempo de falla en años
está dado por la variable aleatoria T, distribuida exponencialmente con tiempo promedio de
falla . Sí 5 de estos componentes se instalan en diferentes sistemas, ¿cuál es la
probabilidad de que al menos 2 continúen funcionando después de 8 años?
Solución:
La probabilidad de que un determinado componente esté funcionando aún después de 8
años es:
La | nos indica que la integral se va a evaluar desde 8 hasta ¥
Sea x el número de componentes funcionando después de 8 años. Entonces mediante la
distribución Binomial,
n = 5
p = 0.20 = probabilidad de que un componente esté funcionando después de 8 años
q = 1-p = 0.80 = probabilidad de que un componente no funcione después de 8 años
4
(1)
Función Extreme Value.
La Teoría del Valor Extremo se aplica para la modelación de las colas de las distribuciones
con el objetivo de evitar los problemas derivados del ajuste global de un conjunto de datos
a través de un modelo único: aplicando la ley de los grandes números, o el teorema central
del límite, el ajuste de los valores centrales deja fuera del análisis aquellas situaciones que
escapan a la normalidad. La aplicación de un modelo individual que represente el
comportamiento de todos los datos puede no ser aceptable para los valores elevados. En
determinadas ocasiones las entidades aseguradoras se encuentran ante situaciones que
ponen en peligro la estabilidad y la solvencia de las mismas.
La Teoría del Valor Extremo puede ayudar, no a eliminar los sucesos que causan
consecuencias extremas gravosas, como las catástrofes, sino a predecirlos y, por tanto, a
ajustar mejor las primas, los recargos o a dotar mayores provisiones. La aplicación de la
Teoría del Valor Extremo también resulta de interés en campos como el reasegurador,
donde, fundamentalmente en los tratados no proporcionales, la cobertura se realiza
exclusivamente para niveles de siniestralidad altos.
Ello implica, por tanto, que en general la correcta tarificación del reaseguro no debe
realizarse sobre la base de los valores medios sino a partir de los valores extremos.
Función F.
El principal uso de esta función es el Análisis de Varianza, y es para cuando se necesita
comparar más de dos medias muéstrales a la vez. En estos casos la idea es detectar si el
efecto de uno o más tratamientos afecta a las muestras testeadas. En cambio, cuando se
tiene el caso de dos muestras, la idea es testear si hay homocedasticidad en las dos
poblaciones en estudio. Una vez verificado este supuesto, se puede avanzar más verificando
si hay diferencia entre las medias muéstrales, y así verificar si ambas muestras tienen igual
media y varianza, porque eso significa que en realidad provienen de la misma población
normal. Eso probaría que no hay efecto de un tratamiento si se lo compara con un placebo,
o que dos técnicas de laboratorio son equivalentes.
Función Gamma.
Sus aplicaciones, además de las de la exponencial, son en los procesos que requieren algún
tiempo para completar la realización de una tarea y el tiempo de mantenimiento de
maquinaria.
Para x > 0
5
(2)
Función Generalized Extreme Value.
La Teoría del Valor Extremo es una disciplina estadística que desarrolla un conjunto de
modelos y métodos tanto paramétricos como no paramétricos con el objeto de describir,
cuantificar y modelizar los casos raros los cuales se distribuyen, no bajo la ‘ley de los
grandes números’, sino bajo la ley de los pequeños números (‘law of the small numbers’).
Esta teoría ha experimentado un importante desarrollo en los últimos 50 años, gracias a su
aplicabilidad a múltiples disciplinas, como mercados financieros, sector asegurador,
ingenierías, biología, hidrología, medio ambiente, etc.
En el ámbito del seguro, el estudio de los extremos puede ayudar a responder varias
cuestiones como:
¿Cuál es el tiempo medio de espera hasta la ocurrencia de un siniestro de una determinada
cuantía elevada?
¿Cuál es la cuantía de siniestralidad probable en una cartera, dada una alta probabilidad,
por ejemplo 0,999; esto es, cual es la máxima pérdida probable esperada para los próximos
1.000 siniestros?
Función Generalized Pareto.
La distribución de Pareto aparece asociada a multitud de magnitudes naturales. Es
profusamente empleada para modelizar aspectos tales como: la distribución de la renta de
los individuos (cuando ésta supera un cierto umbral β); las reclamaciones de seguros; la
distribución de recursos naturales en zonas geográficas; el tamaño de las ciudades; el
numero de empleados de las empresas; las fluctuaciones de los precios en los mercados de
valores, entre otras. En algunos textos la encontramos exclusivamente asociada a la
distribución de los ingresos de los individuos: "la probabilidad de que la renta de un
individuo supere una cierta cantidad A es una variable aleatoria de Pareto (α=A,)".
Función Geometric.
La distribucion geométrica sirve para cuando se necesita estudiar el número del evento en
el que se produce el primer evento con éxito.
Permite calcular la probabilidad de que tenga que realizarse un numero k de ensayos para
obtener un éxito en el último ensayo, siendo p la probabilidad de obtener un éxito. Así
pues, esta distribución es un caso particular de la distribución binomial negativa para el
caso en que r=1
6
Se utiliza en la distribución de los tiempos de espera, de manera que si en los ensayos se
realiza a intervalos regulares de tiempo, esta variable aleatoria proporciona el tiempo
transcurrido hasta el primer éxito. Por ejemplo, encontrar la primera defectuosa, la primera
ocurrencia de un suceso, la llegada de un cliente a un lugar de servicio, la rotura de un
cierra pieza, etc.
Función Hyprgeometric.
La distribución hipergeométrica es especialmente útil en todos aquellos casos en los que se
extraigan muestras o se realizan experiencias repetidas sin devolución del elemento
extraído o sin retornar a la situación experimental inicial.
Sus aplicaciones están en áreas con uso considerable de muestreo de aceptación, pruebas
electrónicas y de aseguramiento de la calidad, fabricación de piezas, etc.
Función Loganormal.
La distribución log-normal se aplica a menudo en propagación, principalmente para
magnitudes relacionadas, bien con un nivel de potencia o de campo, bien con una duración.
En el caso de los niveles de potencia o de campo como suelen estar expresados sólo en
decibelios, se habla más bien de una distribución normal de los niveles. En el caso de
duraciones (por ejemplo, las duraciones de los desvanecimientos), la distribución log-
normal se utiliza explícitamente, pues la variable natural es el segundo o el minuto y no su
logaritmo.
Como la inversa de una variable que tiene una distribución log-normal tiene también la
misma distribución, ésta se aplica en ciertos casos a intensidades (inversas de la duración).
Por ejemplo, se utiliza para representar la distribución de las intensidades de la lluvia, al
menos para las intensidades de lluvia bajas y medias.
La distribución log normal se ajusta a ciertos tipos de fallos (fatiga de componentes
metálicos), vida de los aislamientos eléctricos, procesos continuos (procesos técnicos)
y datos de reparación y puede ser una buena representación de la distribución de los
tiempos de reparación. Es también una distribución importante en la valoración de sistemas
con reparación.
La distribución log normal es importante en la representación de fenómenos de efectos
Proporcionales, tales como aquellos en los que un cambio en la variable en cualquier punto
de un proceso es una proporción aleatoria del valor previo de la variable. Algunos fallos en
el programa de mantenimiento entran en esta categoría.
7
(3)
Frente a la distribución gaussiana, se puede considerar que la intervención de la
distribución log-normal significa que los valores numéricos de la variable resultan de la
acción de numerosas causas de poca importancia individual, pero que actúan con efecto
multiplicador.
Función Negative Binomial.
Esta distribución se aplica a situaciones en que en un número de intentos sólo pueden
ocurrir dos sucesos MECE, (mutualmente excluyentes y colectivamente exhaustivos).
Típicamente a estos sucesos se le denomina “éxito” y “fracaso”, asignándoles los números
1 y 0 respectivamente.
Función Noncentral F.
Encuentra enorme aplicación en la comparación de varianzas muéstrales. Las aplicaciones
de la distribución F se encuentran en problemas que implican dos o más muestras.
El estadístico F se define como la razón de dos variables aleatorias chi cuadradas
independientes, dividida cada una entre su número de grados de libertad. De aquí, podemos
escribir
Donde U y V son variables aleatorias independientes que tienen distribuciones chi
cuadradas con los grados de libertad correspondientes.
Función Noncentral t.
Se utiliza de manera extensa en problemas que tienen que ver con inferencias acerca de la
media de la población o en problemas que implican muestras comparativas.
Función Noncentral Chi-square.
En estadística, la distribución χ² (de Pearson), llamada Chi cuadrado o Ji cuadrado, es
una distribución de probabilidad continua con un parámetro que representa los grados de
libertad de la variable aleatoria
La distribución χ² tiene muchas aplicaciones en inferencia estadística. La más conocida es
la de la denominada prueba χ² utilizada como prueba de independencia y como prueba de
bondad de ajuste y en la estimación de varianzas. Pero también está involucrada en el
problema de estimar la media de una población normalmente distribuida y en el problema
8
de estimar la pendiente de una recta de regresión lineal, a través de su papel en
la distribución t de Student.
En la industria farmacéutica se la usa para analizar la dispersión de los componentes de los
productos terminados. Todo remedio fabricado debe cumplir estrictas normas de calidad,
generalmente referidas al contenido en peso de sus principales componentes. Se usan dos
límites: el superior e inferior, dentro de los cuales se los debe mantener controlados. Este
rango de valores define la dispersión máxima admisible y lo ideal es que la dispersión de
los productos terminados sea bastante inferior a dicho rango. Ese control de la dispersión es
muy similar al explicado más arriba, para los bioquímicos.
Función Normal.
La distribución normal es de gran importancia en el análisis y cálculo de todos los aspectos
relacionados con datos experimentales y la mayoría de los métodos estadísticos básicos se
apoyan en la distribución normal.
Podemos entonces, resumir en tres razones la importancia de la distribución normal en la
estadística:
Numerosos fenómenos continuos parecen seguirla o se pueden aproximar mediante
ella.
Se puede utilizar para aproximar varias distribuciones discretas de probabilidad (La
binomial, hipergeométrica, Poisson) y de esta forma simplificar cálculos tediosos.
Proporciona la base para la inferencia estadística clásica por su relación con el
teorema central del límite.
La distribución normal tiene varias propiedades teóricas importantes, entre éstas se
encuentran:
1. Tiene ``forma de campana'' y es de apariencia simétrica.
2. Sus medidas de tendencia central (Media, mediana, moda) son idénticas y se
encuentran ubicadas en el centro de la curva
3. La variable aleatoria asociada con esta distribución tiene rango
infinito
4. El rango intercuartílico es igual a 4/3 de la desviación estándar.
Ejemplo:
Suponga que en un determinada empresa se analiza el tiempo que lleva a los trabajadores la
instalación de una determinada pieza del producto que fabrica, concluyendo que se
9
distribuye como una normal con un media de 30 minutos y una desviación estándar de 5
minutos. Con estos datos se pueden contestar preguntas como:
¿Cuántos minutos tienen que pasar antes de que el 10 por ciento de los trabajadores monten
la pieza?
Lo que debemos obtener aquí es el valor de la variable Z que deja en la cola izquierda de la
distribución el 10 por ciento. En las tablas obtendríamos un valor z0=-1,28. Este será el
valor triplicado, de manera que el valor de X será: x0=μ+z0 #=30- 1,28x5=23,6 minutos.
Otro ejemplo en el que se puede aplicar el uso de la distribución normal es el siguiente:
Suponga que el encargado de la tesorería de una empresa está interesado en el número de
días que transcurre entre la facturación y el pago de las cuentas a crédito. Una vez
recogidos los datos, se observa que el tiempo se distribuye aproximadamente como una
normal con una media y una variancia determinada. En este caso se podría responder a
preguntas como la siguiente: ¿Qué porcentaje de cuentas se pagará antes de x días? ¿Dentro
de cuántos días se pagará el 80 por ciento de las cuentas?
Función Poisson.
En el campo microbiológico, las variables con distribución Poisson están relacionadas en su
mayoría a procesos de conteo como el recuento de microorganismos viables por conteo en
plato o determinación del número más probable (NMP), así como a procesos relacionados
con la determinación de la probabilidad de mutación celular.
Cuando se busca realizar del recuento de microorganismos viables por conteo en plato o
determinar el número más probable (NMP), el suceso a observar será el número de colonias
bacterianas (UFC) desarrolladas sobre el plato de ajar o el número de tubos con crecimiento
bacteriano (positivos) y el intervalo corresponderá a la unidad de muestra analizada,
llámese gramo de suelo, o mililitro de un líquido analizado (agua, sangre, etc.).
En el caso de la determinación de la probabilidad de mutación bacteriana, el suceso será la
observación del número de bacterias mutantes (cada célula bacteriana mutante generará una
colonia en un medio de cultivo selectivo de dicha mutación) y el intervalo corresponderá a
la concentración bacteriana bajo observación, por ejemplo 2 10 células bacterianas.
Función Rayleigh.
La distribución de Rayleigh se aplica a una variable continua positiva no limitada. Está
ligada a la distribución gaussiana del modo siguiente.
La distribución de Rayleigh aparece asociada a la fiabilidad de sistemas a través de la
modelización del tiempo hasta el fallo de un dispositivo.
10
Función T.
Esta distribución tiene un papel fundamental en determinados contrastes de hipótesis
(pruebas sobre igualdad de medias), fuera de esta aplicación podría usarse para modelizar
la desviación de la media de una muestra respecto de la media de la población de la que
ésta procede.
La distribución t es útil para realizar inferencias acerca de la media poblacional cuando no
se conoce s y la población es normal, independiente del n, no obstante, aún cuando la
distribución sea un tanto sesgada, la t sigue siendo apropiada, esto se conoce como una
distribución robusta, es decir, a cambios moderados de los supuestos, el modelo sigue
siendo válido.
La distribución t se usa de manera extensa en problemas que tienen que ver con inferencia
acerca de la media de la población o en problemas que implican muestras comparativas (es
decir, en casos donde se trata de determinar si las medias de dos muestras son
significativamente diferentes).
Función Uniform.
En estadística, cuando se utiliza un p-value a modo de prueba estadística para una hipótesis
nula simple, y la distribución de la prueba estadística es continua, entonces la prueba
estadística esta uniformemente distribuida entre 0 y 1 si la hipótesis nula es verdadera.
La distribución uniforme resulta útil para muestrear distribuciones arbitrarias. Un método
general es el método de muestreo de transformación inversa, que utiliza la distribución de
probabilidad(CDF) de la variable aleatoria objetivo. Este método es muy útil en trabajos
teóricos. Dado que las simulaciones que utilizan este método requieren invertir la CDF del
variable objetivo, se han diseñado métodos alternativos para aquellos casos donde no se
conoce el CDF en una forma cerrada. Otro método similar es el rejection sampling.
Función Discrete Uniform.
Muchas veces, un experimento estadístico consiste en pruebas repetidas, cada una con dos
posibles resultados que se pueden etiquetar como éxito o fracaso.
La aplicación más obvia tiene que ver con la prueba de artículos a medida que salen de una
sección de montaje, donde cada prueba o experimento puede indicar si un artículo está
defectuoso o no. Podemos elegir definir cualquiera de los resultados como éxito.
Si los ensayos que se repiten son independientes y la probabilidad de éxito permanece
constante entre cada uno de ellos, esto da lugar a un proceso denominado proceso de
Bernoulli. Cada ensayo se llama experimento Bernoulli.
11
Función Weibull.
La distribución modela la distribución de fallos (en sistemas) cuando la tasa de fallos es
proporcional a una potencia del tiempo:
Un valor k<1 indica que la tasa de fallos decrece con el tiempo.
Cuando k=1, la tasa de fallos es constante en el tiempo.
Un valor k>1 indica que la tasa de fallos crece con el tiempo.
La distribución de Weibull se utiliza en:
Análisis de la supervivencia
Reliability engineering
En ingeniería, para modelar procesos estocásticos relacionados con el tiempo de
fabricación y distribución de bienes
Teoría de valores extremos
Meteorología
Para modelar la distribución de la velocidad del viento
En telecomunicaciones
En sistemas de radar para simular la dispersión de la señal recibida
En seguros, para modelar el tamaño de las pérdidas
12
2.-Determine la ecuación correspondiente de la media (μ) y la varianza (σ^2) usando el
primer (m1) y el segundo (m2) momento de probabilidad de la PDF tipo Rayleigh.
(Vea Anexo 01)
Solución: su expresión matemática se define como
Dado que el primer momento de la probabilidad es equivalente en la PDF normal, se
deduce que
El segundo momento de probabilidad se define como
Ahora, sustituyendo la (1) en (3) se obtiene
Para resolver la integral, se usa la herramienta conocida como la función gamma, la cual es
definida como
Por lo tonto, al comparar el argumento de la función exponencial (4) con el del (5) se deduce que la
función para el cambio de variable es
Por otra parte, se puede ver que el intervalo de (4) es de [- ,+ ] y como la integral es simétrica,
entonces, se deduce que el intervalo puede ser transformado a dos veces de [0, + ]
13
Diferenciando (6)
Ahora se observa en (6) que cuando, x → + , u→+ . Arreglando la (4) se llega a
Simplificando, eliminando la variable x de la (8), se llega a
Cambiando l forma de (9)
Al comparar la (10) con la (5) se observa que ambas son my similares con la excepción de
la potencia de la variable u, por lo que se deduce que,
Por lo que el valor de z =2, es decir
Para encontrar l valor de es necesario emplear algunas propiedades de la función
gamma las cuales son:
14
Entonces empleando la (15) en la de (12) se llega a
Y usando la (15) se llega a
Introduciendo este resultado en la (12) se obtiene finalmente el resultado del segundo
momento de probabilidad
Para deducir el valor de a varianza se tiene que
Por lo tanto, como , se llega a
Top Related