Eje Temático: Probabilidad y Estadística Conceptos básicos ...

14
Carolina Villagrán Altamirano, Constanza Saez Delpino Educadoras Diferencial PIE. Eje Temático: Probabilidad y Estadística Conceptos básicos. La estadística consiste en un conjunto de técnicas y procedimientos que permiten recoger datos, presentarlo, ordenarlos y analizarlos, de manera que, a partir de ellos, se pueden inferir conclusiones. Población y muestra: La población es un conjunto de objetos o de individuos que se desea estudiar y que, a su vez, presentan una característica que interesa medir. Generalmente el tamaño de la población se denota con la letra N. Se llama muestra a un subconjunto representativo de la población que se desea estudiar. Generalmente, el tamaño de la muestra se denota con la letra n. Variables estadísticas Una variable estadística corresponde a las olas características que se miden en la muestra. Las variables pueden ser cuantitativas o cualitativas. Variables cualitativas: son aquellas que no se pueden medir numéricamente, están relacionadas con características. Los valores que toma este tipo de variables son etiquetas que representan categorías o cualidaes. Una variable cualitativa puede ser nominal u ordinal. Las variables nominales: corresponden a aquellas en las cuales no existe ninguna ordenación; por ejemplo, estado civil, el sexo de un individuo, etc. Las variables ordinales: son aquellas en las cuales existe un orden intuitivo; por ejemplo; nivel educacional (básico, medio, superior), situación económica (baja, media, alta). Etc. Variable cuantitativa: son aquellas que se pueden medir numéricamente, es decir, los valores que toma este tipo de variables son números. Una variable cuantitativa puede ser discreta o continua. Las variables discretas: son aquellas en las cuales los posibles valores surgen frecuentemente de un conteo en cada tramo o intervalo, la variable sólo puede tomar un número determinado de valores (enteros). Ejemplo: Número de hijos Número de página de un libro. Las variables continuas: son aquellas en las cuales los posibles valores surgen frecuentemente de una medición. Estas variables pueden tomar tantos valores (reales) como sea posible en un tramo. Ejemplo: La estatura de una persona La masa de alguien, etc.

Transcript of Eje Temático: Probabilidad y Estadística Conceptos básicos ...

Page 1: Eje Temático: Probabilidad y Estadística Conceptos básicos ...

Carolina Villagrán Altamirano, Constanza Saez Delpino Educadoras Diferencial PIE.

Eje Temático: Probabilidad y Estadística

Conceptos básicos. La estadística consiste en un conjunto de técnicas y procedimientos que permiten recoger datos, presentarlo, ordenarlos y analizarlos, de manera que, a partir de ellos, se pueden inferir conclusiones.

Población y muestra: La población es un conjunto de objetos o de individuos que se desea estudiar y que, a su vez, presentan una característica que interesa medir. Generalmente el tamaño de la población se denota con la letra N. Se llama muestra a un subconjunto representativo de la población que se desea estudiar. Generalmente, el tamaño de la muestra se denota con la letra n.

Variables estadísticas Una variable estadística corresponde a las olas características que se miden en la muestra. Las variables pueden ser cuantitativas o cualitativas.

Variables cualitativas: son aquellas que no se pueden medir numéricamente, están relacionadas con características. Los valores que toma este tipo de variables son etiquetas que representan categorías o cualidaes.

Una variable cualitativa puede ser nominal u ordinal.

Las variables nominales: corresponden a aquellas en las cuales no existe ninguna ordenación; por ejemplo, estado civil, el sexo de un individuo, etc.

Las variables ordinales: son aquellas en las cuales existe un orden intuitivo; por ejemplo; nivel educacional (básico, medio, superior), situación económica (baja, media, alta). Etc.

Variable cuantitativa: son aquellas que se pueden medir numéricamente, es decir, los valores que toma este tipo de variables son números. Una variable cuantitativa puede ser discreta o continua. Las variables discretas: son aquellas en las cuales los posibles valores surgen frecuentemente de un conteo en cada tramo o intervalo, la variable sólo puede tomar un número determinado de valores (enteros). Ejemplo: Número de hijos Número de página de un libro. Las variables continuas: son aquellas en las cuales los posibles valores surgen frecuentemente de una medición. Estas variables pueden tomar tantos valores (reales) como sea posible en un tramo. Ejemplo: La estatura de una persona La masa de alguien, etc.

Page 2: Eje Temático: Probabilidad y Estadística Conceptos básicos ...

Carolina Villagrán Altamirano, Constanza Saez Delpino Educadoras Diferencial PIE.

Tablas de Frecuencia para datos no agrupados Al ordenar los datos correspondientes son ciertos, esos son los grupales en clases o categorías, para lo cual, generalmente como se utilizan tablas de frecuencia.

Frecuencia absoluta: es el número de veces que aparece o se repite un cierto valor en la variable de medición. Frecuencia absoluta acumulada: representa el número de datos cuyo valor es menor o igual al valor considerado. Se obtiene sumando sucesivamente las frecuencias absolutas. Frecuencia relativa: representa la razón de ocurrencia respecto al total. Se calcula como el cociente entre la frecuencia absoluta y el tamaño de la muestra. La suma de todas las frecuencias relativas da como resultado 1. Frecuencia relativa porcentual: a la frecuencia relativa expresada en porcentaje. Se calcula como el producto de la frecuencia relativa por 100. La suma de todas las frecuencias relativas porcentuales da como resultado 100%. Ejemplo de pronto al lanzar un dado 10 veces, se obtienen los siguientes resultados 1,1,3,4,4,4,5,5,6,6. Se puede observar que la variable de estudio es el resultado de lanzamiento del dado luego la tabla frecuencia correspondiente es:

ficos

Recopilar y procesar datos se ha convertido en una necesidad imperiosa en la

actualidad. Conocerlos e interpretarlos le permite al hombre de hoy descubrir, prevenir, informar o predecir el comportamiento de diferentes sucesos o fenómenos propios de la naturaleza, del entorno social o incluso del pensamiento.

ficos que permitan representar datos:

Gráfico de barras.

Gráfico circular o por sectores.

Histograma.

Gráfico de líneas. Gráfico de dispersión.

Gráfico de caja y bigotes. Gráfico de áreas.

Pictograma.

Page 3: Eje Temático: Probabilidad y Estadística Conceptos básicos ...

Carolina Villagrán Altamirano, Constanza Saez Delpino Educadoras Diferencial PIE.

Medidas de tendencia central

Las medidas de tendencia central son parámetros estadísticos que indican valores cuyo objetivo es resumir la información para un conjunto de datos, es decir, son representantes de un conjunto de datos. Las medidas de tendencia central más conocidos son: la media aritmética, la mediana y la moda.

Media aritmetica (promedio): Es aquella medida que se obtiene al dividir la suma de todos los valores de una variable por la frecuencia total . En palabras más simples, corresponde a la suma de un conjunto de datos dividida por el número total de dichos datos.

Moda: Es la medida que indica cual dato tiene la mayor frecuencia en un conjunto de datos; o sea, cual se repite más. Ejemplo: Determinar la moda en el siguiente conjunto de datos que corresponden a las edades de niñas de un Jardín Infantil. 5, 7, 3, 3 , 7, 8, 3 , 5, 9, 5, 3 , 4, 3 La edad que más se repite es 3, por lo tanto, la Moda es 3 (Mo = 3)

Mediana: Para reconocer la mediana, es necesario tener ordenados los valores sea de mayor a menor o lo contrario. Usted divide el total de casos (N) entre dos, y el valor resultante corresponde al número del caso que representa la mediana de la distribución. Es el valor central de un conjunto de valores ordenados en forma creciente o decreciente. Dicho en otras palabras, la Mediana corresponde al valor que deja igual número de valores antes y después de él en un conjunto de datos agrupados. Según el número de valores que se tengan se pueden presentar dos casos: Si el número de valores es impar, la Mediana corresponderá al valor central de dicho conjunto de datos. Si el número de valores es par, la Mediana corresponderá al promedio de los dos valores centrales (los valores centrales se suman y se dividen por 2).

Medidas de tendencia central para datos no agupados Media aritmética: Valor numérico que corresponde el cociente de la suma de todos los datos y el número total de observaciones promedio. Se denota como x es decir, Mediana: se define como el valor central de un conjunto de datos ordenados de manera creciente o decreciente. En el caso que el número de datos se aparte, la

Page 4: Eje Temático: Probabilidad y Estadística Conceptos básicos ...

Carolina Villagrán Altamirano, Constanza Saez Delpino Educadoras Diferencial PIE.

mediana corresponde a la media aritmética de los dos valores centrales. Se nota como Me. Moda: la moda de un conjunto de observaciones corresponde a aquel dato que tiene mayor frecuencia se denota como Mo.

Medidas de tendencia central para datos agrupados Media aritmética: para datos agrupados se calcula multiplicando la marca de clase de cada intervalo (xi) con sus respectivas frecuencias absolutas (fi), se suman los resultados obtenidos y está en total se divide por el número total de datos (n) es decir: Mediana: la próxima de calcular la mediana para datos agrupados es mediante la expresión: Moda: para datos agrupados está dada por la expresión:

Medidas de dispersión De dispersión son parámetros estadísticos que indican cuánto se alejan los datos respecto de la media aritmética. Es decir, indica en la variedad variabilidad de los datos. Las medidas de dispersión más utilizadas son el rango la desviación media y la desviación estándar o típica. Rango: indican la dispersión entre los valores extremos de una variable se calcula como la diferencia entre el mayor y el menor valor de la variable. Se denota como R. Es decir: Desviación media: la desviación media de una observación x (d) con respecto a la media se define como la diferencia entre ellas es decir:

Page 5: Eje Temático: Probabilidad y Estadística Conceptos básicos ...

Carolina Villagrán Altamirano, Constanza Saez Delpino Educadoras Diferencial PIE.

Desviación estándar o típica: mide el grado de dispersión de los datos con respecto a la media. Se denota como o para la población o bien, s para una muestra. Está dada por la expresión: Mientras menor sea la desviación estándar, los datos son más homogéneos, es decir, a menor dispersión mayor homogeneidad, y viceversa. Varianza: es otro parámetro utilizado para medir la dispersión de los valores de una variable respecto a la media. Corresponde a la media aritmética de los cuadrados de las desviaciones respecto de la media. Está dada por la expresión: Dado que la varianza corresponde al cuadrado de la desviación estándar, está expresada en unidades cuadradas. Coeficiente de variación: permite determinar la razón existente entre las desviación estándar (S), y la media. Se denota como CV. El coeficiente de variación se calcula mediante la expresión: CV no tiene unidades de medida, por lo que permite la comparación de variables sin importar sus magnitudes ni lo que representa.

Medidas de Localización

Medida de localización nos indica el lugar donde se ubica un valor de la variable dentro de un conjunto ordenado de valores. Las medidas de localización más utilizadas son cuartiles, deciles y percentiles.

Cuartiles: que dividen el conjunto de observaciones ordenadas en cuatro partes iguales. Por lo tanto, el primer cuartil (Q1) es el valor por debajo del cual, o en el cual como se ubica el 25% de todos los valores, el segundo (Q2) es el valor por debajo del cual se ubica el 50% de todos

Page 6: Eje Temático: Probabilidad y Estadística Conceptos básicos ...

Carolina Villagrán Altamirano, Constanza Saez Delpino Educadoras Diferencial PIE.

los valores y el tercer cuartil es el valor por debajo del cual se ubica el 75% de los valores. Gráficamente:

Para determinar cada cuartil se utilizan las expresiones:

Deciles: los deciles corresponden a nueve valores que dividen al conjunto de observaciones ordenadas en diez partes iguales. Gráficamente:

Para determinar el i-ésimo decil se utiliza la expresión :

Percentiles: corresponde a 99 valores que dividen el conjunto de formaciones, ordenadas en 100 partes iguales. Para determinar el i-ésimo percentil se utiliza la expresión:

Diagrama de caja

Un diagrama de caja es una representación gráfica que se constituye a partir de los cuartiles

de un conjunto de valores de una variable. Además, en este tipo de gráfico se indican otros

elementos de la distribución, tales como: rango, mediana, etc. En general, este gráfico se

utiliza para comparar distribuciones de diferentes grupos, a partir de sus cuartiles.

Page 7: Eje Temático: Probabilidad y Estadística Conceptos básicos ...

Carolina Villagrán Altamirano, Constanza Saez Delpino Educadoras Diferencial PIE.

Probabilidad y Combinatoria

Experimentos Determinísticos: en este tipo de experimento se conoce de antemano el resultado.

Experimentos aleatorios: en este tipo de experimentos repetidos una cierta cantidad de veces, en condiciones similares, pueden presentar resultados diferentes. Que lo que experimento es aleatorio no se conocen los resultados de antemano.

Espacio muestral y eventos: el conjunto formado por todos los posibles resultados

de un experimento se llama espacio muestral () y cada uno de estos resultados es conocido como suceso o evento elemental. Un evento puede ser:

Seguro: está formado por todos los resultados posibles del experimento.

Imposible: nunca ocurre. No se presenta al realizar un experimento aleatorio. Se

denota por el símbolo .

Eventos mutuamente excluyentes: dos eventos que no pueden suceder simultáneamente.

Probabilidad de un suceso: si un experimento se repite NBC Sports mismas condiciones, la probabilidad de qué el evento ocurra se denota por P(A) y corresponde a un valor comprendido entre 0 y 1.

Eventos equiprobables: Si en un experimento todos los sucesos tienen la misma probabilidad de ocurrir, se dice que los sucesos son equiprobables.

Regla de Laplace

Si en un experimento aleatorio los sucesos son equiprobables, entonces, la probabilidad de que el evento A ocurra está dado por la expresión:

( )

Page 8: Eje Temático: Probabilidad y Estadística Conceptos básicos ...

Carolina Villagrán Altamirano, Constanza Saez Delpino Educadoras Diferencial PIE.

Operaciones con sucesos: AB, AB y Ac

Las operaciones de eventos o sucesos suelen representarse a través de diagramas, para esto, se recurre a las operaciones con conjuntos. Las operaciones más usuales de sucesos o eventos son intersección, unión y complemento

Intersección de sucesos La intersección de dos sucesos A y B, corresponde al suceso formado por los elementos comunes de A y B, es decir, el resultado del experimento es a la vez un elemento de A y un

elemento de B, simultáneamente, y se denota AB Además, si A y B son eventos mutuamente excluyentes, su intersección es el evento nulo,

es decir: AB=. Probabilidad de la intersección de sucesos La probabilidad de que ocurra la intersección de dos sucesos independientes entre si la ocurrencia de uno de ellos no depende de la ocurrencia del otro), está dada por la expresión:

P(A y B) = P(A) · P(B) Unión de sucesos La unión de dos eventos A y B incluye todos los resultados posibles de A y de B, es decir, el resultado del experimento es un elemento de A, un elemento de B o de ambos a la vez.

Probabilidad de la unión de dos sucesos La probabilidad de que ocurra la unión de dos sucesos excluyentes entre sí, está dada por la expresión: P(A 0 B) = P(A) + P(B) La probabilidad de que ocurra la unión de dos sucesos no excluyentes, está dada por la expresión: P(A o B) = P(A) + P(B) - P(A y B)

Page 9: Eje Temático: Probabilidad y Estadística Conceptos básicos ...

Carolina Villagrán Altamirano, Constanza Saez Delpino Educadoras Diferencial PIE.

Complemento de un suceso El complemento de un suceso A, denotado por Ac, considera a todos los resultados que no corresponden a A. Por definición, Ay A son mutuamente excluyentes, es decir, su intersección es el evento nulo, ya que no tienen elementos en común. Propiedades del complemento de un suceso Dado un suceso A y su complemento Ac, se tiene:

AAc=

A Ac= P(A) + P(Ac)=1

Leyes de Morgan Dado dos sucesos a A y B y sus complementos Ac y Bc, respectivamente se tiene que:

(AB)c = AcB

c (AB)

c= Ac

Bc

Probabilidad Condicional Definición La probabilidad condicional permite calcular la probabilidad de un evento restringido por la ocurrencia de otro evento, se escribe P(B/A) y se lee "probabilidad de que ocurra un evento B dado que ocurrió un evento A". La probabilidad de que ocurra un evento B, dado que ocurrió un evento A, está dada por

la expresión: (

)

( )

( )

Eventos independientes y dependientes Dos eventos se dicen independientes si la ocurrencia de uno de ellos no afecta de ninguna manera la probabilidad de ocurrencia del otro. De lo contrario, son eventos dependientes. Si los eventos A y B son independientes, entonces:

P(B/A) = P(B) Probabilidad compuesta Probabilidad compuesta Si dos sucesos son dependientes, la probabilidad de que ocurran simultáneamente es igual a la probabilidad de que ocurra uno de ellos, multiplicada por la probabilidad de que ocurra otro, dado que ocurrió el primero. Es decir,

P(A y B) = P(B) · P(A/B)

Page 10: Eje Temático: Probabilidad y Estadística Conceptos básicos ...

Carolina Villagrán Altamirano, Constanza Saez Delpino Educadoras Diferencial PIE.

Diagrama de árbol Un diagrama de árbol corresponde a una representación gráfica de un experimento que tiene varias etapas. Cada una de las etapas tiene un número finito de posibilidades, las cuales son representadas mediante ramas El número total de posibilidades del experimento se obtienen contando las ramas finales del árbol. Ejemplo: Se tiene una urna con 3 fichas rojas y 2 verdes. Para calcular la probabilidad de obtener fichas del mismo color en dos extracciones sucesivas sin remplazo, basta con determinar los casos favorables a este suceso, los cuales se pueden extraer del siguiente diagrama: (luego de cada extracción se indica, entre paréntesis, las fichas de cada color que quedan en la urna). Como se puede observar, la probabilidad de obtener fichas del mismo color es ya queprobabilidad de obtener: 2 fichas rojas probabilidad de obtener fichas verdes

Como se puede observar, la probabilidad de obtener fichas gvmk del color es

, ya que:

Triángulo de Pascal El triángulo de Pascal es un triángulo formado por números enteros positivos. Se puede utilizar para calcular la probabilidad de ocurrencia de un cierto suceso en un experimento dado. Triángulo de Tartaglia. El triángulo de Pascal también es conocido como triángulo de Tartaglia en honor a su creador, el italiano Nicolo Tartaglia. Caracteristicas del triángulo de Pascal Todas las filas del triángulo comienzan y terminan por la unidad, y son simétricas respecto al valor central. Cada número del triángulo corresponde a la suma de los dos números ubicados arriba de el. Estos coeficientes representan la cantidad de casos favorables de un determinado suceso. La suma de todos los elementos de cada fila corresponde al valor 2", siendo n el orden de la fila. Este valor indica la cantidad de casos posibles de un determinado suceso. Se puede seguir su construcción de manera infinita.

Page 11: Eje Temático: Probabilidad y Estadística Conceptos básicos ...

Carolina Villagrán Altamirano, Constanza Saez Delpino Educadoras Diferencial PIE.

Elementos de combinatoria

La teoría de combinatoria intenta resolver problemas donde se debe cuantificar diferentes agrupaciones que se pueden formar a partir de un conjunto de elementos dado. Para ello, existen métodos que permiten mecanizar tales cálculos. Principios fundamentales del conteo Principio aditivo Si A y B son eventos mutuamente excluyentes, donde A puede ocurrir de m maneras distintas, y B puede ocurrir de n maneras distintas, entonces existen m+ n maneras de que ocurra A o B. Principio multiplicativo Si un evento A puede ocurrir de m maneras distintas, y un evento B puede ocurrir de m maneras distintas, entonces existen m'n maneras de que ocurra A y a continuación ocurra B. Ejemplo: Una empresa inmobiliaria fue contratada para construir una casa. Los cimientos de la casa pueden ser de dos maneras: concreto o bloques de cemento, las paredes pueden ser de adobe, cemento o ladrillo y el techo puede ser de madera o lámina galvanizada En este caso, la casa se puede construir de 12 maneras diferentes, pues se tienen: 2 opciones para hacer cimientos, 3 opciones para hacer las paredes 2 opciones para hacer el techo. Luego, debemos aplicar el principio multiplicativo. Se tiene que existen 2·3·2 = 12 maneras diferentes de construir la casa. Factorial de un número Dado un número natural n, se denominará n-factorial, al producto de los primeros n naturales consecutivos. Y se representa por n! Es decir,

n! = 1·2 ·.....· (n-2)·(n-1)·n Permutaciones lineales Se denomina permutación lineal de n elementos (Pn), a cada una de las ordenaciones diferentes que se pueden realizar utilizando todos los elementos El número total de permutaciones que se pueden obtener a partir de n elementos, sin repetición, corresponde a n! Es decir,

Pn = n! Permutaciones con repetición Dado un conjunto de n elementos, el número total de permutaciones con repetición (PR2) que pueden realizarse con ellos de manera que el primer elemento se repita k1 veces, el segundo k2 veces,... y el enésimo k veces, está dado por:

Page 12: Eje Temático: Probabilidad y Estadística Conceptos básicos ...

Carolina Villagrán Altamirano, Constanza Saez Delpino Educadoras Diferencial PIE.

PRn,( k1, k2,…, kn) =

Permutación y combinatoria:

Una permutación de un conjunto de elementos, es una disposición de dichos

elementos teniendo en cuenta el orden. El número de permutaciones de “n” elementos

tomados de “k” en “k” se calcula con la fórmula:

Una combinación de un conjunto de elementos, es una selección de dichos elementos sin tener en cuenta el orden.

El número de combinaciones de “n” elementos tomados de “k” en “k” se calcula con la fórmula:

a) Gráfico de Barras El gráfico de barras, como su nombre lo indica, está constituido por barras rectangulares de igual ancho, conservando la misma distancia de separación entre sí. Se utiliza básicamente para mostrar y comparar frecuencias de variables cuantitativas o comportamientos en el tiempo, cuando el número de ítems es reducido. b) Gráfico Circular En la gráfica circular, los diferentes sectores (triángulos) representan diferentes grupos separados por elementos cualitativos. Esto significa que su separación no se correspondería con valores numéricos, si no con características difícilmente traducibles a números, como distintos colores o sectores de la población.

Page 13: Eje Temático: Probabilidad y Estadística Conceptos básicos ...

Carolina Villagrán Altamirano, Constanza Saez Delpino Educadoras Diferencial PIE.

Además, las gráficas circulares tienen la ventaja de representar la totalidad de la muestra. Al observar la gráfica, sabemos que estamos viendo el 100% de los eventos representados en ella, con las diferentes frecuencias porcentuales perteneciendo a los distintos sectores en los que hemos separado la muestra de

estudio.

c) Gráfica de Líneas Las gráficas de línea nos son especialmente útiles cuando queremos observar la evolución de un evento a lo largo del tiempo. Cada línea se corresponde a un grupo estudiado. Si observamos varias líneas, cada una de estas se corresponde a un grupo de estudio, cuyos valores evolucionan en el tiempo. Esto permite comparar con facilidad los cambios en frecuencias de diferentes grupos, a la vez que observamos cómo estos cambios cambian paulatinamente con el tiempo.

d) Histogramas

Page 14: Eje Temático: Probabilidad y Estadística Conceptos básicos ...

Carolina Villagrán Altamirano, Constanza Saez Delpino Educadoras Diferencial PIE.

La principal diferencia del histograma frente al diagrama de barras es que los histogramas representan diferentes grupos separados por valores cuantitativos. Esto significa que las barras representan intervalos numéricos continuos, separados según decida el analista que está haciendo la representación. Gracias a los histogramas podemos observar fácilmente la frecuencia relativa de los diferentes grupos, pudiendo establecer con facilidad cuáles son los grupos más comunes y cuáles son los menos comunes.