Post on 09-Jul-2015
Tema 1
La estadística: definiciones básicas
Deming: ahora se va a dar inicio al módulo Medición y mejora de los sistemas de gestión de la
calidad en el sector público. Se trabajará principalmente con la estadística, que quizá, para algunos
de ustedes es familiar; Nosotros, haremos que retome los conocimientos de la estadística de
manera amigable y agradable, pues solo así, podrá ver lo útil que resulta manejar sus
herramientas.
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
Chulo: Yo he escuchado que en la actualidad el uso de las herramientas estadísticas se hace cada
día más generalizado, especialmente para apoyar el seguimiento de la implementación del sistema
de gestión de calidad.
Deming: Es correcto, todo el sistema de gestión de calidad debe medirse y controlarse y, no hay
otra manera, que haciendo uso de dichas herramientas.
Chulo: Pero bueno, ¿Qué es la estadística?
Deming: es un instrumento relativamente sencillo para tomar información, visualizarla, interpretarla,
analizarla y tomar decisiones a tiempo. ¿Sencillo, verdad?
Chulo: Y desde hace cuánto se utiliza la estadística
Deming: La estadística fue primeramente un método de descripción de datos en los estados.Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
El Estadístico se encarga del ordenamiento y manejo de datos presentándolos en tablas y gráficos
que facilitan el análisis, para establecer conclusiones y recomendaciones para toma de decisiones
oportunas
Ejemplos de estadística Fisher Ronald Galton Francis (regresión)
Análisis de varianza
QUESTELE,
“frecuencia relativa” y Kart Pearson
Fundo Dpto. de Estadística U. Londres
“probabilidad matemática”
El Estadista es una persona versada en un negocio, conoce la evolución diaria del país en términos
de valores.
DATO CURIOSO: ¿Qué personaje de Colombia en recuerda usted que se haya hecho
notar como estadista?
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
Carlos Lleras Restrepo Albero Lleras Camargo
Deming: El primer paso para poder hacer estadística es la recopilación de información,
que debe ser bien recopilada en datos o variables y, presentadas de manera oportuna y
correctas
Apreciado estudiante, le recomendamos ir al glosario para que pueda entender e
identificar los términos que se usarán de aquí en adelante.
Variable: son los datos en términos numéricos
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
Variable Cuantitativa: Son aquellas que se pueden medir y de las que podemos esperar
un resultado numérico, se pueden clasificar en discreta y continua
Discreta: es aquella que se representa por números enteros sin fracciones, como por
ejemplo número de personas (128 personas), número de pupitres en el salón (35
pupitres), numero de cajas de 12 unidades, numero de hijos que tiene una familia, número
de alumnos que tiene un salón de clase
Continuas: Son aquellas que representan cantidades muy dispersas en valores
fraccionarios como por ejemplo la edad (58, 6 años), el peso (58,7 kilos), estatura (1,68
m).
Variables Cualitativas: son aquellas que expresan distintas cualidades, característica o
modalidad, cada modalidad que se presenta se determina atributo.
Atributos: cuando la verificación de calidad no se puede medir en términos de variables se
usa el concepto de aceptada o rechazada, pasa o no pasa, defectuosa o no defectuosa,
adecuada o inadecuada, el sistema de clasificación es por intermedio de
- sentidos humanos: vista, olfato, tacto, gusto, oído.
- calibradores o galgas: pasa – no pasa
- Conteo: número de piezas malas en un lote.
Proceso: como definió en el módulo uno, es un conjunto de actividades mutuamente
relacionadas que transforman entradas en salidas.
Control: todas aquellas actividades dirigidas a mantener un proceso en estado deseado. Es,
también, la vigilancia periódica y continua sobre el desarrollo de un proceso o la calidad de un
producto para comprobar que cumple con las especificaciones establecidas
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
Apreciado estudiante: le sugerimos que vaya a la semana 3 del módulo uno, allí podrá recordar lo
concerniente a proceso.
Por intermedio del control estadístico de los procesos se puede mantener el proceso dentro de
normas establecidas.
Deming: Hay un término muy importante que se debe tener en cuenta: Población (se representa
con la letra “N); corresponde a la totalidad de los elementos que forman el universo de interés.;
pertenecen a la población todos aquellos elementos que poseen la característica que se desea
estudiar.
Chulo: y, ¿A qué se le llama muestra?
Deming: Cuando se presentan cantidades poblacionales resulta poco práctico y costoso analizar la
totalidad de los elementos o partes que compone una dicha población, es preferible seleccionar
unas cuantas partes para estudiarlas. Estas partes o piezas seleccionadas generalmente de
manera aleatoria se le llaman muestra.
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
Hacer cuadro, fotografía de una población y luego fotografía de una muestra
Deming: La muestra (Se representa con la letra “n”), Está integrada por algunos elementos de la
población, estas muestras para efectos de análisis estadístico debe cumplir con características
como la de ser representativa de la población.
Chulo, eso quiere decir que, los elementos que la integran son escogidos de manera aleatoria o al
azar, lo que significa que todos tienen la misma probabilidad de ser escogidos.
Deming: ¡Exacto! Decimos, entonces, que cuando no es fácil o posible observar a toda la
población, y se necesita tomar información para decidir o tener una evidencia que apoye una
decisión, se debe extraer una o unas pocas muestras representativas de la población.
Chulo: Yo he escuchado hablar de la estadística descriptiva, esto qué es.
Deming: La estadística descriptiva; es una parte de la estadística que se dedica a analizar y
representar los datos. Este análisis es básico, pero fundamental en todo estudio.
Deming: Para hacer un buen estudio con las herramientas que nos brinda la estadística, es
necesario conocer algunos términos.
• Medidas de tendencia central: moda, mediana, media
• Medidas de dispersión o de variación: rango, varianza y desviación estándar
• Organización y procesamiento de datos: serie estadística simple, agrupada en frecuencias
y agrupada en clases
• Presentación gráfica de datos: histograma
Deming: Pasaremos a ver la aplicación de estos términos con un ejemplo.
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
Ejemplo.
Las edades en términos de variables discretas (años completos) de un grupo de funcionarios de
una entidad pública son:
1. Recopilación o tabulación de la información: edades de funcionarios públicos
33, 24, 38, 45, 38, 29, 45, 33, 30, 38, 33, 28, 33, 38, 28, 38, 53, 24, 55, 57, 33
2. Organizar los datos de menor valor a mayor valor de cada variable discreta
24, 24, 28, 28, 29, 30, 33, 33, 33, 33, 33, 38, 38, 38, 38, 38, 45, 53, 55, 57, 57
3. Uso de la estadística
Existen diferentes tipos de medidas de centralización, las más comunes son la media, la Mediana y
la Moda
Deming: Vayamos contestando algunas preguntas y vamos avanzando en recordar estos tipos de
medidas.
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
3.1 ¿Cuántos empleados se incluyeron en el estudio?
33, 24, 38, 45, 38, 29, 45, 33, 30, 38, 33, 28, 33, 38, 28, 38, 53, 24, 55, 57, 33
Respuesta: 21
3.2 La edad más frecuente: 33 años es la moda (valor presentado con mayor frecuencia en una
serie de datos)
33, 24, 38, 45, 38, 29, 45, 33, 30, 38, 33, 28, 33, 38, 28, 38, 53, 24, 55, 57, 33
Moda X
Deming: La moda de una serie de números es aquel valor que más se repite, es decir, es el valor
más común. La moda puede no existir, incluso si existe puede no ser única. La moda se indica con
^X
Ejemplo 1.1
El sistema de números 3, 5, 6, 6, 7, 8, 9, 9, 9, 10, 11
Tiene de moda el 9
El sistema de números 3, 5, 6, 7, 7, 7, 8, 8, 9, 9, 9, 10
Tiene dos modas: 7 y 9
Chulo: Eso quiere decir que, si se obtiene una sola moda es unimodal, si son 2 es bimodal y más
de 2 multimodal.
Deming: Eso es correcto.
3.3 ¿Cuál fue el valor encontrado en la mitad de los datos?
Respuesta: 33, esto es la mediana, que es el valor o variable medio de una secuencia de datos
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
^
Para obtener la mediana, se ordenan los datos de menor a mayor, si el numero de muestras es
par, la posición de la mediana será entre dos variables que corresponde a la posición central, si N
es impar la posición de la mediana es la posición media.
La mediana es el conjunto de datos ordenados en orden de magnitud ya sea ascendente o
descendente, el valor que ocupa la posición central dentro del conjunto de datos (cuando se tiene
un número impar de datos), o el promedio de los dos valores medios (cuando el número de datos
es par)
Ejemplo 1
Los números 3, 4, 4, 5, 6, 7, 8, 8, 9, 10, 11 tiene de mediana el valor o variable 7
Ejemplo 2
Los números 3, 4, 4, 5, 6, 7, 8, 8, 9, 9, 10
Su mediana será ½ (7 + 8) = 7.5
3.4 ¿Cuál es el valor promedio?
Respuesta: edad promedio: 35.57 años
Esto es la media que es la suma de todos los valores de una variable específica (en este caso
edad) dividida por el total de datos
La formula de la media es X
X
De un conjunto de N números X1, X2, X3,……, XN, es el valor promedio de una muestra o
población y es igual a la suma del conjunto de datos dividido entre el número de datos
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
∑ Xi n
X = X1 + X2 + X3+...………+ Xn =
N
Veamos otro ejemplo, la media de los números 8 + 9 + 7 + 12 + 10 + 3 y 11 es
X = 8 + 9 + 7 + 12 + 10 + 3 + 11
n
8.57
Donde ∑ (sigma mayúscula / letra griega) significa sumatoria
Xi: representa observaciones individuales
n : es el número de observaciones
Xi: 33, 24, 38, 45, 38, 29, 45, 33, 30, 38, 33, 28, 33, 38, 28, 38, 53, 24, 55, 57, 33
La media se ilustra con una X y sobre ella una pequeña línea
Xmedia = 773 = 36,8095 años
21
Deming: Bueno ahora como hemos agrupado las diferentes edades que se repiten, esa repetición
es lo que se denomina frecuencia (fr)
Agrupadas las edades multiplicamos cada edad (Xi) por las veces que se presentan (fr.) y tenemos
el valor (fr. * Xi)
33, 24, 38, 45, 38, 29, 45, 33, 30, 38, 33, 28, 33, 38, 28, 38, 53, 24, 55, 57, 33
Tabla agrupada en frecuencias
Xi frecuencia fr. * Xi24 2 48
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
28 2 5629 1 2930 1 3033 5 16538 5 19045 2 9053 1 5355 1 5557 1 57
21 773
Deming: Si sumamos los resultados de fr.*Xi da como resultado el total de edades, como cuando
en un grupo de personas mayores alguien dice:
“Entre nosotros sumamos más de 300 años, así es, aquí entre todos suman 773 años”
Chulo: (Asombrado) ¡Uy! O sea que el promedio de 773 años entre 21 funcionarios es de
36,809 años
Deming: ¡Ojo! a propósito de los promedios, hay que tener cuidado, pues un valor muy alto o unos
valores muy bajos, pueden dar resultados que deben analizarse antes de accionar; existe un
anécdota interesante sobre el concepto de un promedio.
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
Chulo: Pobre joven, no tuvo en cuenta que los valores de las medias de dispersión son mayores
cuando están muy disgregadas y son menores cuando los datos están cercanamente agrupados
3.5 ¿Qué tan separados están los datos?
Respuesta: 33, ya que la edad mayor 57 menos la edad menor 24 = 33. Esto se llama rango o
amplitud.
3.6 ¿Qué tanto están separados los datos del promedio o media?
Esto se obtiene con la desviación estándar (S) que expresa que tanto se dispersan los datos en
relación a la media
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
HISTORIA PARA ANALIZAR: Profundidad promedio de 70 centímetros
“ En una oportunidad un joven de 1,58 m de estatura, estudiante de estadística de una prestigiosa
universidad, en sus vacaciones quiso conocer la belleza del llano, pues escuchaba – el llano es lindo
– se dio al recorrido, pero ya estando en el llano, se encontró con que se terminó la carretera, pues
seguía un río, su situación era muy difícil pues no sabia nadar y tenia que tomar la decisión de seguir
adelante pasando el río; en la orilla se encontraba un anciano se le acerco y le pregunto ¿En
promedio cuánto tiene de profundidad el río?, el señor anciano quien conocía el río en épocas de
verano y que también conocía de estadística le respondió: “ El río en promedio tiene 70 cm. de
profundidad”. El estudiante muy alegre por el dato que el anciano le había dado, pues 70 cm eran
una profundidad pasable, se dio a la tarea de pasar el río, pero cuando iba bien adentro en el
recorrido del río, se encontró con una profundidad de 2,00 m y se ahogó”
Charles Belt Little
La S es la medida de dispersión más adecuada para la estadística descriptiva. Es el valor de la raíz
cuadrada del promedio de los cuadrados de las desviaciones con respecto a la media de cada
valor
Serie agrupada en clases
Cuando la muestra está integrada por un número mayor de datos, estos datos se agrupan en
subconjuntos o subclases.
El número de clases o pisos o niveles (NC) se puede calcular
NC = 1 + 3.3 log n (n es el tamaño de la muestra)
Bueno no nos compliquemos la vida, el número de pisos o clases lo podemos determinar con base
en el siguiente criterio entrenado
Usted puede utilizar la tabla que relaciono a continuación, es una guía que nos muestra para
diferentes cantidades de datos, el número recomendado de clases a utilizar así
Número de datos Número de clases (k)Menos de 50 5 - 750 - 100 6 - 10101 - 250 7 - 12Más de 250 10 - 20
Otra forma muy práctica es tomando la raíz cuadrada del numero de muestras o elementos que
componen la muestra de variables y aproximando el resultado al número entero inmediatamente
superior
Ejemplo n = 90 datos
Raíz cuadrada de 90 = 9, 4868
Número de clases 10
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
2)(1
1xxi
nS −∑
−=
Intervalo de clase “IC” es la diferencia entre el dato mayor (DM) y el dato menor (dm) de la serie
dividida por el número de clase o pisos que se ha determinado con anticipación
Ejemplo: para las muestras de las 21 edades del ejercicio que estamos desarrollando queremos
agruparlos en 8 niveles o números de clase (NC)
El intervalo de clase de cada nivel o piso es IC = DM - dm
8 niveles
IC = 57 – 24
21
IC = 4,125
Clase valor base IC Inter. de clase1 24,000 4,125 28,1252 28,126 4,125 32,2503 32,251 4,125 36,3754 36,376 4,125 40,5005 40,501 4,125 44,6256 44,626 4,125 48,7507 48,751 4,125 52,8758 52,876 4,125 57,000
Observe usted que precisamente la información de las edades de los 21 funcionarios quedó toda
incluida en 8 niveles.
Qué observa usted?
- Que en la primera clase inicia con la menor edad 24 años y se le agrega el “intervalo de
clase” de 4.125 y se logra el primer rango o sea hasta 28,125
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
- Los siguientes niveles se va sumando el “Índice de confianza”, en este caso 4,125 al anterior
mayor valor del rango y se le sigue sumando hasta llegar al valor de la variable máxima, en
este caso 57,00 años.
- Que para el valor de la columna izquierda se establece tomando el intervalo de clase anterior
y sumándole una unidad, o una centésima, o una milésima o valor que haga diferenciar del
anterior rango
Tema 2
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
Evolución histórica de la Estadística en su aplicación de la calidad
Evolución cronológica
De 1920 a 1930 Shewarth precursor que inicia a utilizar métodos estadísticos en Bell Telephone
En 1941 Harol Dodge y Henry Raming propusieron uso de tablas simplificadas de muestreo para inspección de entradas.
En el año 1950 Armand Feigenbaun, desarrolla el Control Total de Calidad (TQC), en el que se involucra a todos los integrantes de una organización
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
En 1950 uno de los alumnos de Juran y de Deming, Genichi Taguchi hace aportes sobre Métodos estadísticos
En el año 1951, La revolución de la calidad en el Japón, se establece el premio Deming de la Calidad, Deming propone Métodos de muestreo y recomienda 14 principios sobre el uso de herramientas estadísticas y la calidad
En 1955, Ishikawa difunde por primera vez en Japón el concepto de Gráfico de Control.
En 1962, Con Ishikawa aparece el Movimiento de los Círculos de Calidad (mejorar la calidad, estandarizar la operación y lograr resultados significativos en la mejora de la calidad, reducción de costos, productividad y seguridad)
En 1968, Shigeo Shingo. El sistema de producción de Toyota y el Justo a tiempo, el Kam-Ban, Poca -Yore, la Cultura de las Cinco S´s
1970, un comité de la Unión Japonesa de Científicos e Ingenieros (JUSE) analizaron un gran conjunto de técnicas herramientas y las denominaron las “Siete Nuevas Herramientas de Gestión y Planificación”
En 1971 Ishikawa expone una herramienta muy útil, el Diagrama Causa-Efecto
En 1979, Philip B. Crosby. “Hacer bien las cosas a la primera vez”, se le responsabiliza al operario acerca de la calidad y el debe llevar e interpretar las medidas y variables usando gráficas de control
En 1980 Creación de grupos de trabajo, formación para la calidad, Normas internacionales ISO 9000
En 1990, Globalización de la Calidad, Normas Automotrices QS 900, normas internacionales ISO 14000 y TQM (Total Quiality Management)
Tema 3
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
Estadística descriptiva Distribución de frecuencias
Chulo: En este tema se trabajarán las frecuencias, absoluta, relativa y sus componentes
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
Deming: lo primero que se debe hacer es determinar la frecuencia de cada clase (fr.), sumando de cada clase uno de los valores de la clase, así se construye una tabla de dos columnas, en la primera se relacionan las clases y en la segunda su frecuencia.
Chulo: Tenga en cuenta apreciado estudiante que existen dos tipos de frecuencias: relativas y acumuladas.
Frecuencias relativas: cuando la frecuencia de cada valor o clase, llamada frecuencia absoluta (fr. abs.), se divide entre el número total de valores (N) se obtiene la frecuencia relativa (Fr. R)
Se calcula con la ecuación fr.R = fr. abs. Para proporciones y se multiplica por 100 para porcentajeN
Frecuencias relativas acumuladas: se obtienen sumando las fr. de cada valor o clase y de las anteriores, las cuales pueden expresarse como proporción (fracción de 1) o porcentajes (%)
Xi frecuenciaabsoluta
frecuenciaacumulada
frecuenciarelativa
frecuencia Relativa
acumulada
porcentaje%
gradosángulo
24 2 2 0,0952381 0,0952381 9,52380952 34,285714328 2 4 0,0952381 0,1904762 9,52380952 34,285714329 1 5 0,04761905 0,2380952 4,76190476 17,142857130 1 6 0,04761905 0,2857142 4,761905 17,14285833 5 11 0,23809524 0,5238094 23,8095238 85,714285738 5 16 0,23809524 0,7619046 23,8095238 85,714285745 2 18 0,0952381 0,8571427 9,52381 34,28571653 1 19 0,04761905 0,9047617 4,761905 17,14285855 1 20 0,04761905 0,9523807 4,761905 17,14285857 1 21 0,04761905 1 4,761905 17,142858
Total 21 1,00000001 100,000001 360,000005
Bueno ya que llegamos a este punto y con base en este ejercicio, aprovechemos para ver las propiedades de las frecuencias, para cada propiedad usted mismo verifique su cumplimiento, si o no cumple.
Propiedad Descripción de la propiedad ¿Cumple?Primera La suma de las frecuencias absolutas ordinarias es igual al tamaño de la muestra Si Segunda La suma de las frecuencias relativas o porcentuales es igual a 1 o sea al 100%
de las observaciones.Si,
Tercera Las frecuencias absolutas son siempre valores enteros. Si Cuarta Las frecuencias relativas son siempre valores fraccionarios Si Quinta El último valor de las frecuencias absolutas acumuladas es igual al total de las
observaciones nSi,
Sexta El último valor de las frecuencias relativas acumuladas debe ser igual a 1 o el 100% de observaciones
Si,
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
Fr.R= fr.abs. x 100N
Agrupada en clases
Cuando la muestra está integrada por un número mayor de datos, estos datos se agrupan en subconjuntos o subclases
El número de clases o pisos o niveles (NC) se puede calcular
NC = 1 + 3.3 log n n es el tamaño de la muestra
Deming: Pero bueno, no nos compliquemos la vida, el número de pisos o clases lo podemos determinar con base en el siguiente criterio entrenado, o en la experiencia.
Usted puede utilizar la siguiente tabla, es una guía que muestra para diferentes cantidades de datos, el número recomendado de clases o pisos a utilizar así.
Número de datos Número de clases (k)Menos de 50 5 - 8
50 - 100 6 - 10101 - 250 7 - 12Más de 250 10 - 20
Otra forma muy práctica es tomando la raíz cuadrada del numero de muestras o elementos que componen la muestra de variables y aproximando el resultado al número entero inmediatamente superior.
Chulo: para la extracción de la raíz cuadrada puede utilizar la calculadora, que puede ser una barata.
Ejemplo: n = 90 datosRaíz cuadrada de 90 = 9, 4868Número de clases 10
Deming: Ahora veremos el Intervalo de clase “IC”, el cual es la diferencia entre el dato mayor (DM) y el dato menor (dm) de la serie dividida por el número de clase o pisos que se ha determinado con anticipación
Deming: para las muestras de las 21 edades del ejercicio que estamos desarrollando queremos agruparlos en 8 niveles o números de clase (NC)
Chulo: El intervalo de clase de cada nivel o piso es IC = DM - dm n
33, 24, 38, 45, 38, 29, 45, 33, 30, 38, 33, 28, 33, 38, 28, 38, 53, 24, 55, 57, 33= 21personas
IC = 57 – 24
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
21
IC = 4,125
Deming: Observe usted que precisamente la información de las edades de los 21 funcionarios quedó toda incluida en 8 niveles.
Deming: ¿Qué observa usted?
Chulo:
- Que en la primera clase inicia con la menor edad 24 años y se le agrega el “intervalo de clase” de 4.125 y se logra el primer rango o sea hasta 28,125
- Los siguientes niveles se va sumando el “Índice de confianza”, en este caso 4,125 al anterior mayor valor del rango y se le sigue sumando hasta llegar al valor de la variable máxima, en este caso 57,00 años.
- Que para el valor de la columna izquierda se establece tomando el intervalo de clase anterior y sumándole una unidad, o una centésima, o una milésima o valor que haga diferenciar del anterior rango
Deming: Muy bien, ahora trabajemos la desviación estándar
Chulo: ¿Qué tanto están separados los datos del promedio o media?
Deming: Esto se puede saber con la desviación estándar (S) que expresa qué tanto se dispersan los datos en relación a la media
La desviación estándar es la medida de dispersión más adecuada para la estadística descriptiva. Es el valor de la raíz cuadrada del promedio de los cuadrados de las desviaciones con respecto a la media de cada valor
Chulo: Bueno nos tratamos de confundir ¿verdad? Será que lo podemos hacer más fácil
Deming: por supuesto, tomemos la fórmula nos sirve y nos servirá muchísimo.
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
Clase valor base IC Inter. de clase1 24,000 4,125 28,1252 28,126 4,125 32,2503 32,251 4,125 36,3754 36,376 4,125 40,5005 40,501 4,125 44,6256 44,626 4,125 48,7507 48,751 4,125 52,8758 52,876 4,125 57,000
2)(1
1xxi
nS −∑
−=
Deming: Con base en esta formula definamos la desviación estándar, usted por su parte trate de definirla, no se la aprenda, analícela y entiéndala
Chulo: Es la raíz cuadrada de la sumatoria de la diferencia de cada valor o variable (xi) con la media o promedio de todas las variables (X con palito), todo dividido por el número de las muestras.
Deming: Cuando la desviación estándar es para población se toma toda la cantidad como valor de n o sea el total de la población
Bueno sigamos con la misma información para calcular la desviación estándar
Xi frec. absol fr. * Xi (Xi-media) (Xi-media)2 fr.(Xi- Xmedia)2
fr.1 2 3 4 5 6
24 2 48 -12,809 164,070481 328,14096228 2 56 -8,809 77,598481 155,19696229 1 29 -7,809 60,980481 60,98048130 1 30 -6,809 46,362481 46,36248133 5 165 -3,809 14,508481 72,54240538 5 190 1,191 1,418481 7,09240545 2 90 8,191 67,092481 134,18496253 1 53 16,191 262,148481 262,14848155 1 55 18,191 330,912481 330,91248157 1 57 20,191 407,676481 407,676481
Sumatorias 21 773 1805,2381
Media = 773/21 = 36,809Media = 36,809(fr.(Xi-media)2)n-1 1805,2381/21-1
1805,2381/2090,2619051
Raíz cuadrada 9,5006Desviación estándar = 9,5 años
Observemos los siguientes aspectos
El valor o resultado de Xi-media (columna 4) en algunos casos puede dar valor negativo, no es para preocuparse cuando lo eleve al cuadrado quedará positivo (ver columna 5) Estudiante, tenga en cuenta que para el ejercicio en particular las edades tomadas no es el de la totalidad de los funcionarios de la entidad sino que corresponde a unas muestras, por lo tanto así la cantidad de 21 es superior a 20, los resultados corresponden a unas muestras, por lo tanto se le descuenta una muestra, por eso el cálculo de la desviación se hizo con n= 20 (21 – 1)
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
Ahora, ya ha llegado a saber calcular la desviación estándar, el resultado es 9,5 años ese valor corresponde al valor de lo que está separado del promedio y corresponde a una sola desviación
Una de las ventajas de la estadística, es que debe ser fácilmente interpretada por las partes interesadas, la representación gráfica debe ayudar a cumplir con dicho objetivo, son varias las gráficas que se recomiendan utilizar.
Representación gráfica 1. Histograma de frecuencias o Diagrama de distribución
Estos diagramas constan de dos líneas:a. una llamada abscisa que normalmente corresponde a las variables de Xi b. otra llamada ordenada normalmente corresponde a las variables de Yi
Volvamos a tomar la distribución de frecuencias de la información de las edades de los funcionarios de una entidad públicaPara las edades de los 21 funcionarios lo tomamos como valores de XiPara mostrar la cantidad de funcionarios de cada edad lo tomamos como valores de Yi
Hacemos entonces la gráfica
Histograma
0
1
2
3
4
5
6
24 28 29 30 33 38 45 53 55 57
e
Frecuencia
Chulo: ¡Qué fácil de entender la información de manera gráfica! ¿Verdad?
Ahora podemos observar con esta gráfica que la mayoría de los funcionarios están en la edad de 33 años y de 38 años, se pueden hacer varios análisis que facilitarán la toma de decisiones
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
EDADES FrecuenciaXi Yi24 228 229 130 133 538 545 253 155 157 1
Porcentaje
19,524
29,524
34,762
44,762
523,810
623,810
79,524
84,762
94,762
104,762
Chulo: sigamos aprovechando esta información para utilizar otra gráfica u otras gráficas:
2. La gráfica de pastel o circular
Como su nombre lo indica, haga de cuenta que el 100% de la información es el total del pastel, cada una de las edades tiene una frecuencia o cantidad de funcionarios que tienen esa edad y corresponde a un porcentaje del total
SERIE EDADES Frecuencia Porcentaje1 24 2 9,5242 28 2 9,5243 29 1 4,7624 30 1 4,7625 33 5 23,8106 38 5 23,8107 45 2 9,5248 53 1 4,7629 55 1 4,762
10 57 1 4,762
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
Deming: ¿Cómo le parece? Verdad qué es una gran ayuda visual, es una herramienta que visualiza toda la información
Usted puede también utilizar otras gráficas como la de una barra horizontal donde muestra del total del 100% los diferentes porcentajes para cada edad
24 28 29 30 33 38 45 53 55 579,52 9,52 4,76 4,76 23,81 23,81 9,52 4,76 4,76 4,76
El anterior diagrama es poco utilizado, pero es muy práctico cuando en un informe ejecutivo a falta de espacio para hacer un histograma o un círculo llamado pastel, puede utilizar este diagrama
Chulo: Es ¡súper fácil!, además, las gráficas nos ayudan a comprender mejor la información.
Tema 4: Herramientas estadísticas para aseguramiento de la calidad
Deming: Estas herramientas, son muy sencillas y muy importantes, pocas de ellas son conocidas en la industria y menos en actividades de servicios, se trata de herramientas estadísticas y análisis de uso general, tales como:
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
a. Diagrama causa-efecto.b. Diagramas de Paretoc. Diagramas de flujo de procesosd. Plantillas para recolección de datos.e. Control estadístico de procesos
a. Diagramas de causa – efecto
Ley de Mecánica Clásica (Isaac Newton) A toda acción corresponde una reacción
Deming: En muchos casos se resuelven los problemas sin conocer las causas de los mismos y mucho menos, se tiene en cuenta a las personas que hacen los procesos, lo cual es una práctica perjudicial.
El buen uso de esta herramienta corresponde a “Administración por causas vs. Administración por efectos”
Para el buen uso de este diagrama se recomienda la práctica del Breakstorming, que corresponde a la participación activa de todo el personal involucrado directa e indirectamente, donde con base en la gráfica, previamente establecida, se va escuchando el comentario que va haciendo el personal, se plantean las causas y se van clasificando de acuerdo al grupo de una causa principal, lo más común es de acuerdo a las llamadas cinco Ms, que como que las reúne o clasifica.
• Las causas que potencialmente van generando un determinado efecto se presentan en
forma jerarquizada.
• Este diagrama por su forma, se denomina, también, diagrama de espina de pescado
Deming: Los pasos para la construcción del diagrama espina de pescado son:
• Determinar claramente el efecto o problema a estudiar.• Reunir a las personas que conocen del problema y realizar una lluvia de ideas.• Seleccionar las causas aportadas por todos los participantes, relacionándolas en las
causas principales, eliminando repeticiones(esto se puede hacer mediante tarjetas)• Dibujar el diagrama resultante
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
b. Diagrama de Pareto
Son representaciones de la densidad y la distribución de variables aleatorias nominales, usualmente causas de falla en sistemas o, defectos en productos o servicios
Las causas se ordenan de modo de distinguir cuales son las más importantes.Deming: Usualmente opera la regla del 80 – 20, el 80% de los problemas se deben al 20% de las causas
Chulo: Que conocimientos de estadística tenemos que tener para diseñar una gráfica de pareto
1. Recopilación de la información sobre las diferentes causas o motivos de un problema, por ejemplo, los tipos de defectos por los cuales un producto es rechazado por mala calidad o en caso práctico, las causas por las cuales los funcionarios de una entidad dejaron de asistir al trabajo en los primeros seis meses del año 2008.
2. Con base en la estadística, relacione la frecuencia o repetición de cada causa en un periodo determinado.
3. Organice las causas por orden de frecuencia o costos, pues también lo puede hacer por los costos que originan esas causas
En desorden
númeroCausa
ausenciacantidad de
casos
1 Se enfermó la suegra 102 Se enfermó un hijo 133 Se enfermó el perro 84 Accidente casero 355 Enfermedad de gripa 756 Citación juzgado 57 Enfermedad migraña 538 Inundación de la casa 79 Guayabo 3
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
10 Robo en la casa 111 Otros 6
Total 216
Chulo: Las causas están en desorden con relación a las frecuencias de ocurrencias
Ahora hay que ordenar las causas de acuerdo al peso o cantidad de frecuencias. El ítem “otros” debe ubicarse en el último renglón, independiente de su magnitud de frecuencias o de costos, cuando se hace con costos.
En orden
Numerocausa
CausaAusencia
cantidad de casos
Totalacumulado
frecuenciarelativa
Composición porcentual
Porcentajeacumulado
5Enfermedad de gripa 75 75 0,3472 34,72 34,72
7Enfermedad migraña 53 128 0,2453 24,53 59,25
4Accidente casero 35 163 0,162 16,2 75,45
2Se enfermó un hijo 13 176 0,0602 6,02 81,47
1Se enfermó la suegra 10 186 0,04629 4,629 86,1
3Se enfermó el perro 8 194 0,037 3,7 89,8
8Inundación de la casa 7 201 0,0324 3,24 93,04
6Citación juzgado 5 206 0,02315 2,315 95,35
9 Guayabo 3 209 0,01389 1,389 96,74
10Robo en la casa 1 210 0,004629 0,4629 97,2
11 Otros 6 216 0,02778 2,778 99,98 216 0,999839 99,9839
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
0
20
40
60
80
100
120
0
10
20
30
40
50
60
70
80
% Acumu…
Tema 5: REGRESIÓN
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
Deming: La magia de la estadística radica en que se puede predecir un tiempo futuro a partir de unas variables conocidas en tiempo presente. Es decir, partiendo de datos conocidos o sea de años ya pasados se puede calcular lo esperado en una fecha futura.
Para empezar, se utilizan dos variables, X e Y como una relación de tipo funcional; si la función que liga X e Y fuese de tipo lineal, responde a la forma general
Y = a X + b
a y b: son constantes que tienen un significado particular para analizar
b: determina el punto donde la línea corta al eje de las Y
a: determina la pendiente de la recta
a = n Σ XY – ( Σ X) ( Σ Y )(n Σ x2) – (Σ X)2
Si el resultado de a es negativo la tendencia es que X aumenta y, Y disminuye, o sea, es inversamente proporcional. Si el resultado de a es positivo la tendencia es que X aumenta y, Y aumenta.
b = Σ Y – a Σ X n
Deming: Observe el siguiente ejemplo para efectuar el cálculo de una regresión.
Supongamos que queremos analizar la variable Nivel de Colesterol con relación a la edad de las personas, ajustándolo a un modelo lineal. Disponemos de 20 pacientes de quienes se ha registrado:
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
• Nivel de colesterol en plasma sanguíneo (mg/100ml)• Edad (años)
paciente Edad Colesteroln Xi Yi Xi * Yi X2
1 80 350 28000 64002 30 190 5700 9003 42 263 11046 17644 50 320 16000 25005 45 280 12600 20256 35 198 6930 12257 18 232 4176 3248 32 320 10240 10249 49 303 14847 2401
10 35 220 7700 122511 50 405 20250 250012 20 190 3800 40013 40 230 9200 160014 30 227 6810 90015 30 440 13200 90016 23 318 7314 52917 35 212 7420 122518 18 340 6120 32419 22 195 4290 48420 41 223 9143 1681∑ 725 5456 204786 30331
n∑X*Y 204786(∑X)(∑Y) 3955600n∑X2 606020(∑X)2 (725)2
a = (n(∑X*Y)-(∑X)(Y))/((n∑X2) - (∑X)2)a = 1,742894
b = ((∑Y) - (a∑X))/n)b= ((5456) - (1,74289446)(725))/20b = 4539.9 / 20b = 226,99
Cuál será el valor de colesterol para una persona de 61 años, o sea el X es 61 años
y = aX + by = aX + b 1,74 X, + b
1,74 * 61 + 226.99y = aX + b 333,13
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
Gráfica
y = 1,73x + 210,09
R2 = 0,1172
150
200
250
300
350
400
450
500
0 20 40 60 80 100
Serie1
Lineal (Serie1)
Recomendación:
Cuando se tiene la información se debe presentar un informe que sirva para tomar decisiones, para lo cual se recomienda analizar los datos e investigar sobre el tema de la información, para nuestro caso:
Colesterol es una grasa orgánica llamada liproteína de alta densidad o LDL, medición que debe hacerse por lo menos una vez cada año
Los valores: • Deseables debe ser < 130 mg/100 ml de sangre• Riesgo potencial: 130 – 160 mg/100ml de sangre• Riesgo alto: > 160 mg/100ml de sangre
HDL; Colesterol bueno, son los encargados de remover y retirar el exceso de colesterol LDL y llevarlo al hígado para su eliminación.
La relación colesterol total dividida por el HDL debe ser inferior a 5 para estar exento de riesgo coronario
Ejemplo: si se tiene un colesterol total de 260mg/100ml de sangre y un HDL de 30mg/100ml de sangre, su relación o índice (en la semana 3 desarrollaremos con mayor detalle el concepto de Índice) es 260/30 = 8,6 uno se encuentra en franco riesgo de sufrir un ataque cardiaco.
Ojo Ataque cardiaco
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
Se debe estar en valor inferior a 3 para estar libre de sufrir infarto
Ejemplo, si se tiene un LDL de 130mg/ml de sangre y HDL de 45mg/100ml de sangre el índice es de 2,88 se encuentra en que no se tiene mayor riesgo de sufrir un ataque cardiaco
Chulo: Nos damos cuenta de la importancia de la estadística y sobretodo de entender los resultados para tomar decisiones y sobre todo acciones a tiempo.
Deming: La importancia de utilizar la regresión es muy grande, con ella puede el estadístico que somos nosotros encontrar valores del futuro o valores que no se tienen con el uso de valores conocidos, ¡eso es buenísimo!
Chulo: Por ejemplo, se puede hacer proyección de producción para un futuro con base en los datos conocidos y establecer presupuestos de recursos sabiendo los elementos que se necesitan para un solo producto, a esto se le llama “explosión de materiales”
4.1 Desviación estándar
Chulo: ¿Recuerda lo que vimos anteriormente sobre el concepto de desviación estándar?, bueno recordémoslo
Deming: La desviación estándar es la medida de dispersión más adecuada para la estadística descriptiva. Es el valor de la raíz cuadrada del promedio de los cuadrados de las desviaciones con respecto a la media de cada valor
Deming: Para que lo entienda mejor, lo haremos más fácil, tomemos la fórmula
Deming: Con base en esta fórmula definamos la desviación estándar, haber usted por su parte trate de definirla, no se la aprenda, analícela, entiéndala
Chulo: Es la raíz cuadrada de la sumatoria de la diferencia de cada valor o variable (xi) con la media o promedio de todas las variables (Xi con palito), todo dividido por el número de las muestras.
Deming: La desviación estándar es una medida del grado de dispersión de los datos del valor promedio. Dicho de otra manera, la desviación estándar es, simplemente, el "promedio" o variación esperada con respecto de la media aritmética.
Una desviación estándar grande indica que los puntos están lejos de la media, y una desviación pequeña indica que los datos están agrupados cerca a la media.
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
€
S= 1n−1
∑(xi−x)2
Por ejemplo, las tres muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada una tiene una media de 7. Sus desviaciones estándar son 7, 5 y 1, respectivamente. La tercera muestra tiene una desviación mucho menor que las otras dos porque sus valores están más cerca de 7.
Chulo: Cuando la desviación estándar es para población se toma toda la cantidad como valor de n
Sigamos con la misma información para calcular la desviación estándar
Xi frec. absol fr. * Xi (Xi-media) (Xi-media)2 fr.(Xi-media)2
fr.1 2 3 4 5 6
24 2 48 -12,809 164,070481 328,14096228 2 56 -8,809 77,598481 155,19696229 1 29 -7,809 60,980481 60,98048130 1 30 -6,809 46,362481 46,36248133 5 165 -3,809 14,508481 72,54240538 5 190 1,191 1,418481 7,09240545 2 90 8,191 67,092481 134,18496253 1 53 16,191 262,148481 262,14848155 1 55 18,191 330,912481 330,91248157 1 57 20,191 407,676481 407,676481
Sumatorias 21 773 1805,2381
Media = 773/21 = 36,809Media = 36,809(fr.(Xi-media)2)n-1 1805,2381/21-1
1805,2381/2090,2619051
Raíz cuadrada 9,5006Desviación estándar = 9,5 años Observemos los siguientes aspectos
El valor o resultado de Xi-media (columna 4) en algunos casos puede dar valor negativo, no es para preocuparse cuando lo eleve al cuadrado quedará positivo (ver columna 5) Chulo: Para el ejercicio en particular las edades tomadas no son de la totalidad de los funcionarios de la entidad, sino que, corresponden a unas muestras, por lo tanto, si la cantidad es 21 se le descuenta una muestra, por eso el cálculo de la desviación se hizo con n= 20 (21 – 1).
Bueno ya hemos llegado a saber calcular la desviación estándar, el resultado es 9,5 años ese valor corresponde al valor de lo que está separado del promedio y corresponde a una sola desviación
Veamos una gráfica de las desviaciones estándar bajo la curva normal
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
La información total de las variables se encuentra dentro de esta curva
Media aritmética, Xmedia + 1 S = 34,135 %; o sea cubre el 34,135% de todas las variables tomadas
Media aritmética, X media - 1S = 34,135 %; o sea cubre también el 34, 135 % de las variable
Esto quiere decir que, si al valor del promedio le agregamos una desviación y también le quitamos una desviación, cubre todo un 68,27% de todas las variables, claro está que, eso sucede cuando la curva es completamente normal, es decir, que la mitad de la curva que tiene la forma de una campana, es exactamente igual a la otra mitad de la campana.
Deming: Ahora cubramos dos desviaciones, vea la gráfica de la distribución que usted tiene atrás
Media aritmética, Xmedia + 2 S = 47,725 %; o sea cubre el 47,725% de todas las variables tomadas
Media aritmética, X media – 2S = 47,725 %; o sea cubre el 47,725 % de las variables tomadas
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
Esto quiere decir que si al valor del promedio le agregamos 2 desviaciones y también le quitamos dos desviaciones, cubre todo un 95,45% de todas las variables, claro está que eso sucede cuando la curva es completamente normal.
Deming: Ahora con tres desviaciones, tanto a la izquierda como a la derecha de la media o sea del centro de la curva normal de forma de campana.
Media aritmética, Xmedia + 3 S = 47,725 %; o sea cubre el 49,865% de todas las variables tomadas
Media aritmética, X media – 3S = 47,725 %; o sea cubre el 49,865 % de las variables tomadas
Esto quiere decir que si al valor del promedio le agregamos 3 desviaciones y también le quitamos tres desviaciones, cubre todo un 99,73% de todas las variables, claro está que eso sucede cuando la curva es completamente normal.
Deming: Como nos damos cuenta, queda un 0,27% por fuera del cubrimiento de control, esto es preocupante, pues cada día el cliente o los clientes tanto internos como externos son y deben ser más exigentes.
Deming: Por ejemplo, tenemos la necesidad de comprarle a la abuela un marcapasos cuyo tiempo esperado de que funcione es de diez años.
Hagamos el cálculo de un error de 0,27% o sea que el marcapasos que le compramos a la abuela sea de los que quedaron por fuera de control o sea que tiene una probabilidad de error del 0,27%
10 años x 365 días x 24 horas x 60 min. = 5´256.000 minutos que se espera funcione correctamente
De los 5´256.000 minutos tenemos la probabilidad del 0,27% de que el marcapasos no funcione y eso corresponde a un tiempo de 236,52 horas o sea 9,85 días, y en esos días sin marcapasos la abuela se murió.
Si usted hace reclamo ante la empresa que le vendió el marcapasos, el fabricante puede contestarle “En la producción de los marcapasos de hizo control de calidad y el rango de desviación cubriendo tres desviaciones a la izquierda del valor nominal (valor exacto esperado) y tres desviaciones a la derecha del valor nominal, el control cubrió el 99,73 de los marcapasos elaborados o sea que estuvimos muy de malas.
Chulo: Verifiquemos a ver si la tendencia esperada se presenta en el ejemplo que estamos desarrollando.
El promedio de las variables del caso que estamos desarrollando es X media = 36,809 y la desviación estándar es igual a 9,5 años
Xmedia + 1S =36,809 + 1(9,5) = 46,309
Xmedia – 1S36,809 - 1(9,5) = 27,308
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
Preguntémonos entonces ¿Cuántos funcionarios están entre la edad de 27,308 y 46,309 años
Xi frec. absoledad fr.
24 228 229 130 133 538 545 253 155 157 1
21
De acuerdo a la información recopilada en el cuadro anterior son 16 los funcionarios del total de 21 o sea 16/21 corresponde a un 76%; la tendencia para una distribución completamente normal seria el 68,27 %, pero la distribución nuestra no es completamente normal así que cumple la tendencia.
¡Bueno!, una nueva pregunta ¿cuántos funcionarios están? , si a la información le agregamos y le quitamos al mismo momento dos desviaciones
Xmedia + 2S =36,809 + 2(9,5) = 55,08 años
Xmedia – 2S36,809 - 2(9,5) = 17,08 años
Los funcionarios que están entre 17,08 y 55,08 años son 20
Xi frec. absolfr.
24 228 229 130 133 538 545 253 155 157 1
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010
Deming: El porcentaje de funcionarios que estén en este rango corresponden a 20 personas y esta cantidad corresponde a 20/21 = 95.2381%; el valor esperado para una distribución completamente normal es de 95,45%, se cumple entonces la tendencia ¿verdad?
¡Bueno!, una tercer pregunta ¿cuántos funcionarios están? , si a la información le agregamos y le quitamos al mismo momento tres desviaciones
Xmedia + 3S =36,809 + 3(9,5) = 36,809 + 28.5 = 65,305 años
Xmedia – 3S36,809 - 3(9,5) = 7,59 años
Los funcionarios que están entre 7,59 años y 65,39 años son todos o sea el 100% del total de funcionarios, el valor esperado era del 99,73%
Chulo: Bueno hemos entendido ¿verdad?
Servicio Nacional de PrendizajeSENA todos los derechos reservados 2010