Post on 31-Dec-2015
description
19/04/2319/04/23 TPAUTPAU 11
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA
19/04/2319/04/23 TPAUTPAU 22
COMPETENCIAS Y OBJETIVOSCOMPETENCIAS Y OBJETIVOS
• UNIDAD I :ESTADISTICA DESCRIPTIVA• Competencia:• -El estudiante debe utilizar correctamente los procedimientos ,técnicas y métodos
estadísticos,en el tratamiento y procesamiento de datos de todo trabajo de investigación científica
• Objetivos.• -Aplicar adecuadamente las técnicas y procedimientos estadísticos como metodología
de toda investigación principalmente en la Ingeniería.• Descripción general de la unidad:• -Esta unidad comprende el desarrollo de los siguientes aspectos :ciclo metodológico
de la investigación estadística, recopilación. organización ,clasificación y descripción de datos de una muestra aleatoria o población; determinación y utilización de las medidas descriptivas.
• Lectura:Millar/Freund/Jonson “Probabilidad y Estadística para Ingenieros”Edo.de México 1992 Pgs.1 al 40
• Córdova Zamora “Estadística Descriptiva e Inferencial” 2ª ed.Perú 1996 Pags,1 al 69
• Bibliografía Básica: García Oré (1995) “Estadística descriptiva y Probabilidades”(2ª ed) Perú .Pags.2al 83
• Referencia electrónica: http://thales.cica.es/red/Recursos/rd99/ed99-0278-01/inicio.html
EstadísticaEstadística Descriptiva DescriptivaCONTENIDO MÍNIMO
1.-INTRODUCCIÓN A LA ESTADÍSTICA(muestreo)2.-ORGANIZACIÓN Y CLASIFICACIÓN DE DATOS3.-MEDIDAS DE POSICIÓN4.-MEDIDAS DE DISPERSIÓN5.-REGRESIÓN LINEAL SIMPLE
19/04/2319/04/23 TPAUTPAU 44
IntroducciónIntroducción a la a la EstadísticaEstadística
1.-DEFINICIÓN.- Como ciencia proporciona un conjunto de métodos,técnicas y/o procedimientos ,para recopilar,organizar,presentar ,analizar datos,con el fin de realizar generalizaciones válidas,para tomar decisiones coherentes,ante la incertidumbre,acerca de la población o sus parámetros a partir de datos extraídos de una muestra.
• ESTADÍSTICA DESCRIPTIVA.• ESTADÍSTICA INFERENCIAL
19/04/2319/04/23 TPAUTPAU 55
• POBLACIÓN (N).-Conjunto universo,motivo de análisis que tiene por lo menos alguna característica en común,el proceso para obtener toda la información de la población se llama censo
• PARÁMETRO.- Es un nº resumen que sintetiza alguna característica de la población
• MUESTRA (n).- Es un subconjunto propio representativo de la población,el proceso para la obtención de los datos muestrales se llama muestreo
• ESTADÍGRAFO.-Es un nº sintético que resume alguna característica de la muestra
19/04/2319/04/23 TPAUTPAU 66
1.- 1.- INTRODUCCIÓN AL MINTRODUCCIÓN AL MUESTREOUESTREO
PROCESO DEL DESARROLLO CIENTÍFICO
DESARROLLO DEL CONOCIMIENTO
MÉTODO ESTADÍSTICO
OBSERVACIÓN DEL FENÓMENO
FORMULACIÓN DE LA HIPÓTESIS
VERIFICACIÓN DE LA HIPÓTEIS
MÉTODO CIENTÍFICO
19/04/2319/04/23 TPAUTPAU 77
PERFIL DE TESISPERFIL DE TESIS TÍTULO JUSTIFICACIÓN FORMULACIÓN DEL PROBLEMA HIPÓTESIS OBJETIVOS: METODOLOGÍA:
MÉTODOS : inductivo,deductivo,hidtórico,lógico,experimental etc.
.TÉCNICAS: DE RECOLECCIÓN DE datos (muesreo)
DE PROCESAMIENTO DE DATOS(Estadística Inferencial)
INSTRUMENTOS SOFTWARE ESTADÍSTICO) MARCO TEÓRICO Y REFERENCIAL ESQUEMA TENTATIVO DE LA TÉSIS O PROYECTO DE GRADO ANEXOS BIBLIOGRAFÍA
19/04/2319/04/23 TPAUTPAU 88
Metodología de la investigación:
1.-Planteamiento del problema y de la hipótesis:
Se define claramente los objetivos del estudio,se toma una m.a. cuyos datos se utilizan para la inferencia sobre el modelo asignado ó contrastando valores para sus parámetros
2.-Recolección de datos:
a)Datos publicados,b)diseño experimental c)Encuesta
3.-Organización y clasificación de datos:
se debe realizar un análisis de consistencia
4.-Análisis e interpretación de los datos
DESCRIPTIVA
19/04/2319/04/23 TPAUTPAU 99
• METODOLO´GIA DE LA INVESTIGACIÓN• 5.-Realización de Inferencia• PRUEBAS PARAMÉTRICAS .-representar la
incertidumbre asociada a la característica en cuestión ,a un modelo probabilístico cuyos parámetros se desconocen
• Estimación de los estadísiticos :• a) Puntual ,b) Por Intervalos de Confianza• 6.-Realizar el TEST DE HIPóTESIS • Contrastar la validez de algún supuesto• acerca de los valores de los parámetros ó • de la Distribución del modelo ,(por IC ó de
Siginificancia,y el “P” value),ó predecir.•
INFRENCIA
19/04/2319/04/23 TPAUTPAU 1010
1.2.- Tipos de Muestreo1.2.- Tipos de Muestreo
• Muestreo.- herramienta fundamental de la investigación científica,cuya función básica es determinar q´parte representatriva de la población en estudio debe examinarse con el fin de realizar Inferencia sobre dicha Población.
• Razones para tomar muestras:• a) Poblaciones muy grandes ó infinitas ó desconocidas• b)Costos más económicos en muestras que en poblaciones• c) Mayor rapidez en la recolección de una m.a que el de una
población• d) Mayor exactitud.-al reducirse el volumen de trabajo se puede
emplear personal más capacitado y someterlo a un entrenamiento intensivo,supervisión del trabajo de campo y procesamiento de los resultados,resultados más exactos que la enumeración completa
• e)Destrucción de las unidades estudiadas
19/04/2319/04/23 TPAUTPAU 1111
Tipos de muestreoTipos de muestreo
NO PROBABILÍSTICO
INVESTIGADOR
CONOCE LAS CARACTERÍSTICAS DE LA POBLACIÓN →CERTIDUMBRE → → VARIABLE ESTADÍSTICA →ESTADÍSTICA DESCRIPTIVA
PROBABILÍSTICO
INVESTIGADOR NO CONOCE LAS CARACTERÍSTICAS DE LA POBLACIÓN
→INCERTIDUMBRE
→VARIABLE ALEATORIA →ESTADÍSTICA INFERENCIAL
19/04/2319/04/23 TPAUTPAU 1212
TIPOS DE MUESTREO TIPOS DE MUESTREO PROBABILÍSTICOSPROBABILÍSTICOS
• MUESTREO ALEATORIO SIMPLE ( M.A.S.)
• MUESTREO ALEATORIO SISTEMÁTICO(M.A.Sys)
• MUESTREO ALEATORIO ESTRATIFICADO(M.A.E)
• MUESTREO ALEATORIO CONGLOMERADO(M.A.C.)
• MUESTREO POLIETÁPICO(M.U.M)
19/04/2319/04/23 TPAUTPAU 1313
MUESTREO ALEATORIO SIMPLE (MUESTREO ALEATORIO SIMPLE (M.A.SM.A.S) CON ó sin ) CON ó sin REPOSICIÓNREPOSICIÓN
• La población es homogénea y no muy grande, todos los elementos tienen la misma posibilidad de ser tomados en cuenta
• PROCEDIMIENTO.- las extracciones que se realizan manual ó mediante la generación de Nº aleatorios mediante el PC ,con reposición son independientes ,y si es
sin reposición son dependientes Sea una N(1000)
201 100
19/04/2319/04/23 TPAUTPAU 1414
MUESTREO ALEATORIO SISTEMÁTICOMUESTREO ALEATORIO SISTEMÁTICO ( (M.A.Sys)M.A.Sys)
SSea una población grande homogénea N= 1000 ,se ea una población grande homogénea N= 1000 ,se
tomatoma
una m.a. n=50→K=N / n =1000 / 50=20 una m.a. n=50→K=N / n =1000 / 50=201k= 20 2k=40 3k=60 4k=80 5k=100
6k=120 7k 8k 9k 10k
: : : : :
46k 47k 48k=960 49k=980 50k=1000
19/04/2319/04/23 TPAUTPAU 1515
Ventajas y desventajas del M.A.SysVentajas y desventajas del M.A.Sys • Ventajas:• - Mayor representatividad que un m.a.s. porque es
más facíl sacar una m.a y se lo puede hacer en una oficina ahorrando tiempo
• -Es casi tan preciso como el estratificado• Desventajas.• -Sólo se pueden tomar k muestras distintas• -Los elementos de la m.a son dependientes• -No es válido si la característica se presenta
periodicamente y no coincide con la posición K
19/04/2319/04/23 TPAUTPAU 1616
Muestreo aleatorio estratificadoMuestreo aleatorio estratificado ((M.A.EM.A.E))
Se Se aplica en poblaciones heterogéneas desde el punto de vista de la aplica en poblaciones heterogéneas desde el punto de vista de la característica.por lo que se divide en L clases o L estratos homogéneoscaracterística.por lo que se divide en L clases o L estratos homogéneos
• Sea una Población heterogénea dispersa N tal que N1+N2+…+Nl =N
• Ni = subpoblaciones, cuya m.a. n tal que n1+n2+…+nl =n
• =estratos ni= submuestras
•
•
•
•
•
N1n1
N2 n2
N3n3
N4n4
… NLnl
n1 n2 n3
n4 nl
19/04/2319/04/23 TPAUTPAU 1717
Ventajas y desventajas del M.A.E.Ventajas y desventajas del M.A.E.
• Ventajas.-• -permite aplicar técnicas de selección diferentes en
cada estrato• -Permite realizar inferencia en cada uno de los
estratos.• -Mayor precisión en los estimadores• -Permite disminuir el tamaño de la muestra• Desventajas.- si la población está muy dispersa se
requiere mucho dinero en cuanto al aspecto logístico
19/04/2319/04/23 TPAUTPAU 1818
Selección del tamaño de cada submuestra en el Selección del tamaño de cada submuestra en el M.A.EM.A.E
• -Afijación uniforme (ni=nj=nl)
• -Afijación proporcional /estrato (Wh= Nh/N)
• -Afijación de Mínima Varianza
• -Afijación óptima( en función de sus costos)
• (V óptima≤ V proporcional ≤ V ran)
19/04/2319/04/23 TPAUTPAU 1919
Notación y definición en el M.A.ENotación y definición en el M.A.E• .-Una vez estratificado la población y determinados las
submuestras:• -Los símbolos que se refieren al estrato h. son:• h= Identidad del estrato , i = la unidad dentro el estrato• Nh=Nº total de unidades en el h-ésimo estrato• nh=nº de unidades en la h-ésima muestra• yhi = valor obtenido para la i-ésima unidad del h-esimo estrato• Wh = Nh / N = ponderación del estrato h-ésimo• fh = nh / Nh = fracción del muestreo del h-ésimo estrato• Ÿh = yhi / Nh = media verdadera ;ÿ = yhi /nh media
muestral del h-ésimo estrato• S²h = ( yhi –Ÿh ) ² / Nh =varianza verdadera del h-ésimo
estrato
19/04/2319/04/23 TPAUTPAU 2020
Muestreo aleatorio por conglomerados Muestreo aleatorio por conglomerados ((M.A.C)M.A.C)
Se aplica también en poblaciones heterogéneas y Se aplica también en poblaciones heterogéneas y dispersonas desde el punto de vista geográficodispersonas desde el punto de vista geográfico
• Sea una población muy heterogénea y dispersa desde el punto de vista geográfico N se divide en Mu unidades de conglomerados heterogéneos
• M1 M2 M3 ….. Mu
M1 M2 M3 ….
….
Mu
n1 n2 n3 nu
19/04/2319/04/23 TPAUTPAU 2121
Muestreo polietápico(Muestreo polietápico(MUMMUM))• En la práctica casi es común utilizar diferentes
tipos de muestreo ,es decir debe realizar en varias etapas ,así por ejemplo cuando se utiliza el M.A.E ó el M.A.C ,en cada estrato ó en cada conglomerado se debe aplicar el M.A.S.
• Otro caso tenemos en el muestreo de la”Unidad monetaria” gralmente aplicable en Auditoría que consiste en tomar como unidades aquellos expedientes con mayor cantidad monetaria y dentro cada expediente aplicar el M.A.S.
19/04/2319/04/23 TPAUTPAU 2222
• 2.Estadísticos muestrales • DEFINICIÓN Y NOTACIÓN.-.• -CARACTERÍSTICAS O ATRIBUTOS(Y).-
ciertas propiedades q´se quiere medir,analizar,registrar, etc. Para cada unidad de la población si es muestral (y).
• CARACTERÍSTICAS QUE ANALIZA EL MUESTREO.-
• Analiza 4 características de la población: • 1) El total (Y)• 2)la Media E ( Y) 3) La Proporción(P) 4)La Razón( R )
19/04/2319/04/23 TPAUTPAU 2323
NOTACIÓN
Característica Población(N) Muestra(n)
1.-Valores yi = y1,y2,...,yN yi = y1,y2,...,yn
2.-Total Y=yi = y1+y2+,...,+yN ; y = yi = y1 +y2+,...,+ yn
3.-La Media Ÿ = yi / N ; : ÿ = yi / n
4.-La Razón R= Y / X : r = y / x
5.-Proporción P= X/N : p = x/n
19/04/2319/04/23 TPAUTPAU 2424
Estadísticos muestralesEstadísticos muestrales• ESTIMACIONES Ó ESTADÍGRAFOS
• a)Del total(Y) Ŷ = N ÿ = N yi / n,donde N/ n = factor
de expansión
• b) De la media (Ÿ) ÿ = yi / n ,donde n/N =f ,fracción muestral
• c)De la Varianza(σ²) S² = ∑(xi-x)²/ n
• c) De la razón(Ř) r = y / x = yi / xi
19/04/2319/04/23 TPAUTPAU 2525
• ESTADÍSTICOS MUESTRALES• Varianza muestral S² = Σ ( yi –y )²/ n• Varianza de Cochran ó• cuasi varianza S² =Σ ( yi –y )²/ n-1• Media muestral E(y ) = Y =µ• Varianza de la media muestral V(y) = σ²/ n• Media de la Varianza muestral E(S²) = (n-1)σ²/n• MEDIA DE LA CUASI VARIANZA E(S²) = σ²• Caso particular si Y →Bernoulli(p)• Proporción muestral p =y/n ó Σyi/n• Media de la proporción muestral E(p) =P• Varianza de la proporción muestral V(p)= pq/n
19/04/2319/04/23 TPAUTPAU 2626
INTERVALOS DE CONFIANZA.- INTERVALOS DE CONFIANZA.- (n (n 50) 50)
1.-IC PARA LA MEDIA (Ÿ) al 100 r % = [ ÿ ± Zo S 1 –f / n ]
donde Zo P(Z< Zo) = (1+ r) / 2
2.-IC PARA EL TOTAL (Y). Al 100r% = [ Nÿ ± ZoN S 1 –f / n ]
-3.-IC para la Proporción (P) al 100% = [p ± Zo S 1 –f / n ]
Nota cuando la muestra es pequeña ,es decir n < 50 se debe utilizar la distribución “t”, El valor crítico es to
donde to P(T<to) = (1+ r) / 2 ; tiene distribución n-1 g.d l.
NIVELES DE SIGNIFICACIÓN () = 50% 20% 10% 5% 1%
NIVELES DE CONFIANZA ( r ) = 50% 80% 90% 95% 99%
VALORES CRÍTICOS (n≥50) ( Zo) = 0.67 1.28 1.65 1.96 2.58
19/04/2319/04/23 TPAUTPAU 2727
Ej. Se recabó información sobre una cadena de 676 internets.Cada internet tiene 42 CPU’s ,pero en muchos internetsde no todos los PC funcionan normalmente.Se contó el Nº CPU’s por internet que funcionan normalmente. De 50 Internets(aprox. El 7%) cuyos resultados están en la tabla,donde :N=Tamaño de la póblación 676; n=50 yi = nº de PC q´funcionan ; fi =f recuencias./,internet Se pide estimar
a) El Nº total de PC que funcionan normalmente b)La varianza de la muestra c)El IC para el total al 80%
yi : 42 41 36 32 29 27 23 19 16 15 14 11 10 9 7 6 5 4 3 Total
fi : 23 + 4+ 1+ 1+ 1+ 2 + 1+ 1+ 2 + 2+ 1+ 1+ 1+ 1+ 1+ 3+ 2 +1+ 1 50
Yifi : 966+…………………………………………………… +10 + 4+ 3 1 471
yi²fi:40572 + ………………………………………………… +50 +16 + 9 54 497
19/04/2319/04/23 TPAUTPAU 2828
Sol.- Datos . N= 676 ; Unidad muestral = internet n= 50 internet
a)Estimación del Total Y Ŷ = Nÿ = N yi fi / n = 676 (1471)/ 50=19888 fPC q´funcionan normalmente
b) Varianza muestral S² = (1 / n-1) [yi² fi –( yi fi )²/n],reemplazando
S² = (1/ 49) [54497 –(1471)²/ 50] = 229.0 PC²
la desviación típica S = 229 firmas ² = 15.1327 PC
c) El IC para el total(Y) al 80%,:
= [ 19888 ± 1.28(676)(15.13)(0.9623) / 50 ] = [18 107 ; 21 669 ]
Significa que de entre 100 muestras diferentes que se pueden obtener de ésa población se espera que 80 muestras darán la estimación del total entre 18 107 y 21 669 PC que funcionan normalmente
19/04/2319/04/23 TPAUTPAU 2929
4.-TAMAÑO MUESTRAL4.-TAMAÑO MUESTRAL• En forma general depende:• 1)Si la población es finita conocida ó infinita desconocida• 2)Del Error admitido ( acuerdo a la calidad de la v.a.)• 3)Del nivel de significación( α →Mín)• 4)Del tipo de muestreo aplicable(con o sin reposicion)• 5)Del estadístico utilizado en la investigación• La fórmula gral n= no N / [no +(N-1)] • donde : n=tamaño de la muestra• N= tamaño de la población
• no= tamaño de la m.a inicial
•
19/04/2319/04/23 TPAUTPAU 3030
Determinación del tamaño de la muestraDeterminación del tamaño de la muestrainicial noinicial no
• •
a) Para la media
1) no= (Zo σ/ E)²;(n≥50)
2) no= (to S/ E)²;(n<50)
Donde Zo=P(Z<zo)=(1+r)/2
to= P(T<to) =(1+r)/2
to→T con n-1 gdl
b) Para la proporción
Si se supone P conocido:
3) no= Zo²pq/E² ;(n≥50)
Si no se conoce P
4)no=1/4 (Zo/E)²
Donde Zo=P(Z<zo)=(1+r)/2
19/04/2319/04/23 TPAUTPAU 3131
Ejemplos para estimar el tamaño de la Ejemplos para estimar el tamaño de la m.a.m.a.
• Ej. 1)Un investigador quiere determinar el tiempo promedio que un ensamblador tarda en ensamblar las partes de un ordenador,con una confianza del 95% que la media de su m.a. tenga un error a lo máximo de 0.50 minutos.Se presume por experiencia que la σ= 1.6 minutos.Qué tamaño debe ser la muestra?
• Solución : Y:”tiempo de ensamblaje en minutos”
• Datos; E=0.5, σ= 1.6 ; r=95% →Zo=1.96
• Por 1) n= (Zo σ/ E)² → n=(1.96*1.6 /0.5)² =39.3 =40
•
• n= 40
19/04/2319/04/23 TPAUTPAU 3232
• Ej 2)Se desea estimar el Nº promedio de días de uso continuo antes de que cierto tipo de PC requiera su reparación inicial, si se supone que la σ= 6 días de un lote de 100 PC´s .De qué tamaño debe ser la m.a. para asegurar con una confianza del 90% que la media muestral difiera a lo más por 2 días?
• Solución.- Y:”Tiempo de uso del pc en días”• Datos: N= 100; σ= 6 ;r= 0.90 → Zo= 1.645 ,E=2• Por la fórmula general:n= no N/ [no +(N-1)] • no= (1.645*6 /2)²= 24.354225
• n= 24.354225*100 / [24.354225+(100-1)]= 19.74=20
19/04/2319/04/23 TPAUTPAU 3333
• Ej.3)Se desea estimar la Proporción real de CD´s defectuosos en un importación muy grande ,al nivel de un 95% se admite un error a lo sumo de un 4%.de qué tamaño debe ser la m.a. si
• a) No se conoce la proporción real• b)Se sabe q’ la proorción real de defectuosos es 12%• c)Si se conoce el tamaño de la Importación =5000• Solución.-a) r=0.95→Zo=1.96;E=0.04 n=? • Por 4) no= (Zo/2E)²= (1.96 / 2*0.04)²= 600• b) p=0.12 →q=0.88; por 3) no= Zo²pq/E²• n= 1.96²(0.12)(0.88) / (0.04)²= 254• c) N=5000 por :n= no N/ [no +(N-1)]• n=254*5000 /[254 +(5000-1)] =242
19/04/2319/04/23 TPAUTPAU 3434
• Conctrucción de los estratos
Una población de 13 435 datos cuya Distribución de frecuencias .Determinar a) los tamaños de los estratos(Nh) b)elTamaño de la m.a (n) si se quiere minimizar el mismo para una V(ÿst) =0.01 puede obiar la cpf.c) Determine los tamaños de las submuestras
Deterdeterminar √fi→ la F(√ fi). De la siguiente manera.
Ii fi √fi F(√fi) Ii fi √ fi F(√fi )
0 -5 3464 58.9 58.9 50-55 125 11.2 340.3
5-10 2516 50.2 109.1 55-60 107 10.3 350.6
10-15 2157 46.4 155.5 60-65 82 9.1 359.7
15-20 1581 39.8 195.3 65-70 50 7.1 366.8
20-25 1142 33.8 229.1 70-75 39 6.2 373.0
25-30 746 27.3 256.4 75-80 25 5.0 378.0
30-35 512 22.6 279.0 80-85 16 4.0 382.0
35-40 376 19.4 298.4 85-90 19 4.4 386.4
40-45 265 16.3 314.7 90-95 2 1.4 387.8
45-50 207 14.4 329.1 95-100 3 1.7 389.5
19/04/2319/04/23 TPAUTPAU 3535
• Construción de estratos
• Suponiendo se quiere tener 5 estratos
• Supuestamente serían F(√fi )/ L= 389/5= 77.9
• 77.9 -155.8 -233.7- 311.6 pero los nº más cercanos son:
• Estratos
• 1 2 3 4 5
• Ii. 0-5 5-15 15-25 25-45 45-100
• Fi,√fi 58.9 96.6 73.6 85.6 74.8
19/04/2319/04/23 TPAUTPAU 3636
• • N1 = 3464 N2= 4673 N3=2723 N4=1899 N5=676
• W1= N1/N =3464/13435=0.26; W2=4673/13435=0.35 W3= 0.20 W4=0.14 W5=0.05
• n1= ? n2=? n3= ? n4= ? n5= ?• h Wh Sh WhSh nh W1 = N1/N=
3464/13435=0.26• 1 0.26 5 1.30 903• 2 0.35 10 3.50 2432• 3 0.20 7 1.40 973• 4 0.14 5 0.70 486• 5 0.05 1 0.05 36• Total 1 69.5 4830
19/04/2319/04/23 TPAUTPAU 3737
• A) por D)Asignación óptima revisada
Vmin(ÿst)=(ΣWhSh)² / n) – Σ WhSh² / N (cpf)
0.01 =(6.95)²/n → n = 4830
b) Por A)Minimizar V(ÿst) para un n total fijo (NEYMAN)
nh= nWhSh / ΣWhSh =nNhSh / ΣNhSh
n1=4830(1.3)/6.95 =903
n2 = 4830(3.5)/6.95=2432
n3 = 4830(1.4)/6.95= 973
n4 = 4830(0.7)/6.95= 486
n5 = 4830(0.05)/6.95= 36
n=4830
19/04/2319/04/23 TPAUTPAU 3838
• VARIABLES ESTADÍSTICASEs toda característica que se desea estudiar de la población y que toma mínimamente dos valores:
X: x1 ,x2,...,xn
CLASES DE VARIABLES:1.-CUANTITATIVAS.- Son aquellas que se pueden contar o medir,tenemos: a) Discreta y b)continuas
2.-CUALITATIVAS.-Son aquellas que guardan algún atributo o característica,tenemos:a)Nominal y b) ordinal
19/04/2319/04/23 TPAUTPAU 3939
• CICLO METODOLÓGICO
POBLACION (N)
MUESTRA(n)
MUESTRA (n)
muestreo
Toma de decisiones
Estadística inferencial
Estadística descriptiva
19/04/2319/04/23 TPAUTPAU 4040
Metodología de la investigación:
1.-Planteamiento del problema y de la hipótesis:
Se define claramente los objetivos del estudio,relacionando con los valores numéricos de las variables observables(y =efecto ;x =causa)
2.-Recolección de datos:
a)Datos publicados,b)diseño experimental c)Encuesta
3.-Organización y clasificación de datos:
se debe realizar un análisis de consistencia
4.-Análisis e interpretación de los datos
19/04/2319/04/23 TPAUTPAU 4141
• ORGANIZACIÓN DE LOS DATOS:
• Una vez recopilados los datos ,éstos se los deben presentar en:
1.-Cuadros estadísticos.-que deben tener:
a) Título descriptivo y numerado(superior)
b) Fuente de los datos(pie de página)
c) Unidades en que se expresan
• 2 .-Gráficos:
a) De barras (Verticales u horizontales)
b) Circulares
19/04/2319/04/23 TPAUTPAU 4242
• DISTRIBUCIÓN DE FREC. DE V .CUALITATIVAS
Cuadro Nº 1.1. Distrib.de frec. De..........Categorías
X
Frecuencias absolutas simples
fi
Frecuencias relativas hi
Porcentajes pi
C1
C2
.
.
Ck
f1
f2
.
.
fk
h1
h2
.
.
hk
p1
p2
.
.
pk
Totales n 1 100
19/04/2319/04/23 TPAUTPAU 4343
• Ejemplo.-
En una entrevista a 20 alumnos sobre la preferencia por tipos de ordenadores:A,B,C,se obtuvieron los siguientes resultado:
A,B,B,A,C,B,B,A,A,B,A,B,B,C,A,B,A,C,A,B, Cuadro nº 1.2.Distrib.de alumnos por pref.de pc
Tipo de PC
X
fi hi pi %
A 8 0.40 40
B 9 0.45 45
C 3 0.15 15
Totales 20 1.00 100
19/04/2319/04/23 TPAUTPAU 4444
0
1
2
3
4
5
6
7
8
9
Xi
A
B
C
Figura Nº gráfica de barras
19/04/2319/04/23 TPAUTPAU 4545
• Distribución de frec.de v.cuantitativas discretas
Valores
X
fi hi pi %
x1 f1 h1 p1
x2 f2 h2 p2
.
.
.
.
.
.
.
.
xk fk hk pk
Totales n 1.00 100
Valores
X
fi hi pi %
x1 f1 h1 p1
x2 f2 h2 p2
.
.
.
.
.
.
.
.
xk fk hk pk
Totales n 1.00 100
19/04/2319/04/23 TPAUTPAU 4646
Distrib.de frec. por Intervalos o clases (n>30)
Cuadro Nº.. Distrib. de frec. por intérvalos
Intérvalos
Ii
Xi fi hi pi %
I1 X1 f1 h1 p1
I2 X2 f2 h2 p2
.
.
.
.
.
.
.
.
.
.
Ik Xk fk hk pk
Totales n 1.00 100
19/04/2319/04/23 TPAUTPAU 4747
Procedimiento: ordenar los datos y determinar:
1.-El alcance (A) A=[Valor Mínimo,Valor Máximo]
2.-El Rango (R) R=|Valor Máx-valor Mín|
3.-Nº de Intérvalos (k)
a) 5 < k < 20
b) k=1+3.3 log(n)
4.-Ancho de clase (wi) Wi=|L i +1 -Li|
igual ancho W = R/k
5.-Marca de clase Xi = (Li + Li+1)/2
19/04/2319/04/23 TPAUTPAU 4848
• Ejemplo.- se tiene los ingresos quincenales en $us(X) de 45 familias:
63 89 36 49 56 64 59 35 78
43 53 70 57 62 43 68 62 26
64 72 52 51 62 60 71 61 55
59 60 67 57 67 61 67 51 81
53 54 76 44 73 56 62 63 60
Se pide clasificar en 8 clases
19/04/2319/04/23 TPAUTPAU 4949
• Cuadro Nº... Distrib.de frec.de los ingresos de 45 familias en dólares
Ii Xi fi hi pi%[26,34>
[34,42>
[42,50>
[50,58>
[58,66>
[66,74>
[74,82>
[82,90>
30
38
46
54
62
70
78
86
1
2
4
10
16
8
3
1
0.022
0.044
0.089
0.222
0.356
0.178
0.067
0.022
2.2
4.4
8.9
22.2
35.6
17.8
6.7
2.2
totales 45 1.000 100
19/04/2319/04/23 TPAUTPAU 5050
Histograma de los ingresos de 45 familias
0
2
4
6
8
10
12
14
16
30
38
46
54
62
70
78
86
fi
xi
19/04/2319/04/23 TPAUTPAU 5151
Frecuencia absoluta simple fiEs el Nº de datos observados en cada categoría Tal que : Σfi =n Frecuencia relativa simple hiEs la proporción por cada categoría . Tal que: hi = fi/n ; Σhi =1Porcentaje piEs el tanto por ciento de cada categoría Tal que pi = 100%hi ; Σpi = 100% Frecuencia Abs.acumulada FiNº de obs.menores que el límite superior de determinada clase
Tal que :F1=f1 ; Fi= F i-1+fi Frecuencia Relativa acumulada Hi Es la proporción menor al límite superior de determinada clase Tal que :Hi = hi , Hi= Hi-1 +hi ; Hi = Fi/n ; i=1,2,3,....k
19/04/2319/04/23 TPAUTPAU 5252
TEMA Nº 3 MEDIDAS DE POSICIÓN Tenemos:La media , la media geométrica armónica,
cuadrática , la mediana,la moda,los cuantiles:
La media aritmética :
a) Para datos no clasificados
poblacional µ =Σ Xi/N ;muestral X = Σxi/n
b)Para datos clasificados
poblacional µ = Σ (xi fi)/N;muestral X = Σ (xi fi)/n
Del Ej. De los ingresos de 45 familias ,el ingreso medio ó percápita es X = Σ (xi fi)/n = 2702/45
X = 60,04 $us semanal
19/04/2319/04/23 TPAUTPAU 5353
Propiedades de la media aritmética
Sean: a,b,c, constantes ; x,y variables
1.- M( c ) =C
2.- M( x+ c ) = M( x ) + c
3.- M( ax ) = a M( x )
4.- M ( ax+ b) =aM( x ) +b
5.- M [ x – M( x ) ] = 0
19/04/2319/04/23 TPAUTPAU 5454
• La Mediana- Xm ó Md• 1.-Para datos no clasificados,una vez
ordenado,la mediana es:• a) Cuando n es impar es el valor central• b) Cuando n es par es el promedio de los dos
valores centrales• 2.-Para datos clasificados• Xm = Lm + Wm [n/2 –F m-1 ] / fm, donde • la clase mediana se obtiene.• ;Fm n/2 Im = [ Lm ,Lmi +1>
19/04/2319/04/23 TPAUTPAU 5555
LA MODA Xmo Ó Mo.-para datos clasificado
Mo = Li + Wi [ 1 / (1 + 2 ) ] ; 1 =fi –fi-1 ; 2 = fi –fi +1
Ej se tiene la siguiente distribución de frecuencias de alturas (pulg ) de 100 personas
Hallar a) La media,b)La Mediana c) la Moda
Ii Xi fi Fi Xi fi (xi-67.95)²fi
60-63
63-66
66-69
69-72
72-75
61.5
64.5
67.5
70.5
73.5
5
18
42
27
8
5
23
65
92
100
307.5
1161.0
2835.0
1903.5
588.0
208.0125
214.2450
8.5050
175.5675
2.46.4200
total 100 6795.0 852.7500
19/04/2319/04/23 TPAUTPAU 5656
• Solución
a)la media X = 6795 / 100 = 67,95 pulg
b)La mediana Xm = 66+3[50-23] / 42 =67.90 pulg
c)La moda Mo = 66+3[24 / (24+15 ] =67.8 pulg
Media geométrica .-(G)se utiliza cuando el conjunto es una P.G. Porcentajes.índices etc..
Media armónica (H) .- se utiliza cuando el conjunto es un P.A., tasas, muestra pequeña etc.
19/04/2319/04/23 TPAUTPAU 5757
Tema nº 4 MEDIDAS DE DISPERSIÓN
1.-La varianza V(X)
Def gral. V(X) = E[ (x – x )²]
a) Datos no clasificados
S²= Σ (xi – x)² / n-1
b) datos clasificados
S²= Σ (xi – x)² fi / n-1
2.-La desviación típica s
s = V(x)
3.- Coeficiente de variación CV
CV = S / x * 100 %
19/04/2319/04/23 TPAUTPAU 5858
Ej. De la anterior distribución hallar a) la varianza b) la desviación c) el coeficiente de variación.
Solución
a) La varianza:
S² = 852.75 / 100 = 8.5275 pulg ²
b) La desviación típica :
S = 8.5275 pulg² = 2.92 pulg
c) El cv =( 2.92 / 76.95 ) *100% =4.30 %
19/04/2319/04/23 TPAUTPAU 5959
Propiedades de la Varianza
Sean : a,b,c constantes, X;Y variables
1.-V( c ) = 0
2.-V (X+ c) = V(X)
3.-V( aX ) = a² V (X)
4.-V(aX +b)= a² v(X)
5.-V(X)=M(x²) –[ M(x) ]² ;donde
M(x²)= xi² /n, para datos no clasificados;
M(x²)= xi²fi / n,para datos clasificados
19/04/2319/04/23 TPAUTPAU 6060
Momentos.- Definición Gral : E[ (x-a)*]; *= r =1,2,3,..
a) Momentos originales; si a=0
m´r =E [x *] = Σ xi * fi / n
b) Momentos centrales; si a = x
m r = E[ (xi-x)* ] = Σ( xi-x)*fi / n ;*=r = 1,2,3....
Coeficiente de asimetría
Sk = ( x – Mo) / s , si: Sk > 0 sesgado a la derecha
Sk < 0 sesgado a la izquierda
Sk = 0 simétrico
Coeficiente de Kurtosis
Cx = 4 / (²)² si Cx >0 leptocúrtico
si Cx <0 platicúrtico
si Cx =0 mesocúrtico
19/04/2319/04/23 TPAUTPAU 6161
Tema nº 5 REGRESIÓN LINEAL SIMPLE
V.E.Bidimensional (X,Y)
-La regresión surge en el análisis de la forma funcional entre X (causa) ,Y(efecto)
-La correlación surge en el análisis de asociación entre X ,Y
- Diagrama de dispersión .- es el gráfico de los pares (xy) ,que da la pauta de la forma funcional entre X e Y
- La covarianza mide el grado de dispersión conjunta entre X ,Y
- Coeficiente de correlación r.-mide el grado de asociación lineal entre X e Y
- -1< r < 1
19/04/2319/04/23 TPAUTPAU 6262
Regresión lineal simple .- Y= a + bX ,consiste en estimar la ec.de la recta con el fin de predecir o estimar Y (dependiente) a partir de x( independiente)
Donde a= intercepto; b= pendiente o coeficiente de regresión
Estimación mediante los MCO
Ŷ = â + b X donde b= n [Σxiyi –ΣxiΣyi] / n[Σx²-(Σx)²]
â = y –b x
si b>0 la tendencia lineal es creciente
si b<0 la tendencia lineal es decreciente
si b=0 no hay regresión por que Y= a
19/04/2319/04/23 TPAUTPAU 6363
• Ejemplo.-
En un estudio de la relación entre la publicidad por tv y las ventas de ordenadores durante 10 semanas se han recopilado los tiempos de duración en minutos de publicidad por semana (X) y el nº de ordenadores vendidos(y) siendo:
Semana 1 2 3 4 5 6 7 8 9 10
Publicidad(X) 20 30 30 40 50 60 60 60 70 80
Ventas(Y) 50 73 69 87 108 128 135 132 148 170
a)Estimar la recta de regresión ,b) el r c) Estime las ventas si la publicidad es de 90 minutos
19/04/2319/04/23 TPAUTPAU 6464
• Solución
Cuadro Nº ...
x y xy X² Y²20
30
30
40
50
60
60
60
70
80
50
73
69
87
108
128
135
132
148
170
1000
2190
2070
3480
5400
7680
8100
7920
10360
13600
400
900
900
1600
2500
3600
3600
3600
4900
6400
2500
5329
4761
7569
11664
16384
18225
17424
21904
28900
500 1100 61800 28400 134660
19/04/2319/04/23 TPAUTPAU 6565
SOLUCIÓN
a) b=[10(61800)-500(11009] / [10(28400)-500²] =
b = 68000 / 3400=2 ; b=2
a = 110- 2(50) = 10 ; a=10
Por lo tanto ŷ = 10 + 2 X
b) El r= n [Σxiyi –ΣxiΣyi] / n[Σx²-(Σx)²] * n[Σy²-(Σy)²] =
=680 /681.5424 = 0.998 , r=0.998 altamente positivo
c) Estimación para x=70 ;ŷ = 10 + 2 (90) = 190 ordenadores