Tema1 ud1-b
-
Upload
jacinto-gonzalez-pachon -
Category
Documents
-
view
1.490 -
download
0
Transcript of Tema1 ud1-b
Probabilidades y Estadística I
Esquema inicial
1. Introducción. 2. Variables y datos. Tipos de datos. 3. Descripción de datos mediante tablas 4. Descripción de datos mediante gráficos. 5. Introducción al análisis exploratorio de datos.
Probabilidades y Estadística I
Esquema inicial
1. Introducción. 2. Variables y datos. Tipos de datos. 3. Descripción de datos mediante tablas. 4. Descripción de datos mediante gráficos. 5. Introducción al análisis exploratorio de datos.
Probabilidades y Estadística I
1. Introducción
Seis objetivos de la Estadística Descriptiva
A. Recoger y organizar datos (observaciones)
(1/2)
B. Esquematizar el comportamiento de los datos mediante tablas, gráficos o dibujos (patrones)
C. Resumir la información en unos pocos datos representativos (síntesis)
Probabilidades y Estadística I
1. Introducción
Seis objetivos de la Estadística Descriptiva
(2/2)
D. Analizar la relación de dependencia entre las componentes de datos multidimensionales (causalidad)
E. Interpretar la información obtenida (aprendizaje)
F. Técnicas de visualización para datos multivariantes (visualización)
Probabilidades y Estadística I
Esquema inicial
1. Introducción. 2. Variables y datos. Tipos de datos. 3. Descripción de datos mediante tablas. 4. Descripción de datos mediante gráficos. 5. Introducción al análisis exploratorio de datos.
Probabilidades y Estadística I
2. Variables y datos. Tipos de datos
Enunciados genéricos
(1/7)
Sea x1, x2,….., xn un conjunto de n valores numéricos
Sea (x1, y1), (x2, y2),….., (xn, yn)
Sea 1 1 1 2 2 21 2 1 2 1 2( , ,..., ), ( , ,..., ),......, ( , ,..., )n n n
m m mx x x x x x x x x
Probabilidades y Estadística I
2. Variables y datos. Tipos de datos
Glosario de términos
(2/7)
1. Población (universo, colectivo)
2. Muestra
4. Modalidades
5. Variables estadísticas
3. Carácter Cualitativo
Cuantitativo
Discreta
Continua Modalidades = Rango
Probabilidades y Estadística I
2. Variables y datos. Tipos de datos
Glosario de términos
(3/7)
1. Población (universo, colectivo)
2. Muestra
4. Modalidades
5. Variables estadísticas
3. Carácter Cualitativo
Cuantitativo
Discreta
Continua Modalidades = Rango
Cuantificación Medida nominal
Medida ordinal
Probabilidades y Estadística I
2. Variables y datos. Tipos de datos
Glosario de términos
(4/7)
1. Población (universo, colectivo)
2. Muestra
4. Modalidades
5. Variables estadísticas
3. Carácter Cualitativo
Cuantitativo
Discreta
Continua Modalidades = Rango
Medida de intervalo
Medida de razón
Probabilidades y Estadística I
Medida Operaciones posibles
Requisitos Ejemplo.
Nominal Verificar la igualdad de dos modalidades.
Posibilidad de permutar
modalidades
Estado civil, Sexo, nacionalidad.
Ordinal Verificar si una modalidad es mayor
que otra.
Mantenimiento del orden
Gravedad de una lesión.
De intervalo Comparar las diferencias entre dos
modalidades. Unidad constante Temperatura.
De razón Establecer razones entre modalidades Existencia de cero
absoluto Peso, altura...
2. Variables y datos. Tipos de datos (5/7)
Caracteres cualitativos
Caracteres cuantitativos
Probabilidades y Estadística I
2. Variables y datos. Tipos de datos (6/7)
MEDIDA NOMINAL
Relaciones entre medidas
MEDIDA ORDINAL
MEDIDA DE INTERVALO
MEDIDA DE RAZÓN ⊃ ⊃ ⊃
Probabilidades y Estadística I
2. Variables y datos. Tipos de datos
NOTACIÓN
(7/7)
1. Población (universo, colectivo)
2. Muestra
4. Modalidades
5. Variables estadísticas
3. Carácter
P
M ⊆ P
C
C1, C2,…., Ck
X
x’1, x’2,…., x’k k valores diferentes
Probabilidades y Estadística I
Esquema inicial
1. Introducción. 2. Variables y datos. Tipos de datos. 3. Descripción de datos mediante tablas (caso unidimensional) 4. Descripción de datos mediante gráficos. 5. Introducción al análisis exploratorio de datos.
Probabilidades y Estadística I
3. Descripción de datos mediante tablas (1/8)
SERIE 1 3, 3, 3, 3, 3, 3, 3, 3, 3, 3
SERIE 2 2, 4, 6, 8, 10, 12
SERIE 3 1, 2, 2, 3, 3, 3, 4, 4, 4, 4
PATRONES NUMÉRICOS
SERIE 4 1, 2, 1, 1, 2, 3, 2, 1, 1, 1
Cte = 3
Xn = 2n n = 1,2,3....
n veces el número “n”
Probabilidades y Estadística I
3. Descripción de datos mediante tablas (2/8)
PATRONES NUMÉRICOS
SERIE 4 Seis “1” Tres “2” Un “3”
REPETICIONES (Tablas)
REPETICIONES (Gráficos)
Probabilidades y Estadística I
Modalidad Frecuencia absoluta
Frecuencia absoluta acumulada
Frecuencia relativa
Frecuencia relativa acumulada
x’ 1 n 1 N 1 =n 1 f 1 = n 1 / n F 1 = f 1
x’ 2 n 2 N 2 =n 1 + n 2 f 2 = n 2 / n F 2 = f 1 + f 2
... ... ... ... ...
x’ i n i N i = n j j
i
= ∑
1 f 1 = n i / n F i = f j
j
i
= ∑
1
...
...
...
...
...
x’ k n k N k = ∑ =
k
j j n
1 f k = n k / n F k = f j
j
n
= ∑
1 = 1
TOTALES n 1
3. Descripción de datos mediante tablas (3/8)
DATOS UNIDIMENSIONALES
Probabilidades y Estadística I
MUESTRA: 20 Alumnos con la asignatura “Probabilidad y Estadística” aprobada
POBLACIÓN: Alumnos de la Facultad de Informática
VARIABLE ESTADÍSTICA: X ≡ nº de convocatorias
RANGO: Rg X = {1,2,3,......}
SERIE: 5, 3, 1, 2, 1, 3, 1, 3, 5, 1, 2, 1, 1, 1, 2, 4, 5, 1, 2, 1
SERIE ORDENADA: 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 5, 5, 5
3. Descripción de datos mediante tablas (4/8)
EJEMPLO 1
Probabilidades y Estadística I
Nº deconvocatorias
Frecuenciaabsoluta
Frecuencia absolutaacumulada
Frecuenciarelativa
Frecuencia relativaacumulada
1 9 9 9/20 = 0.45 0.45
2 4 13 0.20 0.65
3 3 16 0.15 0.80
4 1 17 0.05 0.85
5 3 20 0.15 1
TOTALES 20 1
3. Descripción de datos mediante tablas (5/8)
EJEMPLO 1
Probabilidades y Estadística I
MUESTRA: 20 Alumnos presentados a una convocatoria de la asignatura “Probabilidades y Estadística”
POBLACIÓN: Alumnos de la Facultad de Informática
VARIABLE ESTADÍSTICA: X ≡ calificación en “P y E”
RANGO: Rg X = [0,10]
SERIE: 5.12, 7, 8.62, 6, 2.88, 7.33, 2.08, 2.75, 5.25, 5, 6.88, 5.83, 5, 3.38, 6.25, 6.12, 6, 4.62, 6.62, 8.5
SERIE ORDENADA: 2.08, 2.75, 2.88, 3.88, 4.62, 5, 5, 5.12, 5.25, 5.83, 6, 6, 6.12, 6.25, 6.62, 6.88, 7, 7.33, 8.5, 8.62
3. Descripción de datos mediante tablas (6/8)
EJEMPLO 2
Probabilidades y Estadística I
Calificaciones(clases)
Marcas declase
Frecuenciaabsoluta
Frecuencia absolutaacumulada
Frecuenciarelativa
Frecuencia relativaacumulada
[ 0, 1 ] 0.5 0 0 0 0
( 1, 2 ] 1.5 0 0 0 0
( 2, 3 ] 2.5 3 3 0.15 0.15
( 3, 4 ] 3.5 1 4 0.05 0.20
( 4, 5 ] 4.5 3 7 0.15 0.35
( 5, 6 ] 5.5 5 12 0.25 0.60
( 6, 7 ] 6.5 5 17 0.25 0.85
( 7, 8 ] 7.5 1 18 0.05 0.90
( 8, 9 ] 8.5 2 20 0.10 1
( 9, 10 ] 9.5 0 20 0 1
TOTALES 20 1
3. Descripción de datos mediante tablas (7/8)
EJEMPLO 2
MODALIDADES x’i
Probabilidades y Estadística I
Esquema inicial
1. Introducción. 2. Variables y datos. Tipos de datos. 3. Descripción de datos mediante tablas. 4. Descripción de datos mediante gráficos (caso unidimensional) 5. Introducción al análisis exploratorio de datos.
Probabilidades y Estadística I
No presentados Aprobados Suspensos
34,09%
48,86%
17,05%
4. Descripción de datos mediante gráficos (1/13)
Medidas nominales. Datos categóricos
1. Diagrama de sectores
VARIABLE ESTADÍSTICA
DISCRETA
Probabilidades y Estadística I
Frec
uenc
ias A
bsol
utas
Continentes
0
10
20
30
40
50
Europa América Asia Africa Oceanía
4. Descripción de datos mediante gráficos (2/13)
Medidas nominales. Datos categóricos
2. Diagrama de rectángulos
VARIABLE ESTADÍSTICA
DISCRETA
Probabilidades y Estadística I 0 10 20 30 40 50
España
Francia
Italia
Bélgica
3. Pictogramas
4. Descripción de datos mediante gráficos (3/13)
Medidas nominales. Datos categóricos
3. Pictogramas
VARIABLE ESTADÍSTICA
DISCRETA
Probabilidades y Estadística I
Medidas ordinales e intervalar/razón
1. Diagrama de barras
4. Descripción de datos mediante gráficos (4/13)
Representación diferencial
VARIABLE ESTADÍSTICA
DISCRETA
Probabilidades y Estadística I
Medidas ordinales e intervalar/razón
2. Función de distribución escalonada
4. Descripción de datos mediante gráficos (5/13)
Representación integral
VARIABLE ESTADÍSTICA
DISCRETA
Probabilidades y Estadística I
4. Descripción de datos mediante gráficos (6/13)
Medidas intervalar/razón
1. Histogramas (polígono de frecuencias)
VARIABLE ESTADÍSTICA
CONTÍNUA
Representación diferencial
Probabilidades y Estadística I
4. Descripción de datos mediante gráficos (7/13)
Medidas intervalar/razón
2. Diagrama tallo-hoja 44, 45, 46, 46, 47, 48, 49, 50, 50, 50, 52, 52, 52, 52, 53, 53, 53, 54, 54, 54, 55, 55, 55, 55, 56, 56, 56, 57, 60, 60, 60, 60 ,60, 61, 61, 62, 62, 63, 64, 64, 64, 65, 65, 65, 66, 67, 68, 68, 68, 70, 70, 70, 70, 71, 72, 72, 74, 75, 80, 93.
Análisis Exploratorio de Datos
Probabilidades y Estadística I
Stem-and-Leaf Display for IPC: unit = 1,0 1|2 represents 12,0
10 0|1222333344 (9) 0|555556779 5 1| 5 1|5
HI|16,3 20,1 32,7 40,5 4 [3’5,4’5)
VALORES ATÍPICOS POR EXCESO
FRECUENCIAS ABSOLUTAS ACUMULADAS
4. Descripción de datos mediante gráficos (8/13)
Probabilidades y Estadística I
IPC
Frec
. Abs
ol
0 4 8 12 16 0
2
4
6
8
10
4. Descripción de datos mediante gráficos (9/13)
Histograma vs. Tallo-hoja
Probabilidades y Estadística I
0 1 2 3 4 0
0,2
0,4
0,6
0,8
1 1,2
4. Descripción de datos mediante gráficos (10/13)
Catálogo de perfiles
Perfil de datos sin tratar
Probabilidades y Estadística I
-5 -3 -1 1 3 50
0,1
0,2
0,3
0,4
Forma de campana
4. Descripción de datos mediante gráficos (11/13)
Catálogo de perfiles
Probabilidades y Estadística I
0 10 20 30 40 50 600
0,02
0,04
0,06
0,08
0,1
Asimétrico desplazado a la dcha
0 1 2 3 40
0,2
0,4
0,6
0,8
1
1,2
4. Descripción de datos mediante gráficos (12/13)
Catálogo de perfiles