Introducción a la estadística · PDF fileDorado 175 Cantidad de casos 20.47 ......
-
Upload
truongthien -
Category
Documents
-
view
224 -
download
2
Transcript of Introducción a la estadística · PDF fileDorado 175 Cantidad de casos 20.47 ......
Introducción a la estadística
Profa. Bárbara González
COMU
Puerto Rico Puerto Rico Características Sociales Seleccionadas en Puerto Rico: 2005-2009 Conjunto de Datos: Encuesta sobre la Comunidad de Puerto Rico del 2005-2009 --Estimados de 5 Años Encuesta: Encuesta sobre la Comunidad de Puerto Rico Social - Educación, Estado Civil, Parentesco, Fecundidad, Abuelos...Económico - Ingreso, Empleo, Ocupación, Viaje al trabajo...Vivienda - Ocupación y Estructura, Valor de la Vivienda y Costos, Servicios Públicos...Demográfico - Sexo y Edad, Raza, Origen Hispano, Unidades de Vivienda...Narrativo - Perfil con texto y gráficas para análisis fácil
http://factfinder.census.gov/
http://www.censo.gobierno.pr/
Definición de estadística
• La estadística es considerada como un método
para tratar datos numéricos. Es un
instrumento que se orienta a la recolección,
organización, y análisis de datos numéricos oorganización, y análisis de datos numéricos o
de observaciones. (Haber y Runyon, 1973)Infiere: partiendo de casos particulares, se producen conocimientos generales.
estadística
• La estadística intenta explicar la variación.
• Infiere propiedades de la variación a partir de
la muestra.
Tipos de estadística
La estadística se subdivide en:
• Estadística Descriptiva: describe y resume un cuerpo deinformación. Los datos pueden resumirse estadísticamente
(moda, media, desviación estándar) o pueden representarse
gráficamente (histograma, gráfica de barras, pie chart)gráficamente (histograma, gráfica de barras, pie chart)
• Estadística Inferencial: proceso de llegar a generalizaciones
acerca del todo (llamado población) examinando una porción
(llamada muestra). Le interesa conocer cuán confiable es la
magnitud de las diferencias en la variabilidad.
Ejemplos de Tipos de Estadística
• Descriptiva: la información que se obtiene de una encuesta.
(Ej. Un 25% de las personas encuestadas contestó que estaba
a favor del cierre de los negocios de bebidas alcohólicas en la
madrugada.)
• Inferencial: Si de esa información se extrapola resultados para• Inferencial: Si de esa información se extrapola resultados para
todos los ciudadanos (por ejemplo, decir que dada la muestra,
un 30% de la población de Puerto Rico apoya el cierre …. con
un margen de error de .05% y un 95% de confiabilidad).
¿Quiénes usan la estadística?
• Organismos gubernamentales.
• Diarios y revistas.
• Políticos.
• Deportes.
• Marketing.• Marketing.
• Control de calidad.
• Administradores.
• Investigadores científicos.
• Médicos
• etc.
Abusos que se pueden cometer con la Abusos que se pueden cometer con la
EstadísticaEstadística
� Conclusiones erróneas debido a que los datos
son numéricamente insuficientes.
� Representaciones gráficas engañosas (escalas).
� Datos muestrales no representativos:Datos muestrales no representativos:
–– Muestra que no incluye a elementos de toda la Muestra que no incluye a elementos de toda la
población.población.
–– Ciertas categorías de personas no responden Ciertas categorías de personas no responden
correctamente.correctamente.
–– Respuestas voluntarias (sesgadas).Respuestas voluntarias (sesgadas).
Caso
• Un investigador concluye que las mujeres en
el primer año de universidad tienen un mayor
coeficiente intelectual que los hombres. Para
esto somete a 5 mujeres y 5 hombres de esto somete a 5 mujeres y 5 hombres de
primer año de universidad a una prueba de IQ
y encuentra que la media de las mujeres es de
110 y la de los hombres es de 102. ¿La
conclusión del investigador es correcta?, ¿La
variabilidad de estos datos es significativa o
no?, ¿Se pueden hacer inferencias de
muestras no probabilísticas?
Estadísticas Descriptivas
• Distribuciones: Ordenación de los datos para
observar como se distribuyen.
– Distribución de Frecuencias
• Número de veces que aparece un valor observado• Número de veces que aparece un valor observado
Tabla 1 Frecuencia de personas que usan el tren urbano
provenientes de los pueblos cercanos.
Pueblo Frecuencias Por ciento %
Bayamón 250 29.24
San Juan 230 26.90
Toa Baja 200 23.39
Dorado 175
Cantidad
de casos
Dorado 175 20.47
Total 855
% = Frecuencia / total * 100
250/855*100=29.24%
Ejercicio: Busque la frecuencia para cada alimento y
Obtenga el %
Arroz Pollo Cerdo Cerdo
Ensalada Pasta Arroz Pasta
Pollo Cerdo Pollo Cerdo
Pasta Pavo Cerdo Pasta
Arroz Pollo Arroz Arroz
Cerdo Cerdo Pasta Pasta
Pollo Arroz Cerdo Pollo
Tabla de frecuencias
Concepto Frecuencias Por ciento %
Estadísticas Descriptivas: Medidas de
Tendencia Central
• Busca los valores que se ubican en el centro de distribución
permitiendo hacer comparaciones.
• Muestra en qué lugar se ubica la persona promedio o típica
del grupo.
• Sirve como un método para comparar o interpretar una • Sirve como un método para comparar o interpretar una
puntuación particular en relación con la puntuación total.
• Compara el puntaje obtenido por una misma persona en dos
diferentes ocasiones.
• Compara los resultados medios obtenidos por dos o más
grupos.
Estadísticas descriptivas
•• Las medidas de tendencia central más Las medidas de tendencia central más
importantes son:importantes son:
–– Media.Media.
–– Mediana.Mediana.–– Mediana.Mediana.
–– Moda.Moda.
Media aritmética
• Es la suma de todas las observaciones dividida entre el número total de observaciones.
• Por ejemplo, si en una habitación hay tres personas, la media de dinero que tienen en sus bolsillos sería el resultado de tomar todo el dinero de los tres y dividirlo a partes iguales entre cada uno de ellos. Es decir, la media es una forma de entre cada uno de ellos. Es decir, la media es una forma de resumir la información de una distribución (dinero en el bolsillo) suponiendo que cada observación (persona) tendría la misma cantidad de la variable. (wikipedia)
• Toma en consideración todos los valores de la distribución bajo estudio, se afecta por valores extremos.
Cálculo de la media aritmética
Con distribuciones de frecuencia
agrupadas
Ejemplo calificaciones:
Puntos del examen 1 = 25/50 = 50%Puntos del examen 2 = 45/50 = 90%Puntos del examen 2 = 45/50 = 90%Puntos del examen 3 = 35/40 = 88%
Total de % 228 dividido por 3 = 76%
Otro ejemplo de la media
La media X barra
Suma de todas
Valores dela variable
Frecuencia de los valores de la variable
Num. calificaciones
Suma de todas las observaciones
Ref. Haber/Runyon : Estadística General
Ejercicio: Busca la media de los
siguientes números
Horas a la semana dedicadas al uso de la
computadora:
25 15 28 29 25 26 21 26
Mediana
• Es el valor que ocupa la posición central de un
conjunto de observaciones, una vez que han
sido ordenados en forma ascendente o
descendente.descendente.
• Divide al conjunto de datos en dos partes
iguales.
• No se afecta por valores extremos, por lo que
representa de forma más fiel las
características del objeto de estudio en cuanto
a la tendencia central.
• Para calcular la mediana se ordenan los
números de menor a mayor y luego se busca
el punto medio. Le mediana sería el valor que
ocupa la posición n + 1 / 2ocupa la posición n + 1 / 2
Ejercicio:Calcula la mediana de los
siguientes números
3, 13, 7, 5, 21, 23, 39, 23, 40, 23,
14, 12, 56, 23, 2914, 12, 56, 23, 29
Ejercicio:Calcula la mediana de los
siguientes números
3, 13, 7, 5, 21, 23, 23, 40, 23, 14,
12, 56, 23, 12, 56, 23,
Moda
• Observación o clase que tiene la mayor frecuencia (el
mayor número de casos) en un conjunto de
observaciones.
• Es el valor que más se repite.
Pueblo Frecuencias Por ciento %Pueblo Frecuencias Por ciento %
Bayamón 250 29.24
Carolina 230 26.90
San Juan 200 23.39
Caguas 175 20.47
Total 855
No se afecta por valores extremos
Ejercicio: Busca la Moda
Pepsi Coca Cola Coca Cola
Pepsi Sprite Coca Cola
Coca Cola Coca Cola Sprite
Pepsi Coca Cola SpritePepsi Coca Cola Sprite
Sprite Pepsi Pepsi
INTERPRETACIÓN DE LOS DATOS
Obama
P.430
Ver video: Asignación
• Medidas de Tendencia Central y Dispersión Excel
• http://www.youtube.com/watch?v=jstpOsLt_Y• http://www.youtube.com/watch?v=jstpOsLt_Y
I&feature=related
Presentación de los datos
Género Frec.
Hombre 4
Mujer 6
0
1
2
3
4
5
6
7
0
Hombre Mujer
�� Las tablas de frecuencias y las representaciones gráficas Las tablas de frecuencias y las representaciones gráficas son dos maneras son dos maneras equivalentesequivalentes de presentar la de presentar la información. Las dos exponen ordenadamente la información. Las dos exponen ordenadamente la información recogida en una muestra.información recogida en una muestra.
Tablas de frecuencia�� Exponen la información recogida en la muestra, de forma que no se pierda nada de Exponen la información recogida en la muestra, de forma que no se pierda nada de
información (o poca).información (o poca).
–– Frecuencias absolutasFrecuencias absolutas: Contabilizan el número de individuos de cada modalidad: Contabilizan el número de individuos de cada modalidad
–– Frecuencias relativas (porcentajes)Frecuencias relativas (porcentajes): : IdemIdem, pero dividido por el total, pero dividido por el total
–– Frecuencias acumuladasFrecuencias acumuladas: Sólo tienen sentido para variables ordinales y numéricas: Sólo tienen sentido para variables ordinales y numéricas
Nivel de felicidad
467 30,8 31,1 31,1
872 57,5 58,0 89,0
165 10,9 11,0 100,0
1504 99,1 100,0
13 ,9
1517 100,0
Muy feliz
Bastante feliz
No demasiado feliz
Total
Válidos
No contestaPerdidos
Total
Frecuencia Porcentaje
Porcentaje
válido
Porcentaje
acumulado
Sexo del encuestado
636 41,9 41,9
881 58,1 58,1
1517 100,0 100,0
Hombre
Mujer
Total
VálidosFrecuencia Porcentaje
Porcentaje
válido
Tipos de variables
� Cuantitativas o NuméricasSi sus valores son numéricos (representan las diferencias de los participantes bajo estudio)
� Discretas: Si toma valores enteros. No tienen punto decimal.� Número de hijos, Número de cigarrillos, Num. de “cumpleaños”
� Continuas: Si entre dos valores, son posibles infinitos valores intermedios. Por lo regular tienen punto decimal.� Altura, Presión intraocular, Dosis de medicamento administrado, edad
Tipos de Escala
� Nominales: Sus valores no se pueden ordenar porque identifican particularidades y no cantidades. (Cualitativas)� Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No), Actitud a favor o en
contra
� Ordinales: Sus valores se pueden ordenar porque refleja el orden de los sujetos bajo estudio, pero no mide la magnitud de las diferencias)� Mejoría a un tratamiento, Grado de satisfacción, Intensidad del dolor, actitud
(fuertemente a favor, moderadamente a favor, moderadamente en contra, fuertemente en contra) – Deben presentarse de forma ordenada.en contra) – Deben presentarse de forma ordenada.
38
Tipos de Escalas
• Intervalos: Sus números reflejan tanto el orden como la
magnitud de las diferencias entre los sujetos. Pero carecen de
0 absoluto, lo que impide comparaciones entre sujetos.
Ejemplo: IQ, temperatura. Juan tiene un IQ de 50 y Pedro de
100 (Se puede decir que Pedro es más inteligente que Juan, 100 (Se puede decir que Pedro es más inteligente que Juan,
pero no que Pedro es el doble de inteligente que Juan.
• Razones: Igual a la de intervalo pero estas si tienen 0
absoluto. Ejemplo: peso, tiempo, sonoridad, longitud. Se
pueden hacer comparaciones. Juan pesa 100 y Pedro 200,
Pedro es el doble de pesado que Juan.
Representación gráfica de los datos:
diagramas de barras
Diagramas barras para v. nominales u ordinales (discretas)Se deja un hueco entre barras.
Representación gráfica de los datos:
Histograma
Histogramas para v. continuas (intérvalo)
El área que hay bajo el histograma entre dos puntos cualesquiera indica la cantidad (porcentaje o frecuencia) de individuos en el intervalo.
Representación gráfica de los datos: Polígono de
frecuencias
Representación gráfica de los datos:
ojiva
Representación gráfica de los datos:
Diagrama circular (Pie Chart)
No se usa con variables ordinales
Representación gráfica de los datos:
Pictogramas
http://www.spssfree.com/spss/analisis4.html
Aprendiendo con YouTube
• Estadística Inferencial
• http://www.youtube.com/watch?v=I0FqjIzDuo4
• Estadística descriptiva
• http://www.youtube.com/watch?v=lexatrv3TcE&feature=cha
nnelnnel
Programas para calculos estadisticos
• http://www.softonic.com/s/calculos-estadistica
• http://www.openepi.com/Menu/OpenEpiMenu.htm
• Estadisticas básicas con Excel
• http://www.youtube.com/watch?v=q3LR_CfGvS4• http://www.youtube.com/watch?v=q3LR_CfGvS4
• Guía de SPSS 15
– http://www.um.es/ae/soloumu/pdfs/pdfs_manuales_spss/SPS
S%20Brief%20Guide%2015.0.pdf
Datos cualitativos
Ver:http://www.youtube.com/watch?v=_7tXEXwPGJ
Y
Enfoque Cualitativo
• Busca obtener datos de personas, comunidades, contextos,
situaciones…
• Los datos son conceptos, percepciones, imágenes mentales,
creencias, emociones, interacciones, pensamientos
experiencias.experiencias.
• La finalidad de los datos es analizarlos y comprenderlos para
responder a la pregunta de investigación.
• Busca entender significados, razones del comportamiento.
• No se reducen a números para ser analizados
estadísticamente.
¿Cuál es el instrumento de recolección de datos
cualitativos?
• El propio investigador: recoge los datos, los
analiza, genera las respuestas para entender el
fenómeno estudiado.
• No se utilizan pruebas estandarizadas, ni • No se utilizan pruebas estandarizadas, ni
cuestionarios, ni un sistema de medición.
Tipos de unidades de análisis (Lofland
y Lofland, 1995)
Significados: definiciones, estereotipos, ideologías, reglas, normas.
Prácticas: rituales, hábitos
Episodios: eventos críticos como el divorcio, el 11 de Episodios: eventos críticos como el divorcio, el 11 de sept.
Encuentros: una reunión, una consulta médica
Papeles: roles de cada cual
Relaciones: - vínculos- íntimas, paternales, filiales
Tipos de unidades de análisis
Grupos: conjunto de personas con metas y que se consideran así mismos una entidad: familia, redes, equipos de trabajo
Organizaciones: Unidades formadas con un fin colectivo, se analiza su origen, cultura, rol, control, jerarquías
Comunidades: Asentamientos en territorios reales o virtuales – pueblo o ciudad
Subculturas: porciones de la comunidad que se organizan bajo una idea particular – roqueros, cocolos, cibercultura
Estilos de vida: estilos adoptados por la clase social
Rol del investigador
• Supervisor
• Lider
• Amigo
• Debe minimizar su influencia sobre los
participantes.
• Debe obtener información tal cual los
participantes la revelan.
Analisis de datos cualitativos
• Los datos recolectados hay que interpretarlos
• Cada estudio requiere de un esquema propio a diferencia de los datos
cuantitativos.
• Hay un plan básico pero en el camino va sufriendo modificaciones de
acuerdo a los resultados y la necesidad.
• Se usan categorías• Se usan categorías
• Se buscan semejanzas y diferencias
• Las observaciones del investigador son tomadas en cuenta.
• La reflexión continua se hace necesaria.
• Las observaciones se enfocan en la solución del problema.
Ejercicio: ¿Qué datos puedes obtener
del texto?
“A las 8:30 pm se encontraba a muchos kilómetros del lugar del
crimen. Su novia puede manifestarlo, ya que estuvo al cine
con ella, aunque no recuerda exactamente el nombre de la
sala ni el de la película , pero sí recuerda que era una
película de misterio, ya que son sus preferidas. Sobre la película de misterio, ya que son sus preferidas. Sobre la
ocupación del arma blanca que llevaba en el momento de la
detención, mantiene que la compró la semana pasada en el
pulguero de los sábados de la localidad de Carolina, ya que
le gusta llevar navaja por temor a ser asaltado por
atracadores, pues en una ocasión le robó un negro … “.
Ejemplos
• http://es.scribd.com/doc/53505901/Ejemplo-
Analisis-de-Contenido
• http://www.ejemplode.com/11-
escritos/1568-escritos/1568-
ejemplo_de_analisis_de_contenido.html