SESIÓN 02: Método de recolección de datos Organización y presentación de datos..
CURSO: METODOS ESTADÍSTICOS
LIC. IVAN MORALES CHAVARRY
ESCUELA ACADEMICO PROFESIONAL PSICOLOGÍA
FACULTAD DE HUMANIDADES
ESTADÍSTICA DESCRIPTIVA
Su principal tarea es describir un conjunto de datos usando ciertos instrumentos.
Su utilidad refiere a:• La organización de datos de manera informativa, para que
“hablen por sí mismos”
• La detección de errores o comportamientos excepcionales
• La simplificación del análisis de datos usando ciertas medidas de resumen que destacan sus características relevantes.
• La posibilidad de brindar alguna evidencia que ayude a corroborar/rectificar los supuestos que se harán en caso de pretender hacer uso de la EI a partir de ese conjunto de datos.
¿Qué es la RECOLECCIÓN de datos ?
Es el registro de características
(medición, observación, conteo) a una unidad
elemental (o de análisis).
¿Qué es la ORGANIZACIÓN de datos ?
Es el ordenamiento para una mejor
comprensión y facilitar sus análisis.
(tablas, gráficos y figuras)
Los datos sin organizar se llaman datos brutos, y son de poca utilidad.
¿Qué es el ANÁLISIS de datos ?
Es el cálculo de MEDIDAS REPRESENTATIVAS (o de resumen) tales como promedios, medidas de variabilidad y medidas de la forma de la distribución.
¿Qué es la INTERPRETACIÓN de datos ?
Es darle un sentido práctico o útil a los resultados obtenidos en el análisis.
¿Qué son DATOS ?Son los registros de una característica
Ejemplo :
EdadPesoTiempo de estudiosTemperatura corporalProfesión
273,750
537,5
Comunicadores
añosKg.días°C---
Características DatosUnidad de medida
Si un DATO es útil para tomar decisiones se convierte en INFORMACIÓN.
Los datos ayudan a los responsables de tomar decisiones a hacer suposiciones coherentes acerca de las CAUSAS y, por tanto, de los EFECTOS probables de ciertas características en situaciones dadas.
¿Por qué necesitamos recolectar datos?
Proporcionan la evidencia imprescindible en un estudio de investigación.
Permiten medir el desempeño en el proceso de producción de un bien o servicio.
Ayudan a la formulación de cursos alternativos de acción en un proceso de toma de decisiones.
Satisfacen nuestra curiosidad innata.
¿Qué tipos de datos existen?
CONSTANTE:
Si el registro de la característica toma un sólo valor en todas las unidades elementales. Son muchos datos, pero iguales.• Sexo de las trabajadores de empresa• Título profesional de los miembros del Colegio de Psicólogos de
Lambayeque
Las constantes no son interés en Estadística, puesto que ella se ocupa del estudio de la variabilidad de los datos.
VARIABLE:
Si el registro de la característica toma diversos valores en las unidades elementales.
¿Qué se puede hacer con los datos?
Identificar características de interés para la gestión.
Recolección de datos
Organizarlos en tablas, gráficos y figuras
Calcular promedios (media, mediana, moda y percentiles) .
Calcular su dispersión (varianza, desviación estándar ) y forma de la curva.
Determinar una ecuación que represente la relación entre ellos (regresión)
Determinar el grado de asociación entre ellos (correlación).
Analizarlos dentro de un horizontetemporal (series cronológicas)
Utilizar datos para mejorar la calidad
Fuentes de Datos
Datos recolectados anteriormente para alcanzar otros objetivos. Constituye la primera fuente que se debe analizar. La técnica más utilizada son las fichas.
Ejemplo:
Datos publicados (en papel o en forma electrónica) en revistas especializadas, tesis, censos y en las hojas de registro anteriores.
A) FUENTES SECUNDARIAS
¿¿De donde provienen los datos?
¿La fuente es imparcial?
¿Los datos comprueban o contradicen otras evidencias que se disponen?
¿Hace falta una evidencia cuya ausencia conduzca a otra conclusión?
¿Cuantas observaciones se tienen?
¿La conclusión que obtengo es lógica?
La calidad de los datos debe ser comprobada:
Los principales organismos que disponende publicaciones son:
1. Instituto Nacional de Estadística e Informática (INEI)
2. Organización Mundial del Trabajo (OIT)
3. Organización Mundial de la Salud (OMS)
4. Organización Panamericana de la Salud (OPS)
1. Constituyen datos recolectados para el trabajo. Son datos que no existían antes.
2. Se registran bajo dos métodos: directo e indirecto
B) FUENTES PRIMARIAS
La recopilación o recolección de datos es el momento en el cual el investigador se pone en contacto con los objetos o elementos sometidos a estudio, con el propósito de obtener los datos o respuestas de las variables consideradas.
Clasificación de la recolección de datos
El trabajo de recolección de datos, en general, se puede realizar mediante dos modalidades:
a) La técnica de investigación documental o bibliográfica.
b) La técnica de trabajo de campo.
Por su parte, el trabajo de campo puede realizarse de dos maneras:
• b.1. La observación y la exploración en el terreno, que consiste en el contacto directo del investigador con el objeto de estudio.
• b.2. La encuesta y la entrevista, que consiste en el acopio de testimonios orales y escritos de personas vivas.
Técnicas de recolección de datos
Las técnicas de recolección son diversas y dependen de la
naturaleza del objeto de estudio, de las posibilidades de
acceso o contacto con los elementos investigados, del
tamaño e la población o muestra, de los recursos y de la
oportunidad de obtener los datos. La técnica también está
asociada al tipo y naturaleza de la fuente de datos.
METODOS Y TÉCNICAS DE RECOLECCION DE DATOS
FUENTE METODOS TECNICASSECUNDARIA FICHAS
DIRECTO OBSERVACIONEXPERIMENTACION
ENCUESTAENTREVISTA
PRIMARIAINDIRECTO
Métodos y técnicas de recolección de datos
El responsable registra personalmente los valores de la característica.
Ejemplo: registro del tiempo que demora un cajero durante una atención.
Comprende 2 técnicas.
A) A) MÉTODOS DIRECTOS
1. Se registra el dato bajo condiciones normales
2. Cuando se mide el desempeño, la persona observada no debe saber que es sujeta de observación
3. Se utiliza una hoja de registro.
Ejemplo
La observación del desempeño de un ingeniero durante sus labores.
(a) La observación
Se registra un dato bajo condiciones provocadas simulando el proceso lo más real posible.
Ejemplo: Un supermercado prueba para introducir un tipo limpiador .
(b) La experimentación
1. Se registra la característica a través de preguntas
2. No se realiza medición
Ejemplo:
Se pregunta a un cliente el tiempo que esperó antes que sea atendido por el cajero del banco.
Comprende 2 técnicas: la encuesta y la entrevista.
B) MÉTODOS INDIRECTOS
1. Cuestionario de preguntas abiertas o cerradas
2. Al diseñarla se debe:• Elegir lo temas generales de la encuesta• Decidir forma de aplicarlo: correo, teléfono o
personal• Plantear preguntas• Realizar una prueba piloto y hacer revisiones
finales Ejemplo: Encuesta para conocer el grado de satisfacción de los psicólogos de la Región Lambayeque.
(a) La encuesta
1.Permite recolectar datos o partir de un dialogo
2.Puede se estructurada o no estructurada
Ejemplo:
Entrevista al Director de una empresa sobre la aplicación de norma de calidad.
(b) La entrevista
¿Cómo seleccionar la fuente, el método y la técnica?
No toda la información requerida será recopilada de una sola fuente, ni usando un mismo método y técnica. Casi siempre es una combinación de ellos, para lo cual hay que:
1. Definir características que interesan registrar.
2. Identificar la fuente de información apropiada para cada característica.
3. Seleccionar la técnica más conveniente.
El Cuestionario
Consiste en un conjunto de preguntas diseñadas de acuerdo a la necesidad de información.
Junto con las hojas de registro, es la técnica más común para la recopilación de datos de fuentes primarias.
Recomendaciones para su elaboración
1. Las preguntas deben ser coherentes con el objetivo de la investigación. No hay preguntas de carácter general.
2. La extensión (número de preguntas) depende de la necesidad de información a recolectar por esta técnica.
3. El lenguaje utilizado en la redacción de preguntas debe ser entendible por los encuestados. Es diferente al lenguaje a usarse en el informe final
4. Debe evitarse la ambigüedad. Ejemplo: En un estudio para determinar el grado de
asociación entre la incidencia a cáncer pulmonar y el hábito a fumar, se hizo la siguiente pregunta: ¿Fuma usted? Si No
5. No formular preguntas dirigidas. Evitar adjetivos, ya que predisponen a una respuesta.
Ejemplo: ¿Cree Ud. que el precio del cafe es alto? Si No
1 2
1 2
Preguntas cerradas y abiertas
1. Las posibles respuestas se presentan como alternativas.
2. Facilita la codificación y operatividad de los datos.
Ejemplo :
¿Posee Ud. un seguro contra accidentes?
Si No1 2
Preguntas cerradas
1. Los encuestados tienen libertad para emitir su opinión.
2. Se utilizan cuando no se tiene precisión sobre las posibles respuestas.
3. Dificulta la recolección de datos (incomoda al encuestado).
4. Dificulta la interpretación de datos. Ejemplo: ¿ Qué opinión tiene sobre la política del sector
empresarial del actual Gobierno ?
Preguntas abiertas
Técnicas de Recolección de Datos:a.Entrevista.b.Encuestasc.Observaciónd.Sección de Grupos
Tipos de Preguntas:a.Preguntas abiertas no estructuradasb.Preguntas cerradas o estructuradas
Instrumentos de Recolección de Datos:a.Cuestionariosb.Lista de chequeo.c.Video-grabadora, cámara fotográfica
Técnicas e Instrumentos:a.Entrevista: Cuestionario, video-grabadora.b.Encuesta: Cuestionario, video-grabadora.c.Observación: Lista de chequeo, video-grabadora, cámara fotográfica.
Modalidad de Recoleccióna.Entrevista presenciales: Entrevista personal (privada), entrevista a campo abierto (público), observación directa.b.No presencial: Llamadas telefónicas, cuestionario por correo electrónico, formulario electrónico, observación indirecta.
Introducción
El rigor y la calidad para evaluar el instrumento dependen, fundamentalmente, de cómo se aborde la confiabilidad y la validez, cualidades esenciales que deben estar presentes en el desarrollo del proceso de recoger y analizar la información conducente a garantizar una mayor confianza sobre las conclusiones emitidas.
Tanto la confiabilidad como la validez se conjugan para ayudar al evaluador a ser objetivo en el proceso de describir la realidad derivada de un instrumento específico.
Requisitos de la Medición
Validez Confiabilidad
Validez de Contenido
Validez de Criterio
Validez de Constructo
Factores que atentan contra la validez y confiabilidad
Requisitos de la Medición
Toda medición o instrumento de recolección de datos debe reunir dos requisitos básicos: CONFIABILIDAD Y VALIDEZ.
CONFIABILIDAD DEL INSTRUMENTO: Se refiere al grado en que su aplicación repetida al mismo sujeto u objeto produce resultados similares o consistentes con mediciones previas.
VALIDEZ DE UN INSTRUMENTO: se refiere al grado en que un instrumento de medición realmente mide la variable que pretende medir. Por ejemplo: que un instrumento de inteligencia mida inteligencia y no ausencia de memoria.
La confiabilidad y validez son más difíciles de lograr mientras más abstracto sea el constructo que se desea medir (motivación, actitudes, inteligencia, valores, etc.)
En este sentido, toda medición está expuesta a un margen de error de medición, por lo que ésta nunca es perfecta.
La manera de controlar el error de la medición es calculando la confiabilidad y validez de los instrumentos de medición.
Medición de la Confiabilidad La confiabilidad del instrumento se refiere al grado en que su
aplicación repetida al mismo sujeto u objeto produce resultados similares no consistentes con mediciones previas.
Existen diversos métodos para evaluar la confiabilidad de un instrumento todos producen indicadores o coeficientes de confiabilidad.
Medida de Estabilidad
También llamada confiabilidad test - retest. Un mismo instrumento es administrado a un mismo grupo de personas después de un período de tiempo. Se mide la confiabilidad a través de la correlación entre ambos puntajes.
CONFIABILIDAD
Medida de Estabilidad: (confiabilidad test - retest). Un mismo instrumento es administrado a un mismo grupo de personas después de un período de tiempo. Se mide la confiabilidad a través de la correlación entre ambos puntajes.
Método de Formas paralelas o alternativas. Se Administran dos formas equivalentes, por tanto no es el mismo instrumento. Las formas son equivalentes en contenidos, preguntas, instrucciones, duración, etc. Las formas se administran a un mismo grupo dentro de un período de tiempo corto. Se mide la confiabilidad a través de la correlación entre ambos puntajes.
Método de las Mitades partidas (split - halves). Requiere una sola medición en un mismo grupo de sujetos. Se divide la prueba en dos mitades y se comparan los resultados en correlaciones.
Coeficiente de Cronbach. Este coeficiente requiere una sola medición y mide la consistencia interna de los ítems en cada escala y el instrumento como conjunto. Es decir entrega un valor estadístico que nos indica en que medida un conjunto de ítems apuntan en la misma dirección.
VALIDEZ
Validez de contenido: Se refiere al grado en que un instrumento refleja un dominio específico de contenido de lo que se mide. Es el grado en que la medición representa al concepto medido.
Validez de Criterio:Se establece la validez comparándolo con algún criterio externo. Es un criterio estándar con el que se juzga la validez de un instrumento. • Cuando el criterio se fija en el presente se llama validez
concurrente. Cuando el criterio se fija en el futuro se llama validez predictiva.
Validez de Constructo: Se refiere al grado en que una medición se relaciona consistentemente con otras mediciones de acuerdo con hipótesis derivadas teóricamente y que conciernen a los conceptos (o constructos) que están siendo medidos.
Cálculo de la ValidezCálculo de la Validez
Validez de contenido. Consulta a expertos.
Validez de criterio. Correlaciona su medición con el criterio.
Validez Constructo. Análisis factorial
FACTORES QUE AFECTAN A LA VALIDEZ Y CONFIABILIDAD
La improvisación en la medición y selección del instrumento.
Utilización de instrumentos extranjeros sin previa adaptación y estandarización.
Instrumento inadecuado a las personas que se les aplica.
Condiciones en las que se administra el instrumento de medición.
Pasos para crear y validar un Instrumento de Medición (Hernández, Fernández y Baptista, 1994)
Listar las variables que se van a medir u observar. Revisar la definición conceptual de las variables. Establecer la definición operacional. Elegir un instrumento ya desarrollado que se adaptará
para el estudio o crear un nuevo instrumento, tomando en cuenta las dimensiones a medir y los indicadores específicos que se utilizarán para cada una.
Indicar el nivel de medición de cada ítem o variable. Establer la forma en que se codificarán (darles un
número que represente) las variables o ítemes. Aplicar una prueba piloto del instrumento. Modificar el instrumento, a partir de los resultados de
la prueba piloto.
Listar las variables que se van a medir u observar. Revisar la definición conceptual de las variables. Establecer la definición operacional. Elegir un instrumento ya desarrollado que se adaptará
para el estudio o crear un nuevo instrumento, tomando en cuenta las dimensiones a medir y los indicadores específicos que se utilizarán para cada una.
Indicar el nivel de medición de cada ítem o variable. Establer la forma en que se codificarán (darles un
número que represente) las variables o ítemes. Aplicar una prueba piloto del instrumento. Modificar el instrumento, a partir de los resultados de
la prueba piloto.
ORGANIZACIÓN Y PRESENTACIÓN DE DATOS
En el trabajo estadístico, siempre se dispone de mucho datos que, definitivamente tienen que se clasificados, ordenados y presentados adecuadamente, de tal manera que facilite la comprensión, descripción y análisis del fenómeno estudiado, y obtener conclusiones validas para la toma de decisiones.
Pasos para la organización y presentación de los datos
La organización y presentación de los datos estadísticos, supone realizar los siguientes pasos:•Evaluación y crítica•Codificación•Clasificación•Procesamiento o tabulación de datos•Presentación de los datos
Evaluación y Crítica : consiste en inspeccionar la validez y confiabilidad de los datos, para corregir los errores y omisiones de acuerdo a ciertas reglas fijas.
Codificación: técnica mediante la cual los datos (numérica o verbal) se convierte en un número, que permite su procesamiento electrónico.
Clasificación: consiste en establecer las categorías de las variables. Procesamiento o tabulación de los datos: que es la contabilización o
registro del número de casos en cada una de las categorías de la variable.
El plan de tabulación es el primer ordenamiento de los datos, son para construir las llamadas “tablas estadísticas”.
Presentación de los datos: donde los resultados de la tabulación, una vez evaluados, se presentan en cuadros y gráficos estadísticos. La presentación implica tener la información estadística organizada para proceder al análisis e interpretación de los resultados y de los aspectos considerados de la población en estudio.
Estructura de los Cuadros y Gráficos Estadísticos
Los cuadros estadísticos presentan ordenadamente los datos en filas
y columnas, clasificados y agrupados de acuerdo a uno o más
criterios específicos. Se pueden considerar variables cualitativas,
cuantitativas discretas, cuantitativas continuas o una combinación
de ellas.
Esta información no sólo es un valor número sino que además
merece una interpretación de tipo cualitativo. La finalidad es ofrecer
información resumida de fácil lectura, comparación e interpretación.
Partes de un Cuadro Estadístico
1. Número: Es el código de identificación de la tabla. Este número se describe a continuación de la palabra tabla.
2. Titulo: es la descripción resumida del contenido del cuadro. La redacción del título debe ser breve, claro y completo, de modo que se pueda deducir sin
ambigüedad que tipo de información contiene el cuadro.
Un título completo, debe responder a las siguientes preguntas:
QUÉ: a que se refiere la información contenida en la tabla que se estudia.(unidad de analisis).
CÓMO: Cómo están ordenados o clasificados los datos en el cuadro. La variable ubicada en la fila se identifica con la preposición “POR” y la variable que esta en la columna se le antepone “SEGÚN”. (la(s) variables).
DÓNDE: se refiere al lugar geográfico a la que corresponde la información. CUÁNDO: se refiere al momento o período de tiempo que está
referida la información, puede ser un momento específico o puntual, como también un período de varios años, meses o semanas, etc.
Ejemplo 1:
Cuadro Nº 01:Hábito de Fumar según Sexo de los clientes atendidos en el
autoservicio Metro . Chiclayo Junio - Agosto 2011
Qué:
Cómo:
Donde:
Cuándo:
Cuadro Nº 01: Hábito de Fumar según Sexo de los clientes atendidos en el
autoservicio Metro . Chiclayo Junio - Agosto 2011
Qué: clientes atendidos
Cómo: por hábito de fumar, según sexo.
Donde: autoservicio Metro- Chiclayo
Cuándo: Junio-Agosto 2011.
3. Encabezamiento: es la descripción de las filas y columnas de un cuadro
estadístico, el encabezamiento se ubica en la parte superior del cuerpo del cuadro.
4. Cuerpo del cuadro: es el contenido numérico del cuadro. Es la parte donde se colocan los datos correspondientes a las características o variables indicados en el encabezamiento.
5. Fuente: es la indicación al pie del cuadro, que sirve para nombrar la entidad responsable de donde se obtuvieron los datos presentados
6. Nota de pie de páginas o llamadas: se usa para aclarar algunos términos o siglas, y también para indicar qué elementos están o no incluidos en algunos de los conceptos del cuadro.
7. Elaboración Unidad de medida: Aquí se indica los autores de la investigación (Barboza-Bueno, equipo de investigación)
8. Unidad de medida: se escribe debajo del titulo , se usa cuando se abrevia la escritura de las cifras y para expresar en que unidades esta expresada la variable.
TIPOS DE TABLAS ESTADÍSTICASa. De Variable Cualitativa: Los más usuales son:
Tablas Unidimensionales: Se construyen cuando se analiza una sola variable cualitativa ( Estado Civil, Zona de Residencia, Ocupación, etc.).
TABLA Nº 1 ESCUELA DE COMPUTACION E INFORMATICA (UNPRG): LAMBAYEQUE
PADRES DE FAMILIA DE LOS ALUMNOS DEL 1º CICLO SEGÚN GRADO DE INSTRUCCIÓN
NIVEL DE
INSTRUCCIÓN
Nº %
Primaria
Secundaria
Sup. No Universitaria
Sup. Universitaria
2
11
42
15
2.86
15.71
60.00
21.43
Total 70 100.00
Tablas Bidimensionales: Llamados también de doble entrada, se construyen tablas se analiza a la vez dos variables cualitativas.
TABLA Nº 2ESCUELA DE COMPUTACION E INFORMATICA (UNPRG): LAMBAYEQUE
PADRES DE FAMILIA DE LOS ALUMNOS DEL 1º CICLO POR ZONA DE RESIDENCIA Y NIVEL DE INSTRUCCIÓN
NIVEL DE INSTRUCCION
ZONA DE RESIDENCIA
TOTALUrbana Urbano
Marginal
Rural
Nº % Nº % Nº % Nº %
Primaria - - 1 1.43 1 1.43 2 2.86
Secundaria 3 4.29 6 8.57 2 2.85 11 15.71
Sup. No Universitaria 26 37.14 13 18.57 3 4.29 42 60.00
Sup. Universitaria 12 17.14 3 4.29 - - 15 21.43
TOTAL 41 58.57 23 32.86 6 8.57 70 100.00
b. DE VARIABLE CUANTITATIVA:
Tablas Unidiemnsionales:Se construyen cuando se analiza una sola variable cuantitativa. (Ingresos económicos, Rendimiento de alumnos, Peso, Edad,etc.). Ejem.
INGRESO ECONOMICO Nº %
500 – 700
701 – 900
901 – 1100
1101 - 1300
1301 - 1500
5
8
15
25
17
7.14
11.43
21.83
35.71
24.29
TOTAL 70 100.00
TABLA Nº 3ESCUELA DE COMPUTACION E INFORMATICA (UNPRG):
LAMBAYEQUE PADRES DE FAMILIA DE LOS ALUMNOS DEL 1º CICLO SEGÚN
INGRESO ECONOMICO
Tablas Bidimensionales: Se construyen cuando se analizan a la vez dos variables cuantitativas. Ejem.
Ingreso
Económico
RendimientoTotal
0 -10 11-15 16-20
Nº % Nº % Nº % Nº %
500 - 700 3 4.29 2 2.85 - - 5 7.14
701 - 900 2 2.86 5 7.14 1 1.43 8 11.43
901 - 1100 4 5.71 8 11.43 3 4.29 15 21.43
1101-1300 4 5.71 21 30.0 - - 25 35.71
1301-1500 2 2.86 14 20.0 1 1.43 17 24.29
Total 15 21.43 50 71.42 5 7.15 70 100
TABLA Nº 4ESCUELA DE INGENIERIA INDUSTRIAL (USS): LAMBAYEQUE
PADRES DE FAMILIA DE LOS ALUMNOS DEL PRIMER CICLO SEGÚN INGRESO ECONOMICO Y RENDIMIENTO DE LOS ALUMNOS
c. DE VARIABLE CUANTITATIVA- CUALITATIVA: Se construyen cuando se analiza una variable cuantitativa y una cualitativa. Ejem.
Ingreso
Económic
o
Zona de ResidenciaTotal
UrbanaUrbano
marginalRural
Nº % Nº % Nº % Nº %
500 - 700 - - 1 1.43 4 5.71 5 7.14
701 - 900 2 2.86 4 5.71 2 2.86 8 11.43
901 -
1100
9 12.86 6 8.57 - - 15 21.43
1101-
1300
18 25.71 7 10 - - 25 35.71
1301-
1500
12 17.14 5 13.15 - - 15 24.29
Total 41 58.57 23 32.86 6 8.57 70 100.0
0
TABLA Nº 5ESCUELA DE C. DE LA COMUNICACIÓN DE LA USS; PADRES DE
FAMILIA DE LOS ALUMNOS DEL PRIMER CICLO SEGÚN INGRESO ECONOMICO Y ZONA DE RESIDENCIA
La Tabla de Frecuencias Elementos: Consiste en una presentación resumida de la información usando
tablas o cuadros
Supongamos que en una entrevista a turistas del lo que se busca evaluar son 2 aspectos:
- La opinión sobre la calidad de atención
- Nivel de instrucción de los turistas
Frecuencias Absolutas (ni ó fi) Es el número de veces que aparece un determinado valor en un estudio estadístico.Frecuencias Absolutas Acumuladas (Ni ó Fi)
F1 = f1 F2 = f1 + f2 F3 = f1 + f2 + f3 = F2 + f3 . . Fi = F(i-1) + fi
Tipos de Frecuencia
Frecuencias Relativas (hi) Se calculan dividiendo cada una delas frecuencias absolutas (ni) entre el número total de observaciones, (N), pudiéndose expresar en forma de una fracción o de un porcentaje..
hi = _fi__ n
Frecuencia Relativa Porcentual (hi%)
Es la frecuencia relativa simple multiplicada por 100 hi% = _fi__ x 100 n
Frecuencia relativa simple Acumulada (Hi)H1 = h1H2 = h1 + h2H3 = h1 + h2 + h3 = H2 + h3
Frecuencia relativa simple porcentual Acumulada (Hi%)
H1% = h1%H2% = h1% + h2%H3% = h1% + h2% + h3% = H2% + h3%
La marca de clase (Xi) es el punto medio de una clase
SIMBOLOGIA:n : N° de datosLi : Límite inferior de los datosLs : Límite superior de los datosR : Recorrido o rangom : N° de intervalosc : amplitud interválicaXi : Recorrido o valores que toma una variable discretani : Frecuencias absolutashi : Frecuencias relativasNi : Frecuencias absolutas acumuladasHi : Frecuencias relativas acumuladashix100 : Frecuencias relativas porcentualesHix100 : Frecuencias relativas porcentuales acumuladas[yi-1 – yi) : Intervalo cerrado por la izquierda y abierto por la derecha(yi-1 – yi] : Intervalo abierto por la izquierda y cerrado por la derecha[yi-1 – yi] : Intervalo cerrado por ambos lados
Ejemplo
Con la finalidad de mejorar la calidad del servicio en una empresa, se ha formulado la siguiente pregunta a 45 clientes atendidos durante una semana: “¿Cómo califica la calidad de la atención que Ud, acaba de recibir en este Servicio : muy bueno, bueno, aceptable, malo o muy malo”
Muy bueno Aceptable Aceptable Muy bueno Bueno
Bueno Bueno Muy malo Bueno Bueno
Aceptable Bueno Aceptable Malo Muy bueno
Malo Aceptable Muy malo Aceptable Malo
Aceptable Muy bueno Bueno Bueno Aceptable
Bueno Malo Aceptable Muy malo Bueno
Malo Bueno Malo Bueno Aceptable
Bueno Bueno Muy malo Muy bueno Malo
Aceptable Bueno Aceptable Malo Bueno
Los datos recolectados se presentan a continuación:
Primero, se identifican las categorías:Primero, se identifican las categorías:
Muy buenoMuy bueno
BuenoBueno
AceptableAceptable
MaloMalo
Muy maloMuy malo
Segundo, se realiza el conteo de las frecuencias:Segundo, se realiza el conteo de las frecuencias:
Muy bueno /////Muy bueno /////
BuenoBueno ///// ///// ///// / ///// ///// ///// /
Aceptable ///// ///// //Aceptable ///// ///// //
Malo ///// ///Malo ///// ///
Muy malo //// Muy malo ////
Cuadro 1: Calidad del Servicio de la Empresa
Fuente: Encuesta a los Pacientes, julio 2002
Tercero, se presenta la tabla, considerando el título y la fuente.
Número de TasaCategoria Clientes Porcentual
Muy Bueno 5 11,11
Bueno 16 35,55
Aceptable 12 26,67
Malo 8 17,78
Muy Malo 4 8,89
Total 45 100,00
a. DISRIBUCION DE FRECUENCIAS DE VARIABLE DISCRETA:
Ejemplo 1 : Los siguientes datos corresponde al número de profesores de 75 colegios:
49, 52, 50, 47, 49, 48, 50, 49, 51, 50, 52 47, 49, 48, 47, 46, 50, 49, 51, 50, 48, 46, 52, 49, 48, 48, 47, 51, 46, 51, 50, 47, 49, 46, 50, 49, 47, 50, 51, 48, 49, 47, 48, 48, 46, 48, 47, 51, 46, 49, 46, 48, 49, 48, 50, 52, 52, 48,48,49, 47, 48, 50, 49, 46, 51, 50,49, 47, 50, 48, 51, 52, 48, 51
a. Elabore una tabla de frecuencias para analizar los datos.b. Interprete la tabla
Xi ni hi Ni Hi hix100 Hix100
46
47
48
49
50
51
52
TABLA Nº 6 DISTRIBUCION DE FRECUENCIAS DE LOS PROFESORES
DE 75 COLEGIOS
INTERPRETACIÓN DE LOS VALORES DE LA TABLA
Vamos a interpretar dos valores de cada columna, el resto de valores se interpreta de manera similar.
n3 = 16 :16 colegios tienen 48 profesores
n5 = 12 :12 colegios tienen 50 profesores
h2 = 0.13 :El 0.13 por uno de colegios tienen 47 profesores
h4 = 0.19 El 0.19 por uno de colegios tienen 49 profesores
N3 = 34 :34 colegios tienen de 46 a 48 profesores
N6 = 69 :69 colegios tienen de 46 a 51 profesores
H3 = 0.45 :El 0.45 por uno de colegios tienen de 46 a 48 profesores
H5 = 0.80 El 0.80 por uno de colegios tienen de 46 a 50 profesores
h4 x 100 = 19 :El 19% de colegios tienen 49 profesores
h6 x 100 = 12 :El 12% de colegios tienen 12 profesores
H3 x 100= 45 :El 45% de colegios tienen de 46 a 48 profesores
H5 x 100= 80 :El 80% de colegios tienen de 46 a 5o profesores
b .- DISRIBUCIÓN DE FRECUENCIAS DE VARIABLE CONTINUA:Cuando la variable en estudio es continua los datos se agrupan en intervalos.
Ejemplo: Los siguientes datos corresponde al ingreso económico de 62 trabajadores.
910, 950, 1190, 620, 1040, 1100, 1070, 925, 800, 1380, 780, 456, 706, 1100, 860, 1370, 1240, 1120, 1020, 1060, 930, 1136, 1180, 990, 630,1070, 930, 1200, 920, 815, 495, 480, 460, 1090, 1220,456, 742, 1080, 1082, 1073, 1345, 790, 950,1073, 1170, 790, 1085, 820, 900, 780, 700, 650, 1020, 980, 950, 990, 935, 810, 790, 1382, 1384, 910
a.Elabore una tabla de distribución de frecuencias utilizando un intervalo cerrado por la izquierda y abierto por la derecha.b.Interprete la tabla y haga la representación grafica correspondiente
Metodología para construir intervalos
1° Se determina el Rango, con la siguiente fórmula:
LiLsR R = Ls – Li = 1384-456 = 928 R =
928
45.2 nm
2° Se determina el número de intervalos:
m = 7
3° Se determina la amplitud del intervalo ( c ):
C = 57142861327
928.
M
R
Los siguientes datos de refieren a la estatura (en metros) de 50 Estudiantes de la EAP de CC.CC. que estudian en la USS. Construya una tabla de distribución de frecuencias.
1,68 1,72 1,70 1,67 1,76 1,82 1,59 1,66 1,82 1,70 1,66 1,70 1,68 1,65 1,74 1,80 1,57 1,64 1,80 1,68 1,72 1,74 1,72 1,69 1,78 1,84 1,61 1,69 1,84 1,74 1,73 1,75 1,75 1,72 1,81 1,87 1,64 1,70 1,86 1,74 1,75 1,77 1,76 1,72 1,81 1,87 1,64 1,72 1,87 1,77
Ejercicio 1
Ejercicio 2:Complete la siguiente tabla que corresponde al peso de 60 Complete la siguiente tabla que corresponde al peso de 60 estudiantes de la EAP de Ingeniería de la USS.estudiantes de la EAP de Ingeniería de la USS.
PESOfi Fi hi Hi(en kilos)
48,0 – 52,9 6
53,0 – 57,9 0,30
58,0 – 62,9
63,0 – 67,9 0,25
68,0 – 72,9 9
Total
La siguiente información se refiere al peso (en Kg.) de 60 personas. Elabore una tabla de distribución de frecuencias.
k=6 LI1=35 LS5=64 F2=20 h3=0,213 H4=0,799 f6 = 5 f1=4
Ejercicio 3
000.1 ih
30 fn
Ejercicio 4: Ejercicio 4:
Complete la siguiente tabla de distribución de frecuencias:Complete la siguiente tabla de distribución de frecuencias:
n
fhi
actanti ffF actanti hhH
ff antant --> frecuencia anterior --> frecuencia anterior
ff actact --> frecuencia actual --> frecuencia actual
PESOfi Xi Fi hi Hi(en libras)
128,6 - 135,4 2
135,5 - 142,3 7
142,4 - 149,2 10
149,3 - 156,1 8
156,2 - 163,0 3
Total
GRÁFICOS ESTADÍSTICOS
Un gráfico estadístico es un diagrama o una representación pictórica, con el objeto de ilustrar los cambios o dimensión de una variable, para comparar visualmente dos o más variables similares o relacionadas. Para una rápida comprensión de situaciones o variaciones en cantidades, es muy útil traducir los números en figuras o imágenes. Toda figura es superior al texto escrito porque transmite de manera casi instantánea, hechos, cantidades y comportamientos de variables.
Partes de un Gráfico Estadístico
a) Número de la figura: es el código de identificación del gráfico. Este número se escribe a continuación de la palabra gráfico.
b) Título: como en las tablas, es una descripción del contenido del gráfico. Debe responder a las mismas preguntas que para el cuadro.
c) Los diagramas: esta dado por la propia figura geométrica, están representados por los datos indicados en el cuadro.
d) Fuente: de los datos estadísticos representados
e) Escalas o leyendas: son indicaciones donde se precisan la correspondencia entre los elementos de los gráficos y la naturaleza de las medidas representadas.
Elaboración de un cuadro estadístico para variable cualitativa:
EJEMPLO 1:En una encuesta de opinión acerca de las preferencias de bebidas gaseosas por su color: Blanco(B), Negro(N), Rojo (R), una muestra de 20 consumidores marcó las siguientes respuestas: B B N N N N B R R B N N N B B R B B N Na)Elabore la tabla de distribución de frecuencias e interprete.b)Presente el cuadro estadístico.c)Construya un gráfico adecuado a la variable.
Presentación de Cuadros y Gráficos Estadísticos
Son barras verticales presentadas una a continuación de otra. Permite presentar datos cuantitativos continuos. Es un gráfico muy utilizado. Propiedades:
1. El ancho de cada columna es igual en todo el gráfico y representa la amplitud de de clase).
El Histograma
2. La altura está en función a la frecuencia de la
clase.
0
2
4
6
8
10
12
132.0 138.9145.8152.7159.6
Marca de Clase
Fre
cu
en
cia
Distribución de frecuencias
Histograma
CLASE Xi fi
128,6 - 135,4 132,0 2
135,5 - 142,3 138,9 7
142,4 - 149,2 145,8 10
149,3 - 156,1 152,7 8
156,2 - 163,0 159,6 3
TOTAL 30
Gráfico 4: Peso de 100 ingenieros (en Kg.)
Número de Ingenieros
0
5
10
15
20
25
29.5 39.5 49.5 59.5 69.5 79.5 89.5 99.5 Peso(Kgs)
Fuente: Encuesta, julio 2011
Ejemplo
¿Cómo leer histogramas?
A) Tipo general: El valor medio está al centro, que tiene la mayor frecuencia. Es el más frecuente tiene forma simétrica.
B) Tipo multimodal: Hay varios valores “mayores”.
C) Tipo sesgo positivo: Forma asimétrica la media está localizada a la izquierda.
D) Tipo precipicio a la izquierda: Forma asimétrica la frecuencia disminuye bruscamente a la izquierda.
G) Tipo pico aislado: Presenta un pico aislado, además de un histograma general.
F) Tipo bimodal: Se observa claramente dos valores máximos.
E) Tipo planicie: Las clases tienen más o menos la misma
frecuencia.
El Diagrama de Barras
Se utiliza para representar datos cuantitativos discretos o datos cualitativos.
Las barras son de igual ancho.
La longitud es proporcional a la frecuencia de la categoría.
El espacio entre barras debe ser homogéneo, para evitar efecto visual.
0
5
10
15
20
25
30
0 1 2 3 4 5
Nº de Ingenieros
Número dehijos
(escolares)Fuente: Departamento de Personal
Gráfico 1: Número de hijos en edad escolar por ingeniero de la región Lambayeque
Ejemplo:
Gráfico 2: Número de especialistas en producción de videos en la Región Lambayeque
Especialidad
0 10 20 30 40 50 60 70 80 90 100
Técnico 5
Técnico 4
Técnico 3
Técnico 2
Técnico 1
Nº de profesionales
Fuente: Gerencia de Recursos Humano. Julio 2012
Ejemplo
El Polígono de Frecuencias
Es otra forma de conocer las distribución de los datos. Se construye uniendo los punto medios del lado superior de las barras del histograma.
0
5
10
15
20
25
29.5 39.5 49.5 59.5 69.5 79.5 89.5 99.5
Número de Pacientes
Peso(Kg.)
Fuente: Historia Clínica, julio del 2002
Gráfico N° 5: Distribución de los pesos de los Pacientes del Servicio de Cardiología
Meses Cliente
Enero 120
Febrero 210
Marzo 180
Abril 320
Mayo 280
Junio 200
Julio 350
Diagrama de dispersión de puntos
Fuente: Departamento de Admisión Clínica
Gráfico 6: Clientes mensualesEjemplo:
0
50
100
150
200
250
300
350
400
0 2 4 6 8 Enero Febrero Marzo Abril Mayo Junio Julio
Ejemplo
Diagrama Lineal
Gráfico 7: Clientes mensuales
Fuente: Departamento de Admisión
0
50
100
150
200
250
300
350
400
Enero Febrero Marzo Abril Mayo Junio Julio
El diagrama circular
El circulo se divide en segmentos circulares, de tamaño El circulo se divide en segmentos circulares, de tamaño proporcional a la frecuencia de la categoría.proporcional a la frecuencia de la categoría.
1er trim.2do trim.3er trim.4to trim.
Fuente: Ficha de atención. Julio del 2002
Ejemplo:
Gráfico 10. Pacientes atendidos en consultorios externos
Superficie en tres dimensiones
3er trim.
4to trim.0
50
100
3er trim.4to trim.
Fuente: Encuesta, julio 2012
Ejemplo: Metas alcanzadas en producciones de alimentos envasados
Principales diagramas según el tipo de variable..
Tipo de variable
Diagrama
Cualitativa Barras, sectores, pictogramas
Discreta Diferencial (barras)Integral (en escalera)
Continua Diferencial (histograma, polígono de frecuencias)Integral (diagramas acumulados)