Sestav2 Psicologia 2013 30may

download Sestav2 Psicologia 2013 30may

of 35

Transcript of Sestav2 Psicologia 2013 30may

  • ESTADSTICARegresin lineal simple y correlacinProbabilidades

    Docente: Juan Martin Mope Mio

  • REGRESIN Y CORRELACIN SIMPLEEn la naturaleza encontramos con frecuencia que existen relaciones establecidas entre dos o ms variables. As, sabemos que el rea de un circulo depende de su radio y lo expresamos matemticamente como, rea circulo = r2; las horas trabajadas y accidentes de trabajo; ingreso de una familia con sus gastos; supongamos que queremos establecer la relacin existente entre la aptitud para el conocimiento de la historia y la aptitud para los conocimientos matemticos, mediante las puntuaciones de ambas materias para un mismo grupo de alumnos. El objeto de estos dos experimentos es determinar si hay alguna relacin entre las variables que se estudian.

    Los anlisis de regresin y correlacin mostrarn cmo determinar la naturaleza y la fuerza de una relacin entre dos variables.

    En el anlisis de regresin desarrollaremos una ecuacin de estimacin, es decir, una frmula matemtica que relaciona las variables conocidas con las desconocidas.

  • Las variables en la regresin linealLos anlisis de regresin y correlacin se basan en la relacin o asociacin existente entre dos (o ms) variables. La variable (o variables) conocida recibe el nombre de variable independiente. La variable que estamos intentando predecir en la variable dependiente.La variable considerada causa se denomina variable independiente o antecedente, y la considerada efecto se denomina variable dependiente o consecuente.La dependiente se denomina as porque su valor depende del valor de la variable independiente. La variable independiente, por el contrario, se denomina de ese modo porque su valor no depende de la variable dependiente.Ejemplo considerar las puntuaciones de aptitud con la productividad en trabajadores de una empresa: las puntuaciones sera la variable independiente (causa) y la productividad, la variable dependiente (efecto); se asigna la variable independiente con la letra X y la variable dependiente con la letra Y.

  • Los datos de la distribucin bidimensional, se representan grficamente en un par de ejes coordenados, considerando al eje de las abscisas para la primera variable (Xi) y al eje vertical i de la ordenadas, para los valores de la segunda variable (Yj)

    Criterios para determinar una nube de puntosObservar cuidadosamente la forma que toma el conjunto de puntosLa lnea debe reflejar la mejor posible tendencia de los puntos en la grfica.La lnea debe representar al conjunto de puntos , por lo tanto debe ser, hasta donde sea posible, la ms sencilla.Diagramas de dispersin o nube de puntos

  • Relacin directa entre X e Y: conforme aumenta la variable independiente, tambin lo hace la variable dependiente.

    Relacin inversa entre X e Y: la variable dependiente disminuye al aumentar la variable independiente.YXVentas en solesPublicidad en solesRelacin directaPendiente positivaYXVenta de abrigosTempera CRelacin inversaPendiente negativa

  • Correlacin curvilnea:Ejemplo diagrama de dispersin del nmero medio de consultas mdicas anuales y la edadCorrelacin nula:Ejemplo diagrama de dispersin de temperatura y el nmero de calzado.Nmero de calzadoCreatividad

    Grfico1

    8

    7

    6

    4

    3

    2

    1

    0

    1

    1

    1

    2

    3

    5

    5

    6

    7

    8

    9

    Consultas mdicas ao

    edad

    Consultas mdica ao

    Hoja1

    EdadConsultas mdicas ao

    18

    27

    36

    54

    83

    152

    161

    200

    251

    301

    321

    402

    483

    505

    555

    616

    687

    708

    819

  • ESTIMACIN MEDIANTE LA LNEA DE REGRESINUna ecuacin que permite describir la relacin existente entre dos variables se determina por el anlisis de regresin. Es decir, obtener una lnea ideal conocida como lnea de regresin, que nos describa la relacin o dependencia entre dos variables.

    Esta lnea matemtica, en el caso de una sola variable dependiente o explicativa puede ser expresada, a travs de una :

    Recta o funcin lineal: Y = a +bX; Parbola de segundo grado Y=a +bX+cX2Funcion potencia Y = aXb

    Estas funciones se puede resolver en la mayora de las situaciones que nos presentan en la vida diaria.

    El anlisis de regresin permite la prediccin o sea la estimacin de un valor o promedio de una variable denominada dependiente, con base en un valor o promedio supuestamente conocido para la otra variable, denominada independiente.

  • La funcin lineal tiene una expresin matemtica como la siguiente Y = a + bXEn la que x e y son las variables cuya relacin se analizar, y lo nmeros a y b son valores fijos que determinan cual es la recta de mnimos cuadrados. Hallar la recta implica encontrar esos nmeros a y b.Y = a + b XVariable dependienteVariable independienteInterseccin en YPendiente de la lnea

  • Clculo matemtico de la lnea de mnimos cuadrado del mejor ajuste

    Y = a +bX

    Valor del parmetro b, o pendiente de la lnea de regresin de los mnimos cuadrados.

    Valor de la constante a interseccin de la lnea de regresin de mnimos cuadrados.

    Donde los valores promedios se calculan:

  • Ejemplo de regresinSe ha efectuado un estudio donde se relacionan los puntajes de aptitud con la productividad en una industria. Despus de tres meses de entrenamiento del personal, sus postulantes, elegidos al azar, obtuvieron los seis pares de puntajes de aptitud y productividad que se indican a continuacin:Cul es la productividad esperada de un trabajador, cuyo puntaje de aptitud fue de 16?

    Puntaje de aptitud91720192021Productividad233529334332

  • Tabla N 01.- Puntuaciones de aptitud y productividad de trabajadores.

    TrabajadorPuntaje de aptitudProductividad19232173532029419335204362132

  • En el ejemplo, la variable independiente es la aptitud y la variable dependiente es la productividad; se debe encontrar el modelo de regresin lineal: El valor de la muestra n =6 pares ordenados y los promedios de las variables:

    VariablesTrabajadorproductividadYaptitudX(productividad*aptitud)YXproductividad2 Y2 aptitud2 X2123923*9 = 20723*23=5299*9=8123517595122528932920580841400433196271089361543208601849400632216721024441Total195106354165571972n = 6 PARES

  • Primero se encuentra el parmetro de la pendiente de la ecuacin:b = 0.9664a = 32.5 0.9664*(17.67) = 15.4237Luego se encuentra el parmetro de la interseccin en Y de la ecuacin:a = 15.4237Por lo que el modelo queda: Y = 15.4237 + 0.9664 XProductividad = 15.4237+0.9664* Puntuaciones de aptitud

  • Cul es la productividad esperada de un trabajador, cuyo puntaje de aptitud fue de 16?Con el modelo propuesto se tiene, el valor para la aptitud es 16, entonces, X = 16.Y = 15.4237 + 0.9664 (X)

    Y = 15.4237 + 0.9664 (16)Productividad = 15.4237+0.9664(16)Productividad = 30.8861

    La productividad esperada de un trabajador, cuyo puntaje de aptitud fue de 16 es de 30.89

  • Producto Momento de Pearson:

    Donde n es el nmero de pares de datos de la muestra.CORRELACIN: NDICE r DE PEARSONEl anlisis de correlacin es la tcnica con que se determina el grado de relacin lineal que hay entre variables.Despus de haber aprendido el patrn de dicha relacin, aplicaremos el anlisis de correlacin para determinar el grado de relacin que hay entre las variables. As pues, el anlisis de correlacin nos dice con qu precisin la ecuacin de estimacin describe la relacin.

  • Grado de correlacin:El grado de correlacin indica en qu medida existe un patrn claro de alguna relacin en particular entre dos variables. -1 < r < 1Valores del coeficiente de correlacin de pearson:

    Correlacin perfecta, cuando r = 1 ( r =-1)Correlacin excelente, cuando r es mayor de 0.90 y menor de 1 (-1 < r < -0.90)Correlacin aceptable, cuando r se encuentra entre 0.80 y 0.90 (-0.90 < r < -0.80)Correlacin regular, cuando r se encuentra entre 0.60 y 0.80 (-0.80 < r < -0.60)Correlacin mnima, cuando r se encuentra entre 0.30 y 0.60 (-0.60 < r < -0.30)No hay Correlacin para r menor de 0.30 y mayor a 0 (-0.30 < r < 0)

    r = 0.95r = 0.76r = -0.96r = 0.002

  • Patrones de correlacinXi,YjYjXi

  • Ejemplo:Supngase que un conjunto de datos consiste en las calificaciones de un grupo especfico de nios en una prueba de inteligencia y que el otro conjunto las calificaciones de una prueba de rendimiento. Se aprecia cada CI del nio con su correspondiente calificacin de rendimiento, se define una relacin entre inteligencia rendimiento. En la tabla adjunta se proporciona cada una de las calificaciones de los 7 nios:

    Grafique los datos y describa su tendenciaCalcule el coeficiente de correlacin entre X e Y.

    Calificaciones NioInteligenciaRendimiento1136552125573118424110485100426973579032

  • Grafico de la dispersinAl dibujar el diagrama de dispersin como la figura adjunta vemos que hay una relacin lineal positiva entre la inteligencia y el rendimiento.42(100, 42)

  • En la muestra despus de identificar que la variable independiente la inteligencia y la variable dependiente el rendimiento, se obtiene que: Ecuacin del coeficiente de correlacin

    Calificaciones NioInteligenciaXRendimientoY(Inteligencia)x(Rendimiento)XYInteligencia2 X2 Rendimiento2 Y2113655136*55 = 7480136*136=1849655*55= 302521255771251562532493118424956139241764411048528012100230451004242001000017646973533959409122579032288081001024Total776311353168765414355n = 7 PARES

  • Tenemos entoncesClculo del coeficiente de correlacin entre X e YExiste una correlacin grande entre el rendimiento y las calificaciones de los nios de siete aos.

  • CALCULO DE PROBABILIDADCmo cambia la conducta de una persona si consume una sustancia alucingena?.Cul es el efecto sobre la personalidad, de haber tenido figuras parentales autoritarias en la niez?.Qu determina que algunos alumnos tengan xito en la escuela y otros no?.Cmo son las dificultades en las matemticas de un grupo de alumnos?Votaran un grupo de 200 personas por el partido X?Cul es el numero de errores que comente los participantes voluntarios a una prueba en la que se determina la relacin entre las expectativa de logro y asignaturas aprobadas?.Cmo es la estabilizacin de pacientes psicticos despus de suministrar una droga?.

    En estas situaciones, cuando no tenemos toda la informacin que hace falta para predecir el resultado, recurrimos a la probabilidad. Al hacer inferencias necesitamos de la probabilidad porque trabajamos con situaciones inciertas, que no conocemos y que tenemos dificultad para prever.

  • Conceptos bsicos de probabilidad:En la teora de la probabilidad se llama experimento a la actividad que produce un evento o suceso.Experimento aleatorio: cualquier proceso de observacin que puede repetirse a voluntad en condiciones similares, con la condicin de que el resultado no pueda se previsto antes de cada una de sus realizaciones.Ejemplo:Exp1: De un grupo de 420 postulantes para un puesto de trabajo en una empresa que porcentaje aprobar el examen psicolgico.Exp2: Lanzar un dado no cargado.

    Espacio muestral, son todos los resultados posibles de un experimento aleatorio.Ejemplo:S1 = {el 20% de los candidatos a un puesto de trabajo aprueba examen, el 25%, el 40%, el 18%, .. }.S2 = {1, 2, 3, 4, 5, 6}.

    Evento elemental o simple: es un elemento del espacio muestral de un experimento aleatorio.Ejemplo:Porcentaje aceptable el 20%.Nmero seis en el lanzamiento de un dado.

  • Conceptos bsicos de probabilidad:Evento mutuamente excluyente: aquellos en que la ocurrencia de un evento excluye la ocurrencia de otro evento (slo uno de ellos tiene lugar a la vez).Ejemplo: Para el lanzamiento de dado puede ocurrir que sale el nmero 4, pero no sale 3 a la vez.

    Evento colectivamente exhaustivo: aquellos que, en un experimento aleatorio, son mutuamente excluyentes y constituyen la totalidad de los resultados posibles para el experimento en cuestin.

    Complemento de un evento A: consiste en todos los resultados del espacio muestral que no pertenece al evento A.Ejemplo en una grupo de 20 pacientes de esquizofrenia 3 intentaron el suicidio el complemento del evento es que 17 no intentaron suicidio.

    Eventos independientes: aquellos en los que la ocurrencia de uno de los eventos no suministra informacin con respecto a la ocurrencia o no de otro evento, es decir, que la ocurrencia de un evento no tiene influencia en la ocurrencia de otro.

  • Tres tipos de probabilidades:Enfoque clsico.Enfoque de frecuencia relativa.Enfoque subjetivo.

    Probabilidad clsica: principio bsico de la probabilidad.

    La probabilidad clsica tambin se llama probabilidad a priori, porque es la probabilidad que se establece atendiendo consideraciones sobre la simetra o la regularidad de resultados simples.

    Frecuencia relativa de ocurrencia: Probabilidad a posterioriEs la probabilidad establecida por la observacin experimental de la ocurrencia de un resultado. Esta probabilidad se basa en la forma i) la frecuencia relativa observada de un evento en un gran nmero de ensayos; ii) la proporcin de las veces que un evento sucede a la larga cuando las condiciones son estables.

    Enfoque subjetivo: se basan en las creencias e ideas del que realiza la evaluacin de las probabilidades.

  • Probabilidad de un evento:Ejemplo de una muestra con dos eventos del tipo de colegio de donde provienen los estudiantes de psicologaPodemos decir que la probabilidad que el alumno elegido al azar provenga de un colegio estatal o pblico es 0.66, resulta de dividir 200/300.La probabilidad de un evento esta entre cero y uno0 Pr(A) 1

    Tipo de colegioFrecuenciaFrecuencia relativaEstatal2000.66Privado1000.34Total3001.00

  • Ejemplo de probabilidadEn el centro de la ciudad de Chiclayo, el 46% de la poblacin tiene una edad de 25 aos o menos; el otro 54% tiene una edad mayor. Si se extrae de esta poblacin una persona, la probabilidad de que sta tenga 25 aos o menos de edad es 0.46, cifra que corresponde a la fraccin de la poblacin que corresponde a las personas que tienen esa edad.

    Distribucin de nmero de personas segn edades

    EdadPersonasMenor a 25 aos120,076Mayor a 25 aos140,872Total260,948

  • Ejemplo de probabilidadCuando nace un beb, este puede ser hombre o mujer. Si es cierto que existe una posibilidad igual de que un recin nacido sea hombre o mujer, entonces la grfica que a continuacin se muestra proporciona la distribucin terica de las frecuencias relativas de hombres y mujeres en una familia que tiene cuatro hijos.

    Mediante el empleo del histograma anterior, cul es la probabilidad de que una familia con cuatro hijos:

    Grfico1

    0.0625

    0.25

    0.375

    0.25

    0.0625

    Serie 1

    Nmero de varones

    Frecuencia relativa de nios varobes

    Hoja1

    Serie 1

    00.0625

    10.25

    20.375

    30.25

    40.0625

    Para cambiar el tamao del rango de datos del grfico, arrastre la esquina inferior derecha del rango.

  • a) no tenga varones p(0) = 0.0625

    b)tenga dos varones p(2) = 0.375

    c) todos sean varones p(4) = 0.0625

    d) tenga dos o ms varones p(2)+p(3)+p(4)=0.375+0.25+0.0625 =0.6825

    e) tenga un varn o tres varones.p(1)+p(3) = 0.25+0.25 = 0.50

    Grfico1

    0.0625

    0.25

    0.375

    0.25

    0.0625

    Serie 1

    Nmero de varones

    Frecuencia relativa de nios varobes

    Hoja1

    Serie 1

    00.0625

    10.25

    20.375

    30.25

    40.0625

    Para cambiar el tamao del rango de datos del grfico, arrastre la esquina inferior derecha del rango.

  • Algunas reglas de Probabilidad:Regla de la adicin probabilidad total:

    P(A U B) = P(A) + P(B) P(A B)

    La probabilidad de que A o B ocurran cuando A y B no son mutuamente excluyentes es igual a la probabilidad de que ocurra A ms la probabilidad de que ocurra B menos la probabilidad de que A y B ocurran simultneamente.

    P(A B)

  • Ejemplo de probabilidad de la adicin o totalUn estudio clnico de una universidad en una poblacin ha encontrado que la probabilidad de que se den trastornos en el sueo (A) es 0.70, la probabilidad de que se den trastornos de tipo depresivo (B) es 0.20, y la probabilidad de que tengan trastorno de sueo y depresivos es 0.10. Si extraemos un sujeto de dicha poblacin al azar. cul es la probabilidad de que se tenga ambos trastornos?SolucinDefinicin de eventos:A: poblacin con casos de trastornos en el sueo. P(A) = 0.70B: poblacin con casos de trastornos depresivos. P(B) = 0.20

    P(A y B) = P(A B) = 0.10

    La probabilidad de que se tengan ambos trastornos:

    P (A U B) = P(A) + P(B) P(A B)P (A U B) = 0.70 + 0.20 0.10 P (A U B) = 0.80

  • PROBABILIDAD CONDICIONALSea un suceso de un espacio muestral tal que P(B)>0. La probabilidad de que ocurra un suceso A, sabiendo que al realizarse el experimento ocurri B, se llama probabilidad condicional de A dado B y se indica P(A/B).

  • Ejemplo probabilidad condicional:A un grupo de mil sujetos se les pas un test de inteligencia y se midi su rendimiento acadmico (RA). Los resultados se resumen en la siguiente tabla:

    Si seleccionamos al azar un sujeto que resulta ser superior en inteligencia, Cul es la probabilidad de que sea apto?SolucinCon la definicin de los eventos:S : Ser superior en inteligenciaS : No ser superior en inteligenciaR: Ser apto en rendimientoR: No ser apto en rendimiento

    RENDIMIENTO ACADMICOINTELIGENCIASe definen los sucesos: S: Ser superior en inteligencia R: Ser apto en rendimiento.InferioresSuperioresAptos200300No aptos400100

  • Para determinar la probabilidad pedida se suman las filas y columnas:Se plantea la propuesta para resolver si al seleccionar al azar un sujeto que resulta ser superior en inteligencia, Cul es la probabilidad de que sea apto?

  • En una compaa trabajan 100 hombres y 100 mujeres, 80 hombres y 10 mujeres son cientficos. cul es la probabilidad de que al escoger aleatoriamente una persona de la lista de empleados esta sea:Estos eventos se trasladan a una tabla de doble entrada o tabla de contingencia de la forma:Con estos eventos definidos se pueden calcular las probabilidades: a) mujer p(mujer) = p(M) = 100 / 200 = 0.50, es la probabilidad que sea mujer b) cientfico p(cientfico) = p(C) = 90 / 200 = 0.45, es la probabilidad que sea cientficoc) mujer y cientfico p(mujer y cientfico) = p(M C ) = 10/ 200 = 0.05d) Sea cientfico dado que es mujer P(C/M) = p(M C ) / P(M)= (10/200) / (100/200) = 0.10

    C: Es cientficoC : No es cientficoTotalH: Hombre8020100M: Mujer1090100Total90110200

    *