CONDICIONAMIENTOINSTRUMENTAL
Ley del Efecto - Thorndike
La conexión estimulo – respuesta se imprime cuando un placer resulta del acto y se errade cuando no es así.
a) Lo que sucede como resultado de la conducta influirá sobre esa conducta en el futuro.
b) Si produce placer tiene la probabilidad de repetirse, si produce incomodidad no lo hará.
Condicionamiento Operante - Skinner
Las respuestas de un organismo no son necesariamente provocadas por algún estimulo, sino que están influidas por
las consecuencias que ellas determinan en el ambiente (reforzadores).
El ser humano puede ser estudiado aisladamente y no necesariamente en grupos, luego pueden hacerse
generalizaciones.
Mediante una cuidadosa recolección de datos puede lograrse un mayor progreso hacia la predicción y el control de la
conducta, que a través de la formulación de grandes teorías.
ANTECEDENTE CONDUCTA CONSECUENCIA
Caja de SkinnerSe diseño para que una rata o pichón hiciera cosas adentro en lugar de escapar de ella.
Tiene una palanca, bajo la cual se encuentra una charola de comida.
El experimentador tiene el control total del
ambiente del animal, pero es el animal quien
tiene que hacer el trabajo.
Caja –problema.
Thorndike skinner
La conducta debe ser instrumental para generar
respuestas y así la conducta se repita.
Aprendizaje por ensayo y error.
Caja de skinner (La rata trabaja dentro no se escapa) Y el
experimentador tiene el control.
Skinner tiene términos objetivos y descriptivos.
Thorndike racionales.
La conducta no debe ser respondiente si no operante.
( No es una conducta refleja y todos los factores influyen)
Un estimulo es la señal para que la respuesta ocurra. La conducta se aprende después de ganarse algo.
Si la respuesta genera placer se queda si no se errade.
Respuesta definida
El tipo de respuesta que se escoge puede ser cualquiera, con tal que se pueda observar
objetiva y confiablemente.
REFORZADOR
El reforzador tiene que ser un suceso cuya presencia aumenta el nivel de la respuesta definida.
cualquier cosa se acepta como reforzador si logra aumentar el nivel de la respuesta que se pretende.
Motivación.
La respuesta tiene que ocurrir antes que pueda reforzarse,
esto significa que el organismo esta motivado para este
comportamiento.
CORRELACION DEL REFORZADOR CON LA APARICION DEL TIPO DE RESPUESTA
El reforzador puede ocurrir despues de cada respuesta, despues de cada decima respuesta; pero cualquiera que
sea la relacion, tiene que ser predecible.
Lo mas importante es que la relación entre respuesta y reforzador sea confiable o
segura y predecible.
EL REFORZADOR TIENE QUE SEGUIR A LA RESPUESTA
Inmediatamente de producirse la respuesta se da el
reforzador.
La esencia del aprendizaje por reforzamiento es que el nivel de la respuesta esta a un nivel insignificante antes del reforzador, y que el nivel de ejecución
aumenta con el reforzador.
Medidas para el manejo de las variables del reforzamiento
- FrecuenciaNumero de respuestas por unidad de tiempo.Antes del aprendizaje la conducta ocurre con poca frecuencia, después de que se inicia el proceso de aprendizaje aumenta.
- LatenciaTiempo que transcurre entre la presentación de una señal y la
aparición de una respuesta
Conducta Supersticiosa
• Conducta sin sentido que ocurre coincidiendo accidentalmente con un reforzador, lo que aumenta la probabilidad de que ocurra en el futuro.
• Ocurre el numero suficiente de veces para que vuelva a repetirse.
* Esta conducta SE APRENDE.
REFORZADORES PRIMARIOS Y SECUNDARIOS
El reforzador primario pertenece íntimamente a los reforzadores que sirven para la supervivencia biológica.
Por el contrario; el reforzador secundario depende de una historia de aprendizaje; la experiencia determina si un estimulo es un reforzador o no.
- Teoría de la reducción del impulso- Teoría de contigüidad
Teorias del Reforzamiento
TEORIA DE REDUCCION DE IMPULSOS
Hull afirma que el organismo dispone de un jerarquia de
respuestas en cualquier situación de aprendizaje instrumental,
y que una de ellas lleva al reforzamiento y las otras no.
Sostiene que la supervivencia biológica exige que el organismo se desarrolle en condiciones suficientes de
determinados estados; y que cuando hay una desviación de un estado optimo se produce un estado de necesidad
primaria o fundamental.
TEORIA DE LA CONTIGUIDAD
Una combinación de estímulos que ha acompañado a un movimiento tendera, a
repetirse, a ser seguida por ese movimiento.
La función de una recompensa es la de apartar al animal de los estímulos que actúan inmediatamente antes de la recompensa. esto evita que el animal haga otras conductas contrarias al estimulo y por tanto, cuando los estímulos ocurren de nuevo se repite la respuesta.
Reforzador positivo
Es un estimulo que aumenta o disminuye
la fuerza de una respuesta o la
probabilidad de que suceda.
Las conductas condicionadas reciben el
nombre de comportamiento operante..
(comportamiento controlado por su consecuencia)
Los estímulos no sirven como reforzadores ya que dependen del
sujeto.
El termino recompensa se usa incorrectamente
como sinónimo de reforzador positivo.
Por tratamiento se pueden obtener 5 resultados según se desea, al modificar una conducta…
1) Se adquiera o desarrolle.
2) Se Fortalezca3) Se mantenga 4) Disminuya o 5) Suprima por
completo.
La efectividad de un reforzador positivo depende de su tamaño, cantidad, tipo o calidad y
es aun mejor si sigue inmediatamente a la conducta deseada.
El reforzador negativo también incrementa la
conducta.
Reforzador negativo
Reforzamiento por eliminación de un
estimulo.
No debe confundirse con el castigo.
Los reforzadores negativos pueden ser estímulos no condicionados primarios como:
O secundarios como…
El reforzador negativo actúa en dos tipos de aprendizaje:
Condicionamiento de escape:
El organismo aprende a dar una respuesta que pone fin a una
situación aversiva.
Condicionamiento de evitación:
Tiene lugar cuando un organismo responde ala señal de la ocurrencia de un suceso
desagradable, de modo que hace posible su evitación,.
Castigo
Estimulo que debilita o suprime la conducta o respuesta.
Pueden ser estímulos incondicionados o condicionados.
Condicionados: Amenazas, multas, supresión de privilegios.
Incondicionados: choque eléctrico, luz, ruido intenso, golpes.
Castigo Tipo 1
A una respuesta le sigue la aparición de un estimulo aversivo.
Castigo Tipo 2
La conducta es seguida por la remoción de un reforzador
positivo.
Fortalece la conducta que tiene como resultado su supresión o evitación.
REFORZADOR POSITIVO
Debilita las conductas que tienen como resultado
su presentación.
REFORZADOR NEGATIVO
CASTIGO
Fortalece la conducta que produce su presentación.
Extinción
La extinción es la eliminación de una consecuencia que mantiene o intensifica una conducta. Es un método
eficaz para disminuir conductas indeseables.
La extinción requiere la eliminación del
reforzador responsable de
mantener la conducta inapropiada.
Existen dos etapas de conducta-respuesta
La primera se da inmediatamente después de que se ha eliminado el reforzador que mantiene una conducta, esta por lo general aumenta o disminuye con violencia.
Durante la segunda, la conducta blanco disminuye o aumenta sistemáticamente(siguiendo un orden)
Se podrán encontrar dos dificultades:
La primera es la consistencia o sea, que el reforzamiento positivo se debe eliminar cada vez que la conducta ocurra
con frecuencia, pero si la conducta se refuerza intermitentemente, esto es no cada vez que ocurra sino en
ciertas ocasiones y en otras no, será mas difícil que se logre la extinción.
La segunda es controlar el suministro del reforzador, si no
se posee el control del ambiente reforzante del individuo, puede haber
alguien que este reforzando el comportamiento preciso que se trata de
extinguir.
Otra característica de la extinción es :
La recuperación espontanea.
Con frecuencia tras haberse extinguido el comportamiento, regresa cuando se presenta una situación idéntica o similar ala que antes dio origen al reforzamiento de la respuesta extinguida.
Se entregara el reforzamiento periódicamente a intervalos irregulares de tiempo, como en los programas de TF.
El reforzamiento no depende de la ejecución de una respuesta, el reforzador se da a partir de un promedio de tiempo.
Programas de reforzamiento
Otro aspecto importante de skinner tiene que ver con los efectos de la frecuencia en que se presentan los
reforzadores sobre la conducta.
Cada uno se asocia a un patrón característico
de respuestas.
Se dividen en dos :
1) Programas simples
2) Programas complejos
PROGRAMAS SIMPLES
• REFORZAMIENTO CONTINUO:
Se refuerza la conducta a cada respuesta. es útil para moldear la conducta.
Este programa no es común en el ambiente natural, ya que
la conducta se refuerza en ocasiones y en otras no.
• REFORZAMIENTO INTERMITENTE:
Cuando el reforzamiento ocurre en algunas ocasiones pero en otras no.
A su vez se divide en:
• RAZÓN FIJA:• Cuando tiene que ocurrir un número determinado de
respuestas antes de que sobrevenga el reforzador, y este número es constante en todo el aprendizaje.
• RAZÓN VARIABLE:• El reforzamiento ocurre después de un número variable
de respuestas y no después de un número fijo• La conducta deseada debe estar bien establecida en el
programa de razon fija antes de pasar a la de razón
variable.
• INTERVALO FIJO:• Este programa es periodico, ya que se refuerza la primera respuesta que ocurra
después de que ha transcurrido un periodo especifico de tiempo.
• Se ha observado que en programas de intervalo fijo, entre más largo sea el intervalo entre reforzamientos,
más bajo es el nivel de desempeño.
• INTERVALO VARIABLE:
• Este programa es aperiodico, las respuestas se refuerzan después de intervalos de diverso tamaño, cuya duración tiene un promedio de acuerdo al valor que define al programa.
• Al igual que en el programa de intervalo fijo, sólo la primera respuesta después del intervalo recibe el reforzador.
• PROGRAMA DE TIEMPO FIJO:
• Se entrega un reforzador después de un determinado periodo de tiempo, independientemente de la conducta.
Reforzamiento diferencial de tasas bajas (RDTB)
Se refuerza la respuesta solo si ocurre después de un intervalo especifico de tiempo a partir de la ultima respuesta.
Reforzamiento diferencial de tasas altas (RDTA)
En este programa se requiere que ocurra un mínimo de repuestas en un periodo determinado.
Se refuerza una respuesta que es incompatible con aquellas no deseadas.
Reforzamiento diferencial de conducta incompatible (RDCI)
Programas Complejos (Combinaciones de los programas simples)
• Programa MúltipleUna respuesta se encuentra bajo
control de 2 o más programas
simples, cada uno asociado con un
Estimulo particular.
• Programa Encadenado (CADENA)Se utilizan diversos programas uno seguido
del otro (cuando un programa termina o a
partir de una señal comienza el siguiente).
MULT IF10 RV15
CADENA RF10 IF15 RV20
Moldeamiento
Es un método por el cual se puede establecer una conducta que por lo general no emite un
individuo, o que quizá jamás ha producido o tiene muy poca probabilidad de hacerlo.
Es un proceso gradual de reforzar selectivamente la conducta que se
encuentra mas próxima a la conducta final que deseamos.
Para iniciar la intervención se necesita que la conducta se exhiba, y cuando esta ocurre debe recompensarse de
inmediato con un reforzador potente .
Hay dos formas de intervenir para moldear la conducta:
Progresiva Cadena
Instigación
Ayuda externa que se le puede dar a un organismo.
Modelamiento
Es aprendizaje mediante observación e imitación.
Como método de modificación de conducta se muestra al sujeto una conducta individual para
que este la imite.
Según Bandura la exposición a un modelo
tiene tres efectos.
Modelamiento o aprendizaje observacional: El sujeto imita en forma prácticamente idéntica al modelo.
Efectos inhibidores y des inhibidores: Imitar a un modelo a fin de inhibir o desinhibir una conducta .
(El niño puede imitar cuando a otro lo premian por hacer algo bueno o viceversa)
Producir o facilitar una respuesta: La conducta modelo se utiliza para facilitar la ocurrencia de una conducta ya
adquirida . ( Ej. decir gracias)
Antes de aplicar el modelamiento se debe considerar…..
¿El sujeto esta capacitado para seguir el modelo?
¿Se recompensara al sujeto por imitar al modelo?
¿El modelo es bueno?
Un modelo que es demasiado brillante,
bueno, rápido etc., será rechazado por el sujeto.
Paradigmas de diseño para un solo sujeto.
Periodo experimental BLínea base A
Medida de la variable dependiente
Tiempo (días, sesiones, periodos)
Diseño A-B
Diseño A-B-A
Periodo experimental B
Línea base A
Medida de la variable dependiente
Tiempo ( días, sesiones, periodos)
Regresión a la línea base (inversión)
A
Periodo experimental
B
Línea base
A
Medida de la
variable dependiente
Tiempo ( días, sesiones, periodos)
Regresión a la línea base
A
Reinicio del tratamiento
B
Diseño A-B-A-B
Variaciones de diseño para un solo sujeto
Periodo experimental
B
Línea base
A
Medida de la variable dependiente
R.D.O.C.
Reforzamiento diferencial de otras
conductas C
Antes del tratamiento
B
Tiempo ( días, sesiones, periodos)
Top Related