Un poco de ciencia

Tema 2.- Un poco de ciencia

 

El entrenamiento con clicker se basa en los estudios y análisis del comportamiento realizados por B. F. Skinner.

La premisa en las que se basa es:

Todo comportamiento tiene una consecuencia.
Si la consecuencia es algo agradable, ese comportamiento tiene más probabilidad de volver a producirse.
Si la consecuencia es algo desagradable, el comportamiento se producirá con menor probabilidad.

 

Para Skinner este es el método universal de aprendizaje.

El comportamiento se produce para conseguir algo agradable o para evitar algo desagradable.

En el entrenamiento con clicker utilizamos el refuerzo positivo, normalmente un premio, para que el comportamiento que realiza nuestro caballo y que nosotros queremos que se produzca, tenga más probabilidad de repetirse.

Pero como el comportamiento se produce de forma continua, a veces es muy complicado premiar en el instante preciso en el que el caballo hace eso que queremos que haga. Para poder decirle al caballo cuál es el comportamiento exacto que queremos y que vamos a premiar, y por ello, tenderá a producirse más veces, utilizamos un marcador, el clicker.

Caliente caliente, frío frío

No se si habrás jugado al juego de caliente o frío, o tal vez este juego sea de hace ya demasiado tiempo. En el juego se le daba pistas a un jugador para que encontrara algo que habíamos escondido. Si se acercaba al lugar se le decía caliente caliente. Si se alejaba, frío frío. Así le íbamos guiando hacia el lugar donde queríamos que llegara. El click es decir al caballo – caliente, caliente –

 

Con nuestros delfines del tema anterior, los entrenadores introducían un aro debajo del agua, y cuando el delfín miraba el aro, tocaban el silbato y le daban la comida.  Esto hacía que este comportamiento se repitiera más veces. Luego iban dando forma a este comportamiento. Cuando el delfín se giraba hacia el aro, silbato y recompensa. Cuando tocaba el aro, silbato y recompensa. Cuando introducía su cabeza, cuando pasaba a través del aro, y así poco a poco creando un comportamiento mucho más complejo, como saltar y pasar por el aro. Es decir, desde un comportamiento simple, podemos avanzar a un comportamiento complejo, una vez que está bien establecida la conexión entre comportamiento+señal+premio. El silbato de los delfines es nuestro clicker.

Y ahora llega todo eso de los refuerzos positivos y negativos que seguramente has visto cuando se habla de comportamiento, y que a veces cuesta entender. Mejor lo vemos en la siguiente lección.

error: Content is protected !!