부정적인 강화 : 개체를 교체하는 방법?

18

나의 Beauce Shepherd는 이제 9 개월이되었습니다. 우리는 개인 트레이너와 함께 행동 교육 수업을 받았으며 모든 것이 잘 진행되었습니다. 개가 원하는대로하고, 지금, 그는 정말 잘 들어요!

트레이너의 제안에 따라 일부 행동은 긍정적으로 강화되었고 일부는 부정적으로 강화되었습니다. 현재 우리가 겪고있는 문제는 부정적으로 강화 된 행동에 있습니다. 우리는 소리를 내기 위해 금속 상자를 사용하고 있습니다. 개는 그것을 싫어하고 순종합니다. 항상 "no"뒤에 두 번째 제재로 사용됩니다. 모든 것이 완벽하게 작동하므로 이제 상자가 올바르게 작동함에 따라 더 이상 상자를 사용할 필요가 없습니다.

문제는 우리가 상자를 가지고 있지 않으면 소리가 들리지 않아서 원치 않는 동작에 관여한다는 것을 알았을 때 상자를 다른 것으로 교체해야한다고 생각합니다. 우리가 상자를 가지고 다닐 필요가 없기 때문에 문제가되기 시작했습니다. 상자가 없으면 기회를 사용할 것이기 때문입니다.

상자를 우리 몸이나 다른 것으로 바꾸어이를 해결할 수있는 방법이 있습니까?

참고 : 그는 한 달 전에 죽었고, 우리를 조금 덜 용감하게하지만 상자를 가지고 있지 않을 때도 여전히 그렇게합니다.

감사합니다

dogs behavior training

— 살케 터
소스

1

아마 트레이너에게이 질문을해야하지만, 부정적인 강화 (금속 상자)가 원치 않는 행동을 억제하는 데 효과가 있다면, 이제는 좋은 행동을 강화하지 않겠습니까? 예를 들어, 내 개가 소파에서 계속 올라가면 (1) 금속 상자를 흔들어 낙담하지 않을 수 있습니다. 소파 근처에 바닥이나 비슷한 곳에 놓았습니다.

— Steve D

1

:) 나는 개가 관찰 한 후에 개가 스스로 그런 것들을 배울 수있는 방법을 좋아합니다. "상자가 없습니다. :) :) :)

— woliveirajr

10

작동 조건을 논의 할 때마다 동일한 언어를 사용하면 도움이됩니다.

강화 : 행동의 빈도를 높이기 위해 고안된 행동
처벌 : 행동의 빈도를 줄이기 위해 고안된 행동
긍정적 : 자극의 존재
부정적 : 자극의 부재

이 용어는 네 가지 조합을 형성 할 수 있습니다 ( NB : 괄호 안의 예는 조언이 아니라 예 입니다).

긍정적 강화 : 행동의 빈도를 높이기 위해 자극을 제시하십시오 (예 : 개가 명령을받을 때 치료를 제공하십시오)
부정적인 강화 : 행동의 빈도를 높이기 위해 자극을 제거하십시오 (예 : 우체부는 개가 짖은 후에 사라집니다)
긍정적 처벌 : 행동의 빈도를 줄이기위한 자극을 제시하십시오 (예 : 개가 카펫에서 소변을 볼 때 개를 때리십시오)
부정적 처벌 : 행동의 빈도를 줄이기 위해 자극을 제거하십시오 (예 : 개가 당신에게 뛰어 올 때 방을 나가십시오)

실제로, 이들은 혼동 될 수 있습니다. 예를 들어, 상자로 소음을내는 것은 행동의 빈도를 줄 이도록 설계된 자극이므로 기술적으로 긍정적 인 처벌의 예입니다. 그러나 개가 올바른 행동을 수행하면 소음을 멈 추면 자극을 제거 할 수 있습니다. 올바른 행동의 빈도를 높이십시오.

그러나 그것은 당신의 개가 수행하는 올바른 행동이 있다고 전제합니다. 원하지 않는 동작이 무엇인지 또는 강화하려는 원하는 대체 동작이 있는지 지정하지 않습니다. 당신이 소음으로하는 모든 일이 그를 막으려 고한다면, 부정적인 강화보다는 처벌을 제공하는 것입니다.

두 경우 모두, 문제의 일부는 아마도 당신이 일차 강화제와 처벌 자, 즉 개가 배울 필요가없는 것을 사용하고 있다는 것입니다. 예를 들어 음식은 기본 강화제입니다. 개는 음식을 배우지 않아도 좋은 것을 알고 있습니다. 또한 소음은 개가 듣기에 불편하기 때문에 1 차 처벌을받습니다. 대조적으로 이차 강화제와 처벌은 개가 배운 것들입니다.

전형적인 예는 파블로프의 종으로, 개에게 음식을 제공 할 때마다 울릴 것이라고한다. 일차 강화제와 자극을 일관되게 연결함으로써, 자극은 이차 강화제로 작용하기 시작할 수 있습니다. 즉, 개는 종이 음식의 도착을 알리고 그에 따라 반응한다는 것을 알게됩니다.

당신은 소음과 함께 개에게 말을 할 때 "아니오"라는 단어를 사용한다고 말하고 있습니다 (엄청난 목소리로, 개는 안목을 억 누르는 데 능숙합니다). "아니오"는 칭찬이 2 차 강화제 역할을 할 수있는 것과 같은 2 차 처벌 자 역할을해야합니다. 그러나 때때로 "아니오"라고 말하고 소음을 내지 않기 시작하여 실제 소음을 점차적으로 단계적으로 제거하지 못한 것입니다.

문제는, 지금까지 당신의 개는 상자가없는 "아니오"는 1 차 처벌을 의미하지 않는다는 것, 즉 두 개가 서로 관련되어 있지 않다는 사실을 알게되었다는 것입니다.

낙담하고 싶은 실제 행동을 설명하는 새로운 질문을 개설 할 것을 제안하며, 개가 원하는 것을 배우기 위해 전체 작동 조건을 사용하는 방법을 찾는 데 도움을 줄 수 있습니다. 할 것.

— 토마스
소스

5

@ThomasH는 훌륭한 해답이며 2 차 처벌을 매우 정확하게 사용하는 문제를 다루고 있습니다.

여기서는 문제의 두 가지 측면에 대한 의견을 추가하고 있습니다.

잘못된 행동을 처벌 대 올바른 동작을 강화

"이론"이 "강화 기 쪽"과 "처벌 자 쪽"에서 동일하게 작용하고 그 효과가 효과적 일 수 있더라도, 행동을 억제하는 것이 개에게 대신 무엇을해야 하는지를 가르치지 않고 주로 훈련의 "아니오"부분은 미세 관리로 이어진다 : 개에게 그가하지 말아야 할 것을 끊임없이 가르쳐야한다. 개가 주어진 상황에서 X를해서는 안된다는 것을 알게 되더라도, Y, Z 등을 자유롭게 수행 할 수 있습니다. 대신 긍정적으로 W를하도록 가르치면 (강한) 대신 악의적 인 원을 막을 것입니다. 모두를 행복하게하십시오.

변동율 강화 / 처벌

@ThomasH는 보조 강화제 또는 처벌의 개념을 설명했습니다.

명심해야 할 한 가지 측면은 기본 강화제 / 처벌과는 달리, 보조 일정 은 가변 일정을 사용하여 보상해야한다는 것 입니다.

음식은 기본 강화제입니다. 개는 음식 한 조각을 얻을 때마다 강화됩니다.

그러나 "예"또는 클릭과 같은 키워드는 보조 강화 도구가 될 수 있습니다. 후속 기본 철근에 연결됩니다. 요점은 개가 1 차 강화제에 의해 2 차 강화제가 보상을 받는다는 것을 알게 되었기 때문에 효과가 있다는 것입니다. 이것이 배운 후에는 실제 보상으로 링크를 유지해야합니다. (훈련 중) 시작 시마다 보상이 올 때마다 다양한 일정으로 보상받을 수 있습니다. 가변 일정은 개가 1 차 보상이 언제 올지 예측할 수 없기 때문에 실제로 연결을 강화하고 있습니다.

이것은 일반적으로 3 차 강화제에 적용된다는 점에 유의 하십시오. 큐 "앉아"는 실제로 강화제입니다. 다른 강화제 (예 : 클릭)로 이어질 수 있으며 실제 보상으로 이어질 수 있습니다.

우리는 보통 2 차 강화제 (클릭)를 1 차 강화제 (예 : 식품 보상)와 분리하지 않습니다. 이렇게하면 둘 사이의 연결이 매우 강해지며 큐 (3 차 강화 기)와 클릭 사이에 가변 속도가 적용됩니다.

그러나 처벌의 경우 실제 "3 차 처벌"이 없으므로 "보강"의 가변 비율 (이 경우 처벌로 이해 됨)은 2 차 처벌 ( "아니오")과 실제 처벌 ( 상자).

— 세드릭 H.
소스