recaptcha는 당신이 그림의 가짜 번역을 입력하지 않았다는 것을 어떻게 알 수 있습니까?


22

내가 이해 한 바에 따르면 Captcha는 필터, 노이즈 및 기타 기타 알고리즘을 적용하여 왜곡 된 텍스트입니다. 따라서 사람의 독해력이 사람의 독해력인지 알아 내기 위해, 그들이 대답 한 것을 알려진 답과 비교합니다.

이제 ReCaptcha를 읽으면서 표시되는 단어는 OCR로 번역 할 수없는 단어라고 말합니다. 또한 recaptcha는 이러한 이미지를 번역하는 데 사용됩니다. 그것은 당신이 정말로 당신의 독서에 맞았는지 아니면 그냥 물건을 만들고 있는지를 어떻게 알 수 있습니까?

그것이 무엇을 말했는지 안다면, recaptcha에서 번역 자료로 사용되지 않을 것입니다. 텍스트의 내용을 모르는 경우 어떻게 답변의 유효성을 검사합니까?

아마도 이것이 번역 된 것으로 플래그를 지정하기 전에 거대한 샘플 크기를 가진 확률 기반 분석 일 것입니다.

누구든지 이것에 대한 답이 어디에 있는지 알고 있습니까?


3
관심있는 것은 Time poll에서 4chan / anonymous prank입니다. 두 번째 단어의 크라우드 소싱 검증에서 결함을 악용 한 "마블 케이크, 게임".
DanBeale

답변:


33

책 페이지는 기본적으로 사진으로 스캔 된 다음 "광학 문자 인식"(OCR)을 사용하여 텍스트로 변환되어 reCAPTCHA 뒤의 컴퓨터 프로그램에 알려진 한 단어와 그렇지 않은 한 단어가있는 이미지 형태로 웹에 공급됩니다. 아직 알려져 있습니다.

그런 다음 사용자는 두 단어를 모두 입력하고 답을 알고있는 단어를 풀면 새 답에 대한 답이 올바른 것으로 가정합니다. 그런 다음 시스템은 다른 사람에게 새로운 이미지를 제공하여 원래의 답변이 올바른지 여부를보다 확실하게 확인할 수 있습니다. 따라서 시스템은 시간이 지남에 따라 개선되는 자체 개선 서비스입니다.

http://www.google.com/recaptcha/learnmore


22

이것이 reCaptcha가 단어 를 입력하게하는 이유 입니다. 단어 중 하나는 이미 알려져 있으며 단어 중 하나는 알려져 있지 않습니다. 보안 문자 통과 여부는 알려진 단어에 대한 답변 방법에 따라 다릅니다. 다른 (알 수없는) 단어에 대한 답은 같은 단어에 대한 다른 응답과 함께 사용되어 알려진 단어로 바뀝니다.


4
... 시간이 지남에 따라 점점 더 사용이 좌절되고 5 번 연속 실패하면 바보 / 로봇임을 확신시킵니다. :-(
Sirex

이상해 ... 나는 기억할 수있는 것을 실패한 적이 없다.
Paul

@Sirex 나는 그렇게 생각했지만, 코퍼스 텍스트의 크기가 숫자 보안 문자 항목에 비해 일정하거나 줄어들 경우에만 이것이 사실이라는 것을 깨달았습니다. 진실은 말뭉치 텍스트가 성장하고 있다는 것입니다. 문제는 성장이 전반적인 보안 문자 사용의 성장과 보조를 맞추는 지 여부입니다.
Joel Coehoorn

그래 나는 엄청나게 어려운 reCaptchas를 많이 보았다. 알려진 단어조차 모호한 곳.
Sirex
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.