다음은 소스에서 직접 설명입니다 (거의)
최소 22:03
볼 가치가있는!
기본적으로 Douglas Merrill 전 Google CTO에 따르면 다음과 같습니다.
1) Google에 철자가 틀린 단어를 씁니다.
2) 원하는 것을 찾지 못했습니다 (결과를 클릭하지 마십시오)
3) 단어의 철자가 틀렸다는 것을 알고 검색 창에 단어를 다시 씁니다.
4) 원하는 것을 찾으십시오 (첫 번째 링크를 클릭하십시오)
이 패턴은 수백만 번 곱 해져서 가장 일반적인 철자가 무엇인지, 그리고 가장 "일반적인"수정이 무엇인지 보여줍니다.
이런 식으로 Google은 거의 모든 언어에서 철자 교정을 제공 할 수 있습니다.
또한 이것은 밤새 모든 사람들이 "nigth"구글이 그 단어를 대신 제안하는 것처럼 밤에 철자를 시작한다는 것을 의미합니다.
편집하다
@ThomasRutter : Douglas는이를 "통계 기계 학습"으로 설명합니다.
쿠키를 사용하여 어떤 사용자가 어떤 쿼리를 가져 왔는지 알기 때문에 누가 쿼리를 수정하는지 알고
사용자가 쿼리를 수행하고 사용자 중 10 %만이 결과를 클릭하고 90 %가 되돌아 가서 다른 단어 (정확한 단어 포함)를 입력하면 이번에는 90 %가 결과를 클릭하면 찾은 것을 알게됩니다. 정정.
또한 이들이 표시하는 모든 링크에 대한 정보를 가지고 있기 때문에 두 개의 서로 다른 "관련된"쿼리인지 알 수 있습니다.
또한, 이제 철자 검사에 컨텍스트를 포함 시키므로 컨텍스트에 따라 다른 단어를 제안 할 수도 있습니다.
철자가 자동으로 수정되도록 컨텍스트가 어떻게 고려되는지를 보여주는 이 Google 웨이브 데모 (44m 06s)를 참조하십시오 .
여기에 자연어 처리 방법이 설명되어 있습니다.
마지막으로 자동 기계 번역 (@ 1h 12m 47s)을 믹스에 추가하여 수행 할 수있는 작업에 대한 멋진 데모입니다 .
콘텐츠에 직접 건너 뛰기 위해 비디오에 분과 초의 앵커를 추가하여 작동하지 않으면 페이지를 다시로드하거나 손으로 마크를 스크롤하십시오.