첫째, 그것은 단지 quip이며 틀립니다. Google에는 재능있는 통계 학자, 정보 검색 전문가, 언어 학자, 경제학자, 일부 심리학자 등이 있습니다. 이 사람들은 상관 관계와 인과 관계의 차이에 대해 많은 비 통계 전문가를 교육하는 데 많은 시간을 소비합니다. 그것이 큰 조직이라는 것을 감안할 때, 주머니, 심지어 큰 주머니, 무지가있을 수 있지만 주장은 분명히 거짓입니다. 또한 많은 교육이 고객, 특히 광고주를 대상으로합니다.
더 깊은 답 : 그 차이는 매우 중요합니다. 검색 결과 순위를 확인하고 "상관성"을 넘어서 유사성, 점수 함수 등을 포함하도록 확장 할 수 있습니다. 일부 페이지는 특정 쿼리에 대해 좋은 결과로 측정됩니다. 여기에는 순위에 중요한 다양한 예측 기능이 있습니다. 쿼리에 대해 좋은 결과 인 이러한 우수한 페이지와 달리 동일한 쿼리에 대해 매우 나쁜 결과 인 페이지 인 웹 페이지 집합입니다. 그러나 해당 페이지의 제작자 는 수치적인 관점에서 좋은 페이지처럼 보이도록 많은 노력을 기울 입니다.텍스트 일치, 인터넷 연결 등과 같은 그러나 이러한 페이지가 좋은 페이지와 숫자 적으로 "유사"하기 만한다고해서 이것이 실제로 좋은 페이지라는 의미는 아닙니다. 따라서 Google은 합리적인 기능이 좋은 페이지와 나쁜 페이지를 구분하는 (별도의) 기능을 결정하기 위해 많은 노력을 기울이고 투자 할 것입니다.
이것은 상관 관계와 인과 관계는 아니지만 그보다 더 깊습니다. 특정 검색어에 대한 양호한 페이지는 수치 적 공간에 매핑되어 관련성이 없거나 불량한 많은 페이지와 유사하고 구별되는 것처럼 보일 수 있지만 결과가 기능 영역의 동일한 영역에 있다고해서 동일한 "고품질"하위 집합에서 나온다는 의미는 아닙니다. 웹
보다 간단한 답변 : 매우 간단한 관점은 결과 순위를 다루는 것입니다. 가장 좋은 결과가 가장 먼저 나와야하지만, 우선 순위가 높다고해서 이것이 가장 좋은 결과라는 의미는 아닙니다. 점수의 일부 측정 항목에 따르면 Google의 순위가 황금 품질 평가 기준과 상관 관계가 있다고해서 해당 순위가 결과가 품질과 관련성에서이 순서대로 표시된다는 것을 의미하지는 않습니다.
업데이트 (세 번째 답변) : 시간이 지남에 따라 우리 모두에게 영향을 미치는 또 다른 측면이 있습니다. Google의 최고 결과 이기 때문에 Google의 최고 결과는 신뢰할만한 것으로 간주 될 수 있습니다 . 링크 분석 (예 : "PageRank"-링크 분석의 한 방법)은 인식 된 권위를 반영하려는 시도이지만 시간이 지남에 따라 주제의 새 페이지는 Google의 최상위 결과에 연결하여 해당 링크 구조를 강화할 수 있습니다. 더 신뢰할 수있는 최신 페이지는 첫 번째 결과와 관련하여 헤드 스타트에 문제가 있습니다. Google이 현재 가장 관련성 높은 페이지를 제공하려고 하므로 소위 '풍부한 리치 (rich-get-richer)'현상을 비롯한 다양한 요인이 인식 된 인과 관계에 대한 암시 적 영향으로 인해 발생합니다.
업데이트 (네 번째 답변) : 나는 플라톤의 동굴의 우화를 읽는 것이 현실의 "반사 / 투영"의 결과로 상관과 인과 관계를 해석하는 방법에 대한 이해를 얻는 데 유용 할 수 있다는 것을 깨달았다 (아래의 설명을 위해). 우리 (또는 우리의 기계)가 그것을 인식합니다. Pearson의 상관 관계로 엄격하게 제한되는 상관 관계는 오해의 연관성 (단순한 상관 관계보다 더 넓은 범위)과 원인에 대한 해석으로 너무 제한적입니다.