통계적 배경 지식이없는 청중에게 로지스틱 회귀 분석과 신경망의 차이점을 어떻게 설명 할 수 있습니까?
통계적 배경 지식이없는 청중에게 로지스틱 회귀 분석과 신경망의 차이점을 어떻게 설명 할 수 있습니까?
답변:
나는 당신이 예전의 것을 생각하고 있다고 생각하며, 아마도 신경망에 관한 당신의 질문에서 여전히 '다층 퍼셉트론'이라고 불립니다. 그렇다면 설명 변수의 함수로 의사 결정 경계의 형태에 대한 유연성 측면에서 모든 것을 설명하겠습니다 . 특히,이 청중들에게는 링크 함수 / 로그 확률 등은 언급하지 않을 것입니다. 사건의 확률이 일부 관측에 기초하여 예측되고 있다는 생각을 유지하십시오.
가능한 순서는 다음과 같습니다.
이 방법의 장점은 정확한 아이디어를 제공하기 위해 수학적 세부 정보를 얻을 필요가 없다는 것입니다. 실제로 그들은 유사성과 차이점을 이해하기 위해 로지스틱 회귀 분석이나 신경망을 이해할 필요가 없습니다.
이 접근 방식의 단점은 많은 그림을 만들어야하며 대수학에 빠지려는 유혹에 강하게 저항하여 사물을 설명해야한다는 것입니다.
더 간단한 요약 :
로지스틱 회귀 : 가장 단순한 형태의 신경망으로, 결정 경계가 직선 인 결과
신경망 : 로지스틱 회귀 및보다 복잡한 결정 경계를 생성 할 수있는 다른 분류기를 포함하는 수퍼 세트.
(참고 : 통합 커널의 도움없이 "일반"로지스틱 회귀 분석을 참조하고 있습니다)
(참고 : Andrew Ng의 deeplearning.ai 과정, "신경망으로서의 로지스틱 회귀"및 "하나의 숨겨진 레이어를 사용한 평면 데이터 분류")
나는 문자 그대로 질문을 할 것입니다 : 통계에 배경 이 없는 사람 . 그리고 나는 그 사람에게 통계의 배경을 주려고하지 않을 것입니다. 예를 들어, 회사의 CEO 또는 이와 유사한 점의 차이점을 설명해야한다고 가정하십시오.
로지스틱 회귀는 범주 형 변수를 다른 변수로 모델링하기위한 도구입니다. 각 "기타"변수의 변경이 첫 번째 변수의 다른 결과 확률에 어떤 영향을 미치는지 확인할 수있는 방법을 제공합니다. 결과는 해석하기가 매우 쉽습니다.
신경망은 인간이 사물에 대해 배우는 방식과 모호한 방식으로 컴퓨터가 예제를 통해 학습하도록하는 일련의 방법입니다. 좋은 예측 변수 인 모델이 될 수 있지만 일반적으로 로지스틱 회귀 분석의 모델보다 훨씬 더 불투명합니다.
신경망 (물류 활성화 기능 포함)을 가중치 자체가있는 로짓 기능의 가중 평균으로 생각할 수 있다고 배웠습니다. 다수의 로짓을 선택하면 모든 기능 형태에 맞출 수 있습니다. Econometric Sense 블로그 게시물 에 그래픽 직관이 있습니다 .
다른 답변은 훌륭합니다. 로지스틱 회귀 및 다중 클래스 로지스틱 회귀 (일명 최대, 다항 로지스틱 회귀, 소프트 맥스 회귀, 최대 엔트로피 분류기)를 신경망의 특수 아키텍처로 생각할 수 있음을 보여주는 그림을 간단히 추가합니다.
에서 세바스찬 Raschka, 미시간 주립 대학, KDnuggets에 :
멀티 클래스 로지스틱 회귀 분석에 대한 몇 가지 예 :
http://www.deeplearningbook.org/ 1 장 에서 가져온 비슷한 그림 1
그리고 TensorFlow 튜토리얼 에서 하나 더 :
나는 청중이 이해하는 복잡하지만 구체적인 문제의 예를 사용할 것이다. 해석이 훈련되지 않았지만 특별한 의미가있는 숨겨진 노드를 사용하십시오.
선형 회귀 분석은 h4에 백기사가있는 것이 얼마나 좋은지를 결정합니다. 그것이 좋은지 분명하지는 않지만 h4에 있으면 캡처되지 않았으며 다른 고려 사항보다 중요합니다. 선형 회귀는 아마도 조각의 대략적인 값을 복구하며 조각을 보드 중앙과 보드의 반대쪽에 두는 것이 좋습니다. 선형 회귀는 상대 왕이 a1에 있다면 b2의 여왕이 갑자기 더 가치가있는 것처럼 조합의 가치를 평가할 수 없습니다.
신경망은 "물질 우위", "블랙 킹 안전", "중심 제어", "d- 파일의 두 루크", "고립 된 여왕 루크 폰"또는 "주교와 같은 개념에 대한 숨겨진 노드를 가질 수 있습니다. 유동성." 이들 중 일부는 보드 입력만으로 추정 할 수있는 반면, 다른 일부는 두 번째 이후의 숨겨진 계층에 있어야 할 수도 있습니다. 신경망은이를 위치의 최종 평가에 대한 입력으로 사용할 수 있습니다. 이러한 개념은 전문가가 위치를 평가하는 데 도움이되므로 신경망은 선형 회귀보다 더 정확한 평가를 수행 할 수 있어야합니다. 그러나 구조를 선택해야하고 훈련 할 더 많은 매개 변수가 있으므로 신경망을 작성하는 데 더 많은 작업이 필요합니다.