나는 현재 우리 모두처럼 출력 가 입력 와 어떻게 관련되어 있는지 이해하기 위해 기본적으로 필요한 프로젝트에 있습니다. 여기서의 특이점은 데이터 가 한 번에 하나씩 제공되므로 새로운 받을 때마다 분석을 업데이트하고 싶습니다 . 필자는 필요한 모든 데이터를 보유하고 동시에 모든 데이터를 사용하여 계산을 수행하는 "배치"처리와 달리 "온라인"처리라고합니다.
그래서 나는 아이디어를 둘러 보았고 마침내 세상이 세 가지로 나뉘어져 있다는 결론을 얻었습니다.
첫 번째 부분은 통계와 계량 경제의 땅입니다. 사람들은 OLS, GLS, 기기 변수, ARIMA, 테스트, 차이의 차이, PCA 등을 수행합니다. 이 토지는 대부분 선형성에 의해 지배되며 "일괄 처리"만합니다.
두 번째 부분은 기계 학습의 섬이며 인공 지능, 감독 및 비지도 학습, 신경망 및 SVM과 같은 단어입니다. 여기서 "배치"및 "온라인"처리가 모두 수행됩니다.
세 번째 부분은 제가 방금 발견 한 대륙 전체이며, 대부분 전기 기술자들이 거주하고있는 것 같습니다. 거기에서 사람들은 종종 "필터"라는 단어를 도구에 추가하고 Widrow-Hoff 알고리즘, 재귀 최소 제곱 , Wiener 필터 , Kalman 필터 및 내가 아직 발견하지 못한 다른 것들과 같은 훌륭한 것들을 발명했습니다 . 분명히 그들은 그들의 요구에 더 잘 맞기 때문에 대부분 "온라인"처리를합니다.
제 질문은이 모든 것에 대한 비전을 가지고 있습니까? 나는이 세 부분이 서로 너무 많이 말하지 않는다는 인상을 받고 있습니다. 내가 잘못? 와 의 관계를 이해하는 대단 일 통합 이론이 있습니까? 당신은 그 이론의 기초가 놓일 수있는 자원을 알고 있습니까?
이 질문이 실제로 의미가 있는지 확실하지 않지만 모든 이론 사이에서 조금 잃어 버렸습니다. 나는 "이것을 사용해야합니까?"라는 질문에 대한 답을 상상합니다. "원하는 작업 (및 데이터)에 따라 다릅니다". 그러나 나는이 세 세계가 같은 질문에 대답하려고하는 것 같은 느낌이 들기 때문에 ( ?)이 모든 것에 대해 더 높은 시각을 가질 수 있어야하며, 각 기술을 구체적으로 만드는 이유를 깊이 이해해야합니다.