'69 년의 데이터를 통한 일반적인 학습의 최첨단


16

1969 년부터 유명한 Minsky and Papert 저서 "Perceptrons"의 맥락을 이해하려고 노력하고 있는데, 이는 신경망에 매우 중요합니다.

내가 아는 한, 퍼셉트론을 제외한 다른 일반적인 감독 학습 알고리즘은 없었습니다. 의사 결정 트리는 실제로 70 년대 후반에만 실제로 유용 해지기 시작했으며, 임의의 포리스트와 SVM은 90 년대입니다. jackknife 방법은 이미 알려져 있지만 k-cross validation (70s) 또는 bootstrap (1979?)은 아닙니다.

위키피디아는 하이브리드 이론을 설명하려는 최초의 시도가 이미 40 년대에 있었음에도 불구하고, 네이 먼-피어슨과 피셔의 고전적인 통계 체계는 여전히 50 년대에 여전히 의견이 맞지 않았다고 말합니다 .

따라서 내 질문 : 데이터에서 예측하는 일반적인 문제를 해결하는 최첨단 방법은 무엇입니까?


6
Logistic regression은 70 년대 후반에 그대로 사용되기 시작했다 (Cramer, JS (2002) 참조). "물류 회귀의 기원", p. 12, papers.tinbergen.nl/02119.pdf
Tim

선형 회귀는 아마도 "일반적인 감독 학습 알고리즘"이며 1800 년대 초에 시작되었습니다. 적어도 어떤 형태의 프로 빗 회귀 는 1930 년대에 시작된 것 같습니다 . 여기서 "일반"이라는 말이 있습니까?
Dougal

@Dougal : "특정 문제를 해결하기 위해 설계된 것"이 아니라 "다른 분야의 많은 문제에 적용 할 수있는"것으로 나타났습니다. 가장 간단한 접근법 (예 : 선형 회귀?)이 작동하지 않을 때 사전 작업이없는 새로운 미지의 문제에 직면했을 때 60 년대 통계 학자 또는 AI 과학자가 사용하는 방법을 이해하려고합니다. 따라서 더 복잡한 도구를 찾는 것이 정당합니다. 예를 들어 임의 포리스트는 이제 이러한 알고리즘 중 하나입니다. 다양한 필드의 많은 데이터 집합에서 합리적으로 잘 작동합니다.
liori

그래 프로 빗 회귀 분석은 실제로 원래 퍼셉트론보다 더 나은 범용 분류 모델 일 것입니다. 당시에 사용되었는지 여부는 모르겠습니다. 퍼셉트론은 SGD와 유사한 최적화 알고리즘과 함께 번들로 제공되어 프로 빗보다 컴퓨터를 더 확장 가능하게 만들었 기 때문에 당시에는 다른 것으로 간주되었습니다. 물론 오늘날 우리는 이러한 선택이 독립적이라는 것을 알고 있습니다.
Dougal

1
이 주제에 여전히 관심이있는 사람은 : 60 년대에 퍼셉트론 논쟁의 주제에 관한 과학 사회학에서 흥미로운 연구를 발견했습니다. 이 글은 여기에 언급 된 질문에 대한 답은 아니지만 Minsky and Papert 서적에 대한 사회 학적 맥락을 제공합니다. 실제 과학보다 더 중요한 책입니다.
liori

답변:


12

나는 이것에 대해 궁금해서 파고 들었다. 많은 공통 분류 알고리즘의 인식 가능한 버전이 1969 년에 이미 사용 가능하다는 사실에 놀랐습니다. 링크와 인용은 다음과 같습니다.

AI 연구가 항상 분류에 초점을 둔 것은 아니라는 점은 주목할 가치가 있습니다. 더 이상 유행에 빠지지 않는 계획과 상징적 추론에 많은 관심이 있었고 레이블이있는 데이터를 찾기가 훨씬 더 어려웠습니다. 예를 들어, 프로토 -SVM 작업은 대부분 러시아어로 출판되었습니다. 따라서 이것은 1969 년의 평균 과학자가 분류에 대해 얼마나 많이 알고 있었는지 과대 평가했을 수 있습니다.


판별 분석

A의 1,936 문서 에서 우생학 실록 피셔는 꽃잎과 꽃받침 측정 기준에 기초하여 선형 함수 아이리스 세 종을 구별을 찾는 과정을 설명했다. 이 논문은 피셔가 이미 이집트에서 발굴 된 인간의 하악골 (턱뼈)의 성별을 E.S Martin과 Karl Pearson ( jstor ) 과의 협력과 별도의 두개골 측정 프로젝트에서 예측하기 위해 유사한 기술을 적용했다고 언급했다. Miss Mildred Barnard와 함께 (추적 할 수 없었습니다).

로지스틱 회귀

물류 기능 자체는 19 세기 이래로 알려져 왔지만 대부분 인구 증가 또는 생화학 반응과 같은 포화 과정의 모델로 알려져 있습니다. Tim은 JS Cramer의 기사와 연결되어 있으며, 이는 초기의 멋진 역사입니다. 그러나 1969 년까지 Cox는 이진 데이터 분석의 첫 번째 버전을 발표했습니다 . 원본을 찾을 수 없지만 이후 버전에는 로지스틱 회귀를 사용하여 분류를 수행하는 방법에 대한 전체 장이 포함되어 있습니다. 예를 들면 다음과 같습니다.

와이=0,1엑스'와이와이

케이

케이케이

신경망

로젠 출판 기술 보고서 1957 년 퍼셉트론을 설명하고 그것을 추적 , Neurodynamics의 원칙 에 의해 작업을 포함하여 1960 년대 초부터 주변에있는 역 전파의 1962 년 연속 버전, 켈리 , 브라이슨 및 개정 브라이슨 & 호 ( 1975 년이되었지만 원래는 1969 년이되었지만 나중에는 신경망에 적용되지 않았으며 아주 깊숙한 네트워크를 훈련하는 방법이 훨씬 최근에 이루어졌습니다 .

통계적 방법

분류에 베이 즈 규칙을 사용하는 것이 여러 번 발견되어 재발견 된 것 같습니다. 규칙 자체의 결과는 매우 자연 스럽습니다. 신호 검출 이론은 주어진 입력이 "신호"인지 잡음인지를 결정하기위한 정량적 프레임 워크를 개발했습니다. 이 중 일부는 제 2 차 세계 대전 이후 레이더 연구에서 나왔지만 지각 실험 (예 : Green and Swets ) 에 빠르게 적용되었습니다 . 나는 예측 자들 사이의 독립성이 잘 작동한다는 것을 누가 알았 는가를 알지 못하지만 1970 년대 초반의 작업은 이 기사에 요약 된 것처럼이 아이디어를 활용 한 것으로 보인다 . 덧붙여서, 그 기사는 또한 나이브 베이 즈가 한때 "멍청한 베이 즈"라고 불렸다 고 지적합니다!

벡터 머신 지원

1962 년 Vapnik과 Chervonenkis는 "일반화 된 세로 알고리즘"( 끔찍한 스캔, 죄송합니다 )을 설명했습니다. 이는 지원 벡터 시스템 (또는 실제로는 1 클래스 SVM)의 특수한 경우처럼 보입니다. Chervonenkis는 "이전의 지원 벡터 머신의 역사" 라는 제목의 기사를 작성 했으며 이에 대한 후속 작업에 대해 자세히 설명합니다. 커널 트릭 (내부 제품으로 커널)은 1964 년 Aizerman, Braverman 및 Rozonoer에 의해 설명되었습니다. svms.org는 여기 에서 지원 벡터 머신의 역사에 대해 조금 더 설명합니다 .


2
시계열 분석도 흥미로운 문제를 해결했습니다. ARMA와 Kalman 필터는 50 년대와 60 년대에 좋은 주행 거리를 만들었습니다.
EngrStudent-복직 모니카

1
흥미 롭습니다! 나는 그것이나 그 역사에 대해 거의 알지 못하지만, 당신이 하나를 쓰면 행복하게 대답 할 것입니다!
매트 크라우스

3

면책 조항 :이 답변은 불완전하지만 지금 당장 할 시간이 없습니다. 이번 주 후반에 작업 할 수 있기를 바랍니다.


질문 :
1969 년경 데이터에서 예측하는 속기 문제를 해결하는 최첨단 방법은 무엇입니까?

참고 : 이것은 'Matt Krause'의 탁월한 대답을 반복하지는 않습니다.

"최신 기술"은 "최고의 현대적"을 의미하지만 반드시 산업 표준으로 실천하기 위해 반드시 축소되는 것은 아닙니다. 대조적으로, 미국 특허법은 "일반 기술"에 의해 정의 된 "비 명확한"을 찾는다. 1969 년의 "최신 기술"은 향후 10 년 동안 특허에 등록되었을 것입니다.

ECHELON (1) (2) 에서 사용하기 위해 1969 년의 "가장 우수하고 밝은"접근 방식이 사용되거나 평가되었을 가능성이 극히 높습니다 . 또한 다른 시대의 수학적 능력을 가진 다른 시대의 소련의 평가에서도 보여줄 것입니다. (3) 위성을 제작하는 데 몇 년이 걸리므로 향후 5 년 동안의 통신, 원격 측정 또는 정찰 위성의 기술 또는 컨텐츠가 1969 년의 기술 상태를 보여줄 것으로 기대합니다. Meteor-2 기상 위성은 1967 년에 시작되었고 1971 년에 예비 설계가 완료되었습니다. (4) 분광계 및 계량 계 페이로드 엔지니어링은 당일의 데이터 처리 기능과 계획된 "미래의 미래"데이터 처리를 통해 알 수 있습니다. 이러한 종류의 데이터 처리는 해당 기간의 모범 사례를 찾을 수있는 곳입니다.

"최적화 이론 및 응용 프로그램 저널링"은 몇 년 동안 운영되어 왔으며 그 내용에 액세스 할 수 있습니다. (5) 최적 추정기의 평가 (6) 와 재귀 추정기의 평가를 고려하십시오 . (7)

1970 년대에 시작된 SETI 프로젝트는 저예산 기술과 당시의 기술에 맞게 오래된 기술을 사용했을 가능성이 높습니다. 초기 SETI 기술 에 대한 탐구는 1969 년경에 주도적으로 고려되었던 것에 대해서도 이야기 할 수있다. 후보는“ 가방 SETI ” 의 선구자 이다. "가방 SETI"는 DSP를 사용하여 ~ 130k 협 대역 채널에서 자기 상관 수신기를 구축했습니다. SETI 사람들은 특히 스펙트럼 분석을 수행하려고했습니다. 이 접근법은 Aricebo 데이터를 처리하기 위해 처음 오프라인에서 사용되었습니다. 이후 1978 년 Aricebo 무선 망원경에 연결하여 실시간 데이터를 얻었고 같은 해에 결과를 발표 했습니다 . 실제 Suitecase-SETI는 1982 년에 완성되었습니다. 여기 (링크) 프로세스를 보여주는 블록 다이어그램입니다.

이 접근법은 오프 링크 롱 푸리에 변환 (~ 64k 샘플)을 사용하여 처프 처리 및 도플러 시프트에 대한 실시간 보상을 포함한 대역폭 세그먼트를 검색하는 것이 었습니다. 이 접근 방식은 "새로운 것이 아니며"다음을 포함한 참조가 제공되었습니다.

A. G. W. Cameron, Ed., 
In- terstellar Communication 
(Benjamin, New York,1963); 

I. S. Shklovskii and C. Sagan, 
In-telligent Life in the Universe 
(Holden-Day, San Francisco, 1966); 

C. Sagan, Ed., 
Communication with Extraterrestrial Intelligence 
(MIT Press, Cambridge, Mass., 1973); 
P. Morrison, J.

B. M. Oliver and J. Billingham, 
"Project Cyclops: A Design Study of a System for Detecting Extraterrestrial Intelligent Life," 
NASA Contract. Rep. CR114445 (1973). 

당시 인기 있었던 이전 상태를 고려하여 다음 상태를 예측하는 데 사용되는 도구는 다음과 같습니다.

  • 칼만 (및 파생) 필터 (Weiner, Bucy, nonlinear ...)
  • 시계열 (및 파생) 방법
  • 필터링 및 증폭을 포함한 주파수 영역 방법 (푸리에)

일반적인 "키워드"(또는 버즈 워드)에는 "인접, 변형, 그라디언트, 최적, 2 차 및 켤레"가 포함됩니다.

칼만 필터의 전제는 실제 데이터와 분석 및 예측 모델을 최적으로 혼합하는 것입니다. 그들은 미사일과 같은 것들이 움직이는 표적을 명중시키는 데 사용되었습니다.


작성해 주셔서 감사합니다. 응용 프로그램 중심의 접근 방식이 마음에 듭니다.
매트 크라우스

@MattKrause-아직 조금 넣어야합니다. 이 경우 응용 중심의 접근 방식이 "수학의 고고학"에 도움이 될 것이라고 생각했습니다. 우리는 볼 것이다. 이 작업을 통해 "가방 SETI"를 구축하고 평생 동안 내 인간 환경을 둘러보고 50 년 동안 사용했던 도구에 대한 아이디어를 얻고 자합니다.
EngrStudent-복직 모니카
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.