이 질문에 대답하기 위해 혼돈 이론을 읽을 때 내가 발견 한 가장 이상한 점은 데이터 마이닝과 그 친척이 혼돈 이론을 활용하는 출판 된 연구의 놀라운 어려움이었다. AB Ҫbel의 Applied Chaos Theory : A Complex of the Complexity and Alligood, et al. 'Chaos : An Introduction to Dynamical Systems와 같은 소스를 참고함으로써 이들을 찾기위한 공동 노력에도 불구하고 (후자는 소스 시스템으로 매우 유용합니다. 이 주제)와 참고 문헌을 습격. 결국, 나는 자격이 될 수있는 단일 연구를 생각해 내야했고이 경우를 포함시키기 위해“데이터 마이닝”의 범위를 확장해야했습니다. 텍사스 대학 (University of Texas)의 Belousov-Zhabotinsky (BZ) 반응에 대한 연구 (이미 비 주기성 경향이있는 것으로 알려진) 반응은 혼란스러운 패턴으로 인해 실험에 사용 된 말 론산의 불일치를 우연히 발견하여 공급자. [1] 아마도 카오스 이론의 전문가가 아니고 문헌에 대한 철저한 평가를 거의 할 수없는 다른 것들도있을 것입니다. 그러나 물리학의 삼체 문제와 같은 일반적인 과학적 용도의 엄청난 불균형은 우리가 그것들을 모두 열거하더라도 크게 변하지 않을 것입니다. 실제로이 질문이 끝날 때까지 나는“데이터 마이닝 및 관련 분야에서 카오스 이론의 구현이 왜 그렇게 적은가?”라는 제목으로 다시 작성하는 것을 고려했습니다. 이것은 신경망, 패턴 인식, 불확실성 관리, 퍼지 세트 등과 같은 데이터 마이닝 및 관련 분야에서 다수의 응용 프로그램이 있어야한다는 잘못 정의되었지만 널리 퍼져있는 정서와 일치하지 않습니다. 결국, 혼돈 이론은 많은 유용한 응용을 가진 최첨단 주제입니다. 검색이 효과가없고 인상이 잘못된 이유를 이해하기 위해이 필드들 사이의 경계가 정확히 어디에 있는지에 대해 길고 열심히 생각해야했습니다.
; tldr 답변
연구 횟수와 기대와의 편차에서 이러한 불균형에 대한 짧은 설명은 혼돈 이론과 데이터 마이닝 등이 깔끔하게 분리 된 두 가지 질문에 대답한다는 사실에 기인 할 수 있습니다. 그들 사이의 날카로운 이분법은 한 번 지적되었지만 자신의 코를 보는 것처럼 눈에 띄지 않는 근본적인 것입니다. 혼돈 이론과 데이터 마이닝과 같은 필드의 상대적인 새로움이 구현의 일부 어려움을 설명한다는 믿음에 대한 타당성이있을 수 있지만, 이러한 필드가 단순히 다른 측면을 다루기 때문에 이러한 필드가 성숙하더라도 상대적인 불균형이 지속될 것으로 예상 할 수 있습니다. 같은 동전. 현재까지 거의 모든 구현은 몇 가지 수수께끼의 혼란을 나타내는 잘 정의 된 출력을 가진 알려진 기능에 대한 연구에있었습니다. 신경망 및 의사 결정 트리와 같은 데이터 마이닝 및 개별 기술은 모두 알려지지 않거나 잘못 정의 된 기능의 결정과 관련됩니다. 패턴 인식 및 퍼지 세트와 같은 관련 필드도 마찬가지로 해당 조직의 수단이 명확하지 않은 경우 종종 알려지지 않거나 잘못 정의 된 기능 결과의 구성으로 볼 수 있습니다. 이것은 거의 드문 상황에서만 교차 할 수없는 실질적으로 극복 할 수없는 틈을 만들어냅니다. 그러나 단일 사용 사례의 루 브릭으로 그룹화 할 수도 있습니다. 데이터 마이닝 알고리즘과의 비 주기적 간섭 방지. 패턴 인식 및 퍼지 세트와 같은 관련 필드도 마찬가지로 해당 조직의 수단이 명확하지 않은 경우 종종 알려지지 않거나 잘못 정의 된 기능 결과의 구성으로 볼 수 있습니다. 이것은 거의 드문 상황에서만 교차 할 수없는 실질적으로 극복 할 수없는 틈을 만들어냅니다. 그러나 단일 사용 사례의 루 브릭으로 그룹화 할 수도 있습니다. 데이터 마이닝 알고리즘과의 비 주기적 간섭 방지. 패턴 인식 및 퍼지 세트와 같은 관련 필드도 마찬가지로 해당 조직의 수단이 명확하지 않은 경우 종종 알려지지 않거나 잘못 정의 된 기능 결과의 구성으로 볼 수 있습니다. 이것은 거의 드문 상황에서만 교차 할 수없는 실질적으로 극복 할 수없는 틈을 만들어냅니다. 그러나 단일 사용 사례의 루 브릭으로 그룹화 할 수도 있습니다. 데이터 마이닝 알고리즘과의 비 주기적 간섭 방지.
카오스 사이언스 워크 플로우와의 비 호환성
"카오스 사이언스"의 일반적인 워크 플로우는 알려진 다이어그램의 함수, 종종 분기 다이어그램, Hénon 맵, Poincaré 섹션, 위상 다이어그램 및 위상 궤적과 같은 위상 공간의 시각 보조 도구와 함께 계산 된 계산을 수행하는 것입니다. 연구원들이 전산 실험에 의존한다는 사실은 혼란스러운 효과가 얼마나 어려운지를 보여줍니다. 일반적으로 펜과 종이로 결정할 수있는 것은 아닙니다. 또한 비선형 함수에서만 발생합니다. 알려진 작업 기능이 없으면이 워크 플로를 실행할 수 없습니다. 데이터 마이닝은 회귀 방정식, 퍼지 함수 등을 생성 할 수 있지만 모두 동일한 제한을 공유합니다. 이들은 일반적인 근사치이며 훨씬 더 넓은 오차 범위를 갖습니다. 반대로 혼란에 노출 된 알려진 기능은 비교적 드물다. 혼돈 패턴을 생성하는 입력의 범위도 마찬가지이므로 혼돈 효과를 테스트하기 위해서는 높은 수준의 특이성이 필요합니다. 알려지지 않은 기능의 위상 공간에 존재하는 이상한 어 트랙터는 정의와 입력이 변경됨에 따라 Alligood 등과 같은 저자가 설명한 탐지 절차를 크게 복잡하게 만들거나 완전히 사라질 것입니다.
데이터 마이닝 결과의 오염 물질로서의 혼란
사실, 데이터 마이닝과 그 친척이 혼돈 이론과의 관계는 사실상 대적입니다. 암호화 체계의 혼란을 활용하는 적어도 하나의 연구 논문을 검토 한 결과, 암호화 분석을 특정 형태의 데이터 마이닝으로 광범위하게 본다면 말 그대로 사실입니다 (현재 인용을 찾을 수는 없지만 사냥 할 수는 있습니다) 요청시 다운). 데이터 마이너에게는 혼란이 존재하는 것은 일반적으로 나쁜 일입니다. 출력이 아닌 것처럼 보이는 값 범위는 출력이 알 수없는 함수를 근사화하는 이미 힘든 과정을 크게 복잡하게 만들 수 있기 때문에 좋지 않습니다. 데이터 마이닝 및 관련 필드에서 혼돈을 가장 일반적으로 사용하는 것은이를 배제하는 것입니다. 혼란스러운 효과가 있지만 감지되지 않으면 데이터 마이닝 벤처에 미치는 영향을 극복하기 어려울 수 있습니다. 일반적인 신경망이나 의사 결정 트리가 혼란스런 인력의 겉보기에 무의미한 결과에 얼마나 쉽게 적합 할 수 있는지, 또는 입력 값이 갑자기 급등하여 회귀 분석을 혼란스럽게 만들고 나쁜 표본이나 다른 오류의 원인이 될 수있는 방법을 생각해보십시오. 모든 기능과 입력 범위에서 혼돈의 영향이 드물다는 것은 실험자에 의해 그 기능에 대한 조사가 심각하게 우선시되지 않음을 의미합니다.
데이터 마이닝 결과에서 혼돈을 탐지하는 방법
혼돈 이론과 관련된 특정 조치는 Kolmogorov Entropy와 같은 비 주기적 효과를 식별하고 위상 공간이 긍정적 인 Lyapunov 지수를 나타내는 요구 사항에 유용합니다. 이것들은 AB Ҫambel의 Applied Chaos Theory에서 제공되는 혼돈 감지 체크리스트 [2]에 있지만 Lyapunov 지수와 같은 근사 함수에는 유용하지 않으며 알려진 한계가있는 명확한 함수가 필요합니다. 그럼에도 불구하고 그가 설명하는 일반적인 절차는 데이터 마이닝 상황에서 유용 할 수 있습니다. 암벨의 목표는 궁극적으로 "혼돈 통제"프로그램, 즉 방해하는 비 주기적 효과를 제거하는 것입니다. [3] 혼돈으로 이어지는 분수 차원을 탐지하기위한 박스-카운팅 및 상관 차원을 계산하는 것과 같은 다른 방법은 Lyapunov 및 그의 목록에있는 다른 것보다 데이터 마이닝 응용에서 더 실용적 일 수 있습니다. 혼돈 효과의 또 다른 이야기는 함수 출력에주기 배가 (또는 3 배 이상) 패턴이 존재한다는 것인데, 이는 종종 위상 다이어그램에서 비 주기적 (즉, "혼돈") 동작보다 우선합니다.
탄젠트 어플리케이션 차별화
이 기본 사용 사례는 혼돈 이론과 접하는 유일한 응용 프로그램 클래스와 차별화되어야합니다. 면밀히 살펴보면, 제 질문에 제공 한“잠재적 응용 프로그램”목록은 실제로 카오스 이론이 의존하는 개념을 활용하기위한 아이디어로 구성되어 있지만 비 주기적 행동이없는 경우 독립적으로 적용 할 수 있습니다 (기간을 두 배로 늘림 제외). 나는 최근에 새로운 전위차 적 틈새 사용을 생각하여 국소 적 최소 점에서 신경망을 터뜨리기 위해 비 주기적 행동을 생성했지만 이것도 접선 응용 프로그램 목록에 속할 것입니다. 그들 중 많은 사람들이 혼돈 과학에 대한 연구의 결과로 발견되거나 다뤄졌지만 다른 분야에도 적용될 수 있습니다. 이 "접선 응용 프로그램"은 서로에 대한 퍼지 연결 만 가지고 있지만 고유 한 클래스를 형성합니다. 데이터 마이닝에서 혼돈 이론의 주요 사용 사례에서 엄격한 경계로 분리; 첫 번째는 비 주기적 패턴이없는 혼돈 이론의 특정 측면을 활용하는 반면, 후자는 데이터 마이닝 결과에서 복잡한 요소로 혼돈을 배제하는 데 전념합니다. . 우리가 혼돈 이론과 다른 개념을 올바르게 사용한다면, 그것을 올바르게 사용한다면, 전자의 적용이 본질적으로 일반적인 과학 연구에서 알려진 기능으로 제한되어 있음을 쉽게 알 수 있습니다. 혼돈이 없을 때 이러한 2 차 개념의 잠재적 적용에 대해 흥분 할만한 충분한 이유가 있습니다. 그러나 예상치 못한 비 주기적 행동이 데이터 마이닝에 존재할 때 오염 효과에 대해 걱정할 이유도 있습니다. 그러한 경우는 드물지만 희귀 성 또한 탐지되지 않을 것입니다. belambel의 방법은 이러한 문제를 방지하는 데 사용할 수 있습니다.
[1] 143-147 쪽, Alligood, Kathleen T .; Sauer, Tim D. 및 Yorke, James A., 2010, Chaos : 동적 시스템 소개, Springer : New York. [2] pp. 208-213, bel 암벨, AB, 1993, 응용 혼돈 이론 : 복잡성 패러다임, Academic Press, Inc .: 보스턴. [3] p. 215, 암벨.