«data-mining» 태그된 질문

5
유전자 알고리즘에 대한 연구가 왜 느려졌습니까?
유전자 알고리즘의 사용을 포함하여 오늘날 소개 레벨 주제를 논의하면서; 이 분야에서 연구가 정말 느려 졌다고 들었습니다. 그 이유는 대부분의 사람들이 머신 러닝과 데이터 마이닝에 집중하고 있기 때문입니다. 업데이트 : 이것이 정확합니까? 그렇다면 GA와 비교할 때 ML / DM의 장점은 무엇입니까?

4
지도 학습과 비지도 학습의 차이점은 정확히 무엇입니까?
클러스터링 방법을 이해하려고합니다. 내가 이해 한 것 II : 지도 학습에서 범주 / 라벨 데이터는 계산 전에 알려집니다. 따라서 레이블, 클래스 또는 범주는 해당 클러스터에 실제로 중요한 매개 변수를 "학습"하기 위해 사용됩니다. 비지도 학습에서 데이터 집합은 군집을 알지 않고도 세그먼트에 할당됩니다. 그것은 어떤 파라미터가 세분화에 중요한지조차 모른다면,지도 학습을 선호해야한다는 것을 …

2
단락에서 날짜와 관련된 이벤트 식별
단락에 주어진 날짜가 단락의 특정 사건 (구절)과 관련이 있음을 식별 하는 알고리즘 적 접근이 있습니까? 예를 들어, 다음 단락을 고려하십시오. 1970 년 6 월, 위대한 지도자는 맹세를했습니다. 그러나 국무 장관이 사망 한 1972 년 5 월 이후에야 그는 국토를 점령했다. 1980 년 중반까지 대중적인지지를 받았지만 그 이후로 그의 영향력은 떨어지기 …

5
데이터 과학 및 운영 연구
제목에서 알 수 있듯이 일반적인 질문은 다음과 같습니다. DS와 OR / 최적화의 차이점은 무엇입니까? 개념적 수준에서 DS는 사용 가능한 데이터에서 지식 을 추출 하려고 시도 하며 대부분 통계적 기계 학습 기술을 사용합니다. 반면에 OR 은 데이터 (입력)에 대한 일부 객관적인 기능 (기준)을 최적화함으로써 데이터를 기반으로 의사 결정 을하기 위해 데이터를 …

4
정보 검색과 정보 추출의 관계 및 차이점은 무엇입니까?
에서 위키 백과 정보 검색 은 정보 자원 모음에서 정보 요구와 관련된 정보 자원을 얻는 활동입니다. 검색은 메타 데이터 또는 전체 텍스트 인덱싱을 기반으로 할 수 있습니다. 에서 위키 백과 정보 추출 (IE) 은 비정형 및 / 또는 반 정형 기계 판독 가능 문서에서 정형 정보를 자동으로 추출하는 작업입니다. 대부분의 …

1
구체화 유형 추론
직장에서 나는 동적 언어에 대한 몇 가지 유형 정보를 유추하는 임무를 맡았습니다. 다음 let과 같이 일련의 명령문을 중첩 된 표현식 으로 다시 작성합니다 . return x; Z => x var x; Z => let x = undefined in Z x = y; Z => let x = y in Z …
11 programming-languages  logic  type-theory  type-inference  machine-learning  data-mining  clustering  order-theory  reference-request  information-theory  entropy  algorithms  algorithm-analysis  space-complexity  lower-bounds  formal-languages  computability  formal-grammars  context-free  parsing  complexity-theory  time-complexity  terminology  turing-machines  nondeterminism  programming-languages  semantics  operational-semantics  complexity-theory  time-complexity  complexity-theory  reference-request  turing-machines  machine-models  simulation  graphs  probability-theory  data-structures  terminology  distributed-systems  hash-tables  history  terminology  programming-languages  meta-programming  terminology  formal-grammars  compilers  algorithms  search-algorithms  formal-languages  regular-languages  complexity-theory  satisfiability  sat-solvers  factoring  algorithms  randomized-algorithms  streaming-algorithm  in-place  algorithms  numerical-analysis  regular-languages  automata  finite-automata  regular-expressions  algorithms  data-structures  efficiency  coding-theory  algorithms  graph-theory  reference-request  education  books  formal-languages  context-free  proof-techniques  algorithms  graph-theory  greedy-algorithms  matroids  complexity-theory  graph-theory  np-complete  intuition  complexity-theory  np-complete  traveling-salesman  algorithms  graphs  probabilistic-algorithms  weighted-graphs  data-structures  time-complexity  priority-queues  computability  turing-machines  automata  pushdown-automata  algorithms  graphs  binary-trees  algorithms  algorithm-analysis  spanning-trees  terminology  asymptotics  landau-notation  algorithms  graph-theory  network-flow  terminology  computability  undecidability  rice-theorem  algorithms  data-structures  computational-geometry 

5
O (n) 복잡성의 순서를 갖는 단어 빈도
Java 개발자 입장 인터뷰에서 다음과 같은 질문을 받았습니다. 두 가지 매개 변수를 취하는 함수를 작성하십시오. 텍스트 문서를 나타내는 String 반환 할 항목 수를 제공하는 정수 가장 자주 발생하는 단어 인 단어 빈도별로 정렬 된 문자열 목록을 반환하도록 함수를 구현하십시오. 솔루션은 시간에 실행되어야합니다. 여기서 은 문서의 문자 수입니다.O(n)O(n)O(n)nnn 다음은 내가 의사 …

1
최신 항목을 선호하는 순위 알고리즘을 찾고 있습니다.
나는 일정 기간 동안 캐스트 된 투표를 기반으로 항목 순위를 매기는 순위 시스템에서 일하고 있습니다. 평균과 비슷한 점수를 계산하는 알고리즘을 찾고 있지만 오래된 점수보다 새로운 점수를 선호합니다. 나는 다음 줄을 따라 무언가를 생각하고 있었다. score1+ 2⋅score2 + ⋯+ n⋅scoren1+2+⋯+nscore1+ 2⋅score2 + ⋯+ n⋅scoren1+2+⋯+n\frac{\mathrm{score}_1 +\ 2\cdot \mathrm{score}_2\ +\ \dots +\ n\cdot …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.