데이터 과학 statistics

4

일반화 선형 모델 (GLM)은 통계 모델로 간주 될 것이라고 생각했지만 친구가 일부 논문에서이를 기계 학습 기술로 분류한다고 말했습니다. 어느 것이 사실입니까 (또는 더 정확합니까)? 모든 설명을 부탁드립니다.

11 machine-learning statistics glm

3

Kolmogorov–Smirnov 검정 (KS), AUROC 및 Gini 계수 와 같은 일반적인 모델 검증 통계 는 모두 기능적으로 관련되어 있습니다. 그러나 내 질문은 이것이 어떻게 관련되어 있는지 증명하는 것과 관련이 있습니다. 이 관계를 증명할 수있는 사람이 있는지 궁금합니다. 온라인에서 아무것도 찾을 수 없었지만 증거의 작동 방식에 진심으로 관심이 있습니다. 예를 들어 Gini …

11 data-mining statistics predictive-modeling accuracy

3

통계 석사 논문에 대한 데이터 과학 지향 데이터 세트 / 연구 질문

'데이터 과학'을 탐구하고 싶습니다. 이 용어는 다소 모호한 것 같지만 요구할 것으로 예상합니다. 기계 학습 (전통적인 통계가 아닌); 클러스터에서 분석을 실행해야하는 충분한 데이터 집합 데이터 과학 분야를 탐색하는 데 사용할 수있는 프로그래밍 배경을 가진 통계학자가 액세스 할 수있는 좋은 데이터 세트와 문제점은 무엇입니까? 가능한 한 좁게 유지하기 위해, 잘 사용되는 …

11 statistics education knowledge-base definitions

3

과학 컴퓨팅을위한 최고의 언어

폐쇄되었습니다 . 이 질문은 더 집중되어야 합니다. 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 이 게시물 을 편집 하여 한 가지 문제에만 집중할 수 있도록 질문을 업데이트하십시오 . 휴일 오년 전에 . 대부분의 언어에는 몇 가지 과학 컴퓨팅 라이브러리가 있습니다. 파이썬은 Scipy Rust 있다 SciRust C++이 등 여러 가지 ViennaCL와Armadillo …

10 efficiency statistics tools knowledge-base machine-learning neural-network deep-learning optimization hyperparameter machine-learning time-series categorical-data logistic-regression python visualization bigdata efficiency classification binary svm random-forest logistic-regression data-mining sql experiments bigdata efficiency performance scalability distributed bigdata nlp statistics education knowledge-base definitions machine-learning recommender-system evaluation efficiency algorithms parameter efficiency scalability sql statistics visualization knowledge-base education machine-learning r python r text-mining sentiment-analysis machine-learning machine-learning python neural-network statistics reference-request machine-learning data-mining python classification data-mining bigdata usecase apache-hadoop map-reduce aws education feature-selection machine-learning machine-learning sports data-formats hierarchical-data-format bigdata apache-hadoop bigdata apache-hadoop python visualization knowledge-base classification confusion-matrix accuracy bigdata apache-hadoop bigdata efficiency apache-hadoop distributed machine-translation nlp metadata data-cleaning text-mining python pandas machine-learning python pandas scikit-learn bigdata machine-learning databases clustering data-mining recommender-system

3

다양한 통계적 기법 (회귀, PCA 등)은 표본 크기와 차원에 어떻게 비례합니까?

표본 크기 및 차원에 따라 확장되는 방법을 설명하는 알려진 일반적인 통계 기법 표가 있습니까? 예를 들어, 내 친구가 며칠 전에 크기 n의 1 차원 데이터를 간단히 정렬하는 계산 시간이 n * log (n)이된다고 말했습니다. 예를 들어 X가 d- 차원 변수 인 X에 대해 y를 회귀하면 O (n ^ 2 * …

10 bigdata statistics efficiency scalability

3

통계 + 컴퓨터 과학 = 데이터 과학? [닫은]

닫은. 이 질문은 주제에 맞지 않습니다 . 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 질문 업데이트 는 그래서 주제에 대한 데이터 과학 스택 교류가. 휴일 오년 전에 . 나는 데이터 과학자 가되고 싶다 . 응용 통계 (계리 과학)를 연구 했으므로 훌륭한 통계적 배경 (회귀, 확률 과정, 시계열, 몇 가지 언급)이 …

10 machine-learning statistics career

3

파이썬에서 동일한 값을 그룹화하고 빈도를 계산하는 방법은 무엇입니까?

파이썬으로 분석하는 초보자이므로 조심하십시오. 소매점에 대한 거래 데이터의 데이터 집합이 있습니다. 설명과 함께 변수는 다음과 같습니다. 섹션 : 상점의 섹션, str; prod_name : 제품 이름, str; 영수증 : 송장 번호, int; 출납원, 출납원 수, 정수; 비용 : 품목의 비용, 플로트; 날짜는 MM / DD / YY 형식으로 str입니다. HH : …

10 python statistics pandas ipython

«statistics» 태그된 질문