«statistics» 태그된 질문

통계는 데이터의 확률 모델을 기반으로 한 귀납적 추론 및 예측에 대한 과학적 접근 방식입니다. 확장으로,이 목적을 위해 데이터를 수집하기위한 실험 및 설문 조사 설계를 다룹니다.


3
KS, AUROC 및 Gini의 관계
Kolmogorov–Smirnov 검정 (KS), AUROC 및 Gini 계수 와 같은 일반적인 모델 검증 통계 는 모두 기능적으로 관련되어 있습니다. 그러나 내 질문은 이것이 어떻게 관련되어 있는지 증명하는 것과 관련이 있습니다. 이 관계를 증명할 수있는 사람이 있는지 궁금합니다. 온라인에서 아무것도 찾을 수 없었지만 증거의 작동 방식에 진심으로 관심이 있습니다. 예를 들어 Gini …

3
통계 석사 논문에 대한 데이터 과학 지향 데이터 세트 / 연구 질문
'데이터 과학'을 탐구하고 싶습니다. 이 용어는 다소 모호한 것 같지만 요구할 것으로 예상합니다. 기계 학습 (전통적인 통계가 아닌); 클러스터에서 분석을 실행해야하는 충분한 데이터 집합 데이터 과학 분야를 탐색하는 데 사용할 수있는 프로그래밍 배경을 가진 통계학자가 액세스 할 수있는 좋은 데이터 세트와 문제점은 무엇입니까? 가능한 한 좁게 유지하기 위해, 잘 사용되는 …

3
과학 컴퓨팅을위한 최고의 언어
폐쇄되었습니다 . 이 질문은 더 집중되어야 합니다. 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 이 게시물 을 편집 하여 한 가지 문제에만 집중할 수 있도록 질문을 업데이트하십시오 . 휴일 오년 전에 . 대부분의 언어에는 몇 가지 과학 컴퓨팅 라이브러리가 있습니다. 파이썬은 Scipy Rust 있다 SciRust C++이 등 여러 가지 ViennaCL와Armadillo …
10 efficiency  statistics  tools  knowledge-base  machine-learning  neural-network  deep-learning  optimization  hyperparameter  machine-learning  time-series  categorical-data  logistic-regression  python  visualization  bigdata  efficiency  classification  binary  svm  random-forest  logistic-regression  data-mining  sql  experiments  bigdata  efficiency  performance  scalability  distributed  bigdata  nlp  statistics  education  knowledge-base  definitions  machine-learning  recommender-system  evaluation  efficiency  algorithms  parameter  efficiency  scalability  sql  statistics  visualization  knowledge-base  education  machine-learning  r  python  r  text-mining  sentiment-analysis  machine-learning  machine-learning  python  neural-network  statistics  reference-request  machine-learning  data-mining  python  classification  data-mining  bigdata  usecase  apache-hadoop  map-reduce  aws  education  feature-selection  machine-learning  machine-learning  sports  data-formats  hierarchical-data-format  bigdata  apache-hadoop  bigdata  apache-hadoop  python  visualization  knowledge-base  classification  confusion-matrix  accuracy  bigdata  apache-hadoop  bigdata  efficiency  apache-hadoop  distributed  machine-translation  nlp  metadata  data-cleaning  text-mining  python  pandas  machine-learning  python  pandas  scikit-learn  bigdata  machine-learning  databases  clustering  data-mining  recommender-system 

3
다양한 통계적 기법 (회귀, PCA 등)은 표본 크기와 차원에 어떻게 비례합니까?
표본 크기 및 차원에 따라 확장되는 방법을 설명하는 알려진 일반적인 통계 기법 표가 있습니까? 예를 들어, 내 친구가 며칠 전에 크기 n의 1 차원 데이터를 간단히 정렬하는 계산 시간이 n * log (n)이된다고 말했습니다. 예를 들어 X가 d- 차원 변수 인 X에 대해 y를 회귀하면 O (n ^ 2 * …

3
통계 + 컴퓨터 과학 = 데이터 과학? [닫은]
닫은. 이 질문은 주제에 맞지 않습니다 . 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 질문 업데이트 는 그래서 주제에 대한 데이터 과학 스택 교류가. 휴일 오년 전에 . 나는 데이터 과학자 가되고 싶다 . 응용 통계 (계리 과학)를 연구 했으므로 훌륭한 통계적 배경 (회귀, 확률 과정, 시계열, 몇 가지 언급)이 …

3
파이썬에서 동일한 값을 그룹화하고 빈도를 계산하는 방법은 무엇입니까?
파이썬으로 분석하는 초보자이므로 조심하십시오. 소매점에 대한 거래 데이터의 데이터 집합이 있습니다. 설명과 함께 변수는 다음과 같습니다. 섹션 : 상점의 섹션, str; prod_name : 제품 이름, str; 영수증 : 송장 번호, int; 출납원, 출납원 수, 정수; 비용 : 품목의 비용, 플로트; 날짜는 MM / DD / YY 형식으로 str입니다. HH : …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.