통계 및 빅 데이터

통계, 기계 학습, 데이터 분석, 데이터 마이닝 및 데이터 시각화에 관심있는 사람들을위한 Q & A


7
정규화 용어가 비용 함수에 (더하기 등이 아닌) 왜 추가됩니까?
정규화를 사용할 때마다 다음과 같은 비용 함수와 같은 비용 함수에 추가됩니다. J(θ)=12(y−θXT)(y−θXT)T+α∥θ∥22J(θ)=12(y−θXT)(y−θXT)T+α‖θ‖22 J(\theta)=\frac 1 2(y-\theta X^T)(y-\theta X^T)^T+\alpha\|\theta\|_2^2 최소화하기 때문에 직관적 인 의미가 있습니다. 비용 함수는 오류 (왼쪽 항)를 최소화하고 동시에 계수의 크기 (오른쪽 항)를 최소화하는 것 (또는 최소한 두 최소화의 균형을 잡는 것)을 의미합니다. 내 질문은 왜이 정규화 용어 α∥θ∥22α‖θ‖22\alpha\|\theta\|_2^2 …

6
R의 ROC 곡선을 사용하여 최상의 차단 점과 신뢰 구간을 결정하는 방법은 무엇입니까?
정상 및 종양 세포를 구별하는 데 사용할 수있는 테스트 데이터가 있습니다. ROC 곡선에 따르면이 목적에 적합하게 보입니다 (곡선 영역은 0.9입니다). 내 질문은 : 이 시험의 차단 점과 측정 값이 모호한 것으로 판단되는 신뢰 구간을 결정하는 방법은 무엇입니까? 이것을 시각화하는 가장 좋은 방법은 무엇입니까 ggplot2? ROCR및 ggplot2패키지를 사용하여 그래프를 렌더링 합니다. …


8
테이블 디자인에 대한 좋은 자료는 무엇입니까?
Grammar of Graphics 와 같은 그래픽에 대한 다양한 이론적 처리를 보았습니다 . 그러나 테이블과 관련하여 아무것도 보지 못했습니다. 그 동안 나는 테이블 디자인에서 모범 사례의 비공식 모델을 개발했습니다. 그러나 학생들에게 좋은 참고 자료를 제공하고 싶습니다. APA 스타일 매뉴얼 테이블 디자인에 대한 몇 가지 팁을 가지고 있지만 그것은 단지 출발점이 될 …
51 tables 

3
통계와 인과 추론?
1984 년 논문 "통계 및 인과 추론" 에서 Paul Holland는 통계에서 가장 근본적인 질문 중 하나를 제기했습니다. 인과 관계에 대한 통계 모델은 무엇을 말할 수 있습니까? 이것은 그의 좌우명을 이끌어 냈습니다. 조작없이 발생하는 원인 없음 인과 관계를 고려한 실험에 대한 제한의 중요성을 강조했습니다. Andrew Gelman도 비슷한 지적을합니다 . "무언가를 바꿀 …
51 causality 



5
랜덤 포레스트는 부스팅 알고리즘입니까?
부스팅의 짧은 정의 : 약한 학습자 세트가 하나의 강력한 학습자를 만들 수 있습니까? 약한 학습자는 실제 분류와 약간만 관련이있는 분류 자로 정의됩니다 (임의 추측보다 예제를 더 잘 레이블링 할 수 있음). 랜덤 포레스트 의 짧은 정의 : 랜덤 포레스트는 많은 분류 트리를 자랍니다. 입력 벡터에서 새 개체를 분류하려면 입력 벡터를 …




4
특이 치에 강력한 고속 선형 회귀
나는 특이 치에 대한 선형 데이터를 다루고 있는데, 그중 일부는 추정 회귀선에서 5 표준 편차 이상입니다. 이러한 점의 영향을 줄이는 선형 회귀 기술을 찾고 있습니다. 지금까지 내가 한 일은 모든 데이터로 회귀선을 추정 한 다음 매우 큰 제곱 잔차 (예 : 상위 10 %)가있는 데이터 포인트를 버리고 해당 포인트없이 회귀를 …

9
누구나 데이터베이스의 데이터를 시각화하기위한 훌륭한 오픈 소스 소프트웨어를 알고 있습니까?
최근에 Tableau를 발견 하여 데이터베이스 및 csv 파일의 데이터를 시각화하려고했습니다. 사용자 iterface를 통해 사용자는 시간 및 공간 데이터를 시각화하고 플롯을 즉시 만들 수 있습니다. 이러한 도구는 코드를 작성하지 않고도 데이터를 그래픽으로 관찰 할 수 있으므로 매우 유용합니다. 데이터를 검색하고 시각화 해야하는 많은 데이터 소스가 있으므로 축에서 열을 드래그하여 차트를 생성하고 …

6
R을 사용하여 통계 학습을 시작하려면 어떤 책이 권장됩니까?
R을 사용하여 통계를 배우는 책 내가 찾는 책이 정확히 무엇입니까? 내가 찾고있는 것은 R을 사용하여 실습 경험을 제공하고 R을 함께 배우는 데 도움이되는 통계를 가르치는 책입니다. 나는 그것을 시도하는 많은 책을 아마존에서 보았지만 R로는하지 않았습니다. 예는 Minitab과 SAS입니다. R Book 및 Statistical Computing은 옵션입니까? - 아직 대답하지 않았습니다 . R …
50 r  references 

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.