통계 및 빅 데이터

통계, 기계 학습, 데이터 분석, 데이터 마이닝 및 데이터 시각화에 관심있는 사람들을위한 Q & A

4
신경망에서“자유도”란 무엇을 의미합니까?
주교의 책 "패턴 분류 및 기계 학습"에서 신경망의 맥락에서 정규화하는 기술을 설명합니다. 그러나 훈련 과정에서 모델의 복잡성과 함께 자유도가 증가한다는 단락을 이해하지 못합니다. 관련 인용문은 다음과 같습니다. 네트워크의 효과적인 복잡성을 제어하는 ​​방법으로 정규화의 대안은 조기 중지 절차입니다. 비선형 네트워크 모델의 학습은 일련의 학습 데이터와 관련하여 정의 된 오류 함수의 반복 …

1
가중 분산, 한 번 더
편향되지 않은 가중 분산은 이미 여기 와 다른 곳에서 해결 되었지만 여전히 놀라운 양의 혼란이있는 것 같습니다. Wikipedia 기사 뿐만 아니라 첫 번째 링크에 제시된 공식에 대한 합의가있는 것으로 보인다 . 이것은 또한 R, Mathematica 및 GSL (MATLAB 제외)에서 사용하는 공식처럼 보입니다. 그러나 Wikipedia 기사에는 가중 분산 구현에 대한 훌륭한 …

4
R에서 ANCOVA를 수행하는 방법
식물 epiphytes의 밀도에 관한 데이터의 ANCOVA 분석을 수행하고 싶습니다. 처음에는 두 경사면, 하나의 N과 S 사이에 식물 밀도에 차이가 있는지 알고 싶습니다만, 호스트 식물의 고도, 캐노피 개방도 및 높이와 같은 다른 데이터가 있습니다. 공변량이 두 개의 경사 (N 및 S) 여야한다는 것을 알고 있습니다. 나는 R에서 실행되는이 모델을 만들었고 그것이 …
17 r  ancova 

3
선형 혼합 모델의 예시는 무엇입니까?
귀하가 통계 부서의 도서관에 있고 첫 페이지에 다음 그림이있는 책을 발견했다고 가정하십시오. 아마 이것이 선형 회귀에 관한 책이라고 생각할 것입니다. 선형 혼합 모델에 대해 생각하게 될 그림은 무엇입니까?

4
교차 검증 및 파라미터 튜닝
교차 검증 결과가 정확히 무엇인지 알려주는 사람이 있습니까? 그것은 단지 평균 정확도입니까 아니면 매개 변수가 조정 된 모델을 제공합니까? 교차 검증이 매개 변수 조정에 사용된다고 들었습니다.

2
결과 변수에 대한 다중 대치
농업 시험에 대한 데이터 세트가 있습니다. 내 응답 변수는 응답 비율입니다 : log (treatment / control). 차이점을 중재하는 것에 관심이 있으므로 RE 메타 회귀 분석을 실행합니다 (가중치가 적용되지 않음). 효과 크기가 추정치의 변화와 관련이 없다는 것이 매우 분명하기 때문입니다. 각 연구는 곡물 생산량, 바이오 매스 생산량 또는 둘 다를보고합니다. 연구 …

1
두 개의 독립적 인 랜덤 변수, 정규 및 카이-제곱의 곱의 pdf
X와 Y가 독립적이라면 두 개의 독립적 인 랜덤 변수 X와 Y의 곱의 pdf는 무엇입니까? X는 정규 분포이고 Y는 카이 제곱 분포입니다. Z = XY 에 정규 분포가있는 경우 f X ( x ) = 1XXXX∼N(μx,σ2x)X∼N(μx,σx2)X\sim N(\mu_x,\sigma_x^2) fX(x)=1σx2π−−√e−12(x−μxσx)2fX(x)=1σx2πe−12(x−μxσx)2f_X(x)={1\over\sigma_x\sqrt{2\pi}}e^{-{1\over2}({x-\mu_x\over\sigma_x})^2} 및YYY는kkk자유도를 갖는 카이 제곱 분포를가짐 whre단위 계단 함수이다.Y∼χ2kY∼χk2Y\sim \chi_k^2 fY(y)=y(k/2)−1e−y/22k/2Γ(k2)u(y)fY(y)=y(k/2)−1e−y/22k/2Γ(k2)u(y)f_Y(y)={y^{(k/2)-1}e^{-y/2}\over{2^{k/2}\Gamma({k\over2})}}u(y)u(y)u(y)u(y) 이제 의 PDF는 …

2
증권 거래소 거래에 신경망 사용
나는 신경망의 분야에 뛰어 들었고 그들에 매료되었습니다. 마지막으로 증권 거래소에서 거래 시스템을 테스트하기위한 애플리케이션 프레임 워크를 개발했으며 이제는 첫 번째 신경망을 구현할 것입니다. 매우 간단하고 원시적 인 것으로, 실제 거래 용이 아닌 초보자 용입니다. 내 접근 방식이 좋은 접근 방법인지 알고 싶습니다. 그리고 당신이 내가 무언가를 놓치고 있거나 (또는 ​​무언가에 …

1
뉴스 기사를 바탕으로 범죄 지수와 정치적 불안정 지수를 만들고 싶습니다
이 지역 프로젝트를 통해 현지 뉴스 웹 사이트를 크롤링하고 범죄 지수와 정치적 불안정 지수를 구축하려고합니다. 프로젝트의 정보 검색 부분을 이미 다뤘습니다. 나의 계획은 : 감독되지 않은 주제 추출. 거의 중복 감지. 감독 분류 및 사건 수준 (범죄 / 정치-높음 / 중간 / 낮음). 나는 파이썬과 sklearn을 사용하고 이미 그 작업에 …

2
프리젠 테이션을위한 통계 그래프 스타일 가이드가 있습니까?
프레젠테이션에 가장 적합한 그래프 형식을 지정하는 방법에 대한 조언 / 자원 / 권장 사항을 찾고 있습니다. 경험상, 인쇄 출판물에 대해 생성 된 그래프는 비머를 사용하여 그래프를 표시 할 때 "확대"되지 않습니다. 텍스트가 너무 작거나 선이 충분히 두껍지 않은 경우가 종종 있습니다. .eps / .pdf 파일을 가져와 프레젠테이션에 직접 입력하는 것은 …

2
컴퓨터 기반 실험 / 시뮬레이션에서 잔차의 독립성?
나는 palaeo sciences에 사용 된 특정 유형의 모델을 맞추는 다른 방법에 대한 컴퓨터 기반 평가를 수행했습니다. 나는 큰 훈련 세트를 가지고 있었기 때문에 무작위로 (층화 된 무작위 샘플링) 테스트 세트를 따로 설정했습니다. 나는 훈련 세트 샘플에 mmm 개의 다른 방법을 적용하고 mmm 결과 모델을 사용하여 테스트 세트 샘플에 대한 응답을 …

3
R에서 제로 팽창 된 음 이항 혼합 효과 모델
R에서 0으로 팽창 된 음 이항 혼합 효과 모델 추정을 제공하는 패키지가 있습니까? 그 말은 : pscl 패키지의 zeroinfl 함수에서와 같이 제로 인플레이션에 대한 이항 모델을 지정할 수있는 제로 인플레이션 : zeroinfl (y ~ X | Z, dist = "네 그빈") 여기서 Z는 제로 인플레이션 모델의 공식입니다. 모형의 카운트 부분에 …

3
요약 통계 만 사용 가능한 경우 추정을 수행하는 방법은 무엇입니까?
이것은 부분적으로 다음 질문 과 그에 따른 토론에 의해 동기가 부여됩니다 . iid 샘플 X i ~ F ( x , θ ) 가 관찰되었다고 가정합니다 Xi∼F(x,θ)X_i\sim F(x,\theta). 목표는 θ 를 추정하는 것입니다 θ\theta. 그러나 원본 샘플은 사용할 수 없습니다. 우리가 대신해야하는 샘플의 통계입니다 T 1 , . . . …

2
우발 사태 테이블에 대한 체 / 모자이크 플롯의 대안
한때 인터넷에서 범주 형 데이터 (예 : 우연성 테이블)에 대한 플롯 형식을 우연히 발견했지만 다시는 찾지 못했으며 그것이 무엇인지조차 모릅니다. 행 높이와 열 너비가 한계 확률에 비례하여 조정되었다는 점에서 본질적으로 체 플롯과 같습니다. 따라서 각 상자는 독립 상태에서 예상되는 상대 주파수로 조정되었습니다. 그러나 각 상자 내에 교차 해칭을 표시하는 대신 …

1
강력한 방법이 실제로 더 낫습니까?
나는 각각 약 400의 크기와 약 300 개의 예측 변수를 가진 두 그룹의 주제 A와 B를 가지고 있습니다. 내 목표는 이진 반응 변수에 대한 예측 모델을 구축하는 것입니다. 고객은 A에서 B로 작성된 모델을 적용한 결과를보고 싶어합니다. 그의 저서 "Regression Modeling Strategies"에서 @FrankHarrell은 두 개의 데이터 세트를 결합하고 그에 대한 모델을 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.