통계 및 빅 데이터

통계, 기계 학습, 데이터 분석, 데이터 마이닝 및 데이터 시각화에 관심있는 사람들을위한 Q & A


1
R의 다중 중개 분석
R에서 다중 중개 모델을 실행하는 방법을 아는 사람이 있는지 궁금합니다. 중개 패키지가 다중 단순 중개 모델을 허용 한다는 것을 알고 있지만 여러 중개 모델을 동시에 평가하는 하나의 모델을 실행하려고합니다. SEM 프레임 워크 (경로 분석) 에서이 작업을 수행 할 수 있다고 가정하지만 여러 중재자에 대한 중재 분석 (간접 효과, 중재를 통한 …

3
lm ()과 rlm ()의 차이점은 무엇입니까?
방금 라이브러리 rlm() 에서MASS "선형 모델의 견고한 피팅" 기능을 찾았습니다 . 이 함수와 표준 선형 회귀 함수의 차이점을 알고 싶습니다 lm(). 누군가 나에게 간단한 설명을 해 줄 수 있습니까?
19 r  regression 

3
비정규 분포 표본에서 평균의 신뢰 구간을 어떻게 계산할 수 있습니까?
비정규 분포 표본에서 평균의 신뢰 구간을 어떻게 계산할 수 있습니까? 부트 스트랩 방법이 여기에서 일반적으로 사용된다는 것을 알고 있지만 다른 옵션을 사용할 수 있습니다. 비모수 적 옵션을 찾고있는 동안 누군가 파라 메트릭 솔루션이 유효하다고 확신 할 수 있다면 좋을 것입니다. 샘플 크기는> 400입니다. 누구나 R로 샘플을 줄 수 있다면 대단히 …

2
데이터가 정규 분포가 아닌 경우 두 그룹 평균 간의 차이를 테스트하는 방법은 무엇입니까?
생물학적 세부 사항과 실험을 모두 제거하고 당면한 문제와 통계적으로 수행 한 작업을 인용하겠습니다. 나는 그것이 올바른지 아닌지, 어떻게 진행하는지 알고 싶습니다. 데이터 (또는 내 설명)가 충분하지 않으면 편집하여 더 잘 설명하려고 노력할 것입니다. 크기가 이고 두 개의 그룹 / 관찰, X 및 Y가 있다고 가정하십시오 . 이 두 관측치의 평균이 …

2
2 개의 개체-내 요인에 대해 R에서 lme / lmer로 반복 측정 ANOVA
반복 측정 ANOVA에 대한 결과를 복제하기 lme위해 nlme패키지 를 사용하려고합니다 aov. 단일 요인 반복 측정 실험과 대상 간 요인 하나와 대상 내 요인 하나를 사용하는 2 요인 실험에 대해이 작업을 수행했지만 2 요인 실험을 수행하는 데 어려움을 겪고 있습니다. -인자를 고려한다. 아래에 예가 나와 있습니다. A및 B고정 효과 계수이고 subject랜덤 …

4
실제로 혼합 효과 모델에서 랜덤 효과 공분산 행렬은 어떻게 계산됩니까?
기본적으로 궁금한 점은 서로 다른 공분산 구조가 적용되는 방식과 이러한 행렬 내부의 값이 계산되는 방식입니다. lme ()과 같은 함수를 사용하면 원하는 구조를 선택할 수 있지만 어떻게 계산되는지 알고 싶습니다. 선형 혼합 효과 모델 .와이= Xβ+ Zu + ϵY=Xβ+Zu+ϵY=X\beta+Zu+\epsilon 여기서 및 입니다. 더욱이:유 ∼디엔( 0 , D )u∼dN(0,D)u \stackrel{d}{\sim} N(0,D)ϵ ∼디엔( …

8
플롯을 설계하고 생성하기위한 필수 규칙은 무엇입니까?
배경: 이전에 Cross Validated에서 다음에 대한 질문이있었습니다. 줄거리를 준비 할 때 가장 좋은 방법은 무엇입니까? 두 개의 숫자 변수를 작성하는 데 유용한 온라인 팁은 무엇입니까? @david 는 이 질문 에 대한 의견 에서 커뮤니티가 투표 할 수있는 답변 당 하나의 시각화 규칙 이있는 커뮤니티 위키 질문 이 있어야한다고 제안했습니다 . …

4
팀 스포츠 당 2 인의 개별 플레이어 효과 측정
팀 점수 스프레드 시트가 있습니다. 첫 팀이 10 점을 얻습니다. 각 팀에는 2 명의 플레이어가 있습니다. 완벽하게 무작위로 선택되지는 않지만 플레이어는 항상 다른 팀원과 게임을합니다. 개별 점수는 유지되지 않습니다. 그래서 기본적으로 Bill과 Bob이 Andy와 Alice 10-4 Jake를 이기고 Bill은 Joe와 John 10-8을 이겼습니다 ... 사용 가능한 모든 경기 데이터를 기반으로 …

1
0 값이 많은 시계열 분석
이 문제는 실제로 화재 감지에 관한 것이지만 일부 방사성 붕괴 감지 문제와 매우 유사합니다. 관찰되는 현상은 산발적이며 매우 가변적입니다. 따라서 시계열은 변수 값에 의해 중단 된 긴 문자열 0으로 구성됩니다. 목적은 단순히 이벤트를 캡처하는 것 (0으로 나누기)이 아니라 이벤트 자체의 정량적 특성입니다. 그러나 센서는 제한되어 있으므로 "실제"가 0이 아닌 경우에도 …




2
올바른 시작 값을 가진 nls의 특이 기울기 오류
일부 데이터에 선 + 지수 곡선을 맞추려고합니다. 처음에는 인공 데이터에 대해이 작업을 시도했습니다. 함수는 다음과 같습니다. 선형 섹션과 추가 수평 이동 매개 변수 ( m ) 가있는 지수 곡선입니다 . 그러나 R의 함수를 사용하면 처음에 데이터를 생성하는 데 사용한 것과 동일한 매개 변수를 사용하더라도 " 초기 매개 변수 추정치에서 단일 …

5
중재 분석은 본질적으로 인과 관계가 있습니까?
IV, DV 및 중재자 하나를 사용하여 간단한 중재 모델을 테스트하는 데 관심이 있습니다. Preacher 및 Hayes SPSS 매크로에서 테스트 한대로 간접 효과는 중요합니다. 이는 중재자가 통계적으로 관계를 중재하는 역할을한다는 것을 나타냅니다. 중재에 대해 읽을 때 "중재 모델이 원인 모델입니다."와 같은 내용을 읽었습니다. - 데이비드 케니 . 중재 모델을 인과 관계 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.