통계 및 빅 데이터

통계, 기계 학습, 데이터 분석, 데이터 마이닝 및 데이터 시각화에 관심있는 사람들을위한 Q & A

2
이항 회귀와 로지스틱 회귀의 차이점은 무엇입니까?
나는 항상 로지스틱 회귀를 링크 함수가 로지스틱 함수 (프로 빗 함수 대신) 인 이항 회귀의 특별한 경우라고 생각했습니다. 그래도 내가 가진 또 다른 질문에 대한 답을 읽음으로써 혼란 스러울 것 같고 로지스틱 회귀와 로지스틱 링크가있는 이항 회귀에는 차이가 있습니다. 차이점이 뭐야?

2
모멘트를 사용하여 정수 스트림에 대한 대략적인 Quantile을 계산합니까?
math.stackexchange 에서 마이그레이션되었습니다 . 정수의 긴 스트림을 처리하고 있으며 많은 데이터를 저장하지 않고 스트림의 다양한 백분위 수를 대략적으로 계산할 수 있도록 몇 가지 순간을 추적하는 것을 고려하고 있습니다. 잠시 후에 백분위 수를 계산하는 가장 간단한 방법은 무엇입니까? 적은 양의 데이터 만 저장하는 더 나은 방법이 있습니까?

2
심리학에서 관찰 연구를 분석하기 위해 구조 방정식 모델링을 사용할지 여부
통계 컨설팅 설정에서이 문제가 많이 발생하는 것을 보았으며 귀하의 의견을 듣고 싶어했습니다. 문맥 나는 종종 다음과 같이 연구를 수행 한 연구생들에게 말합니다 : 관측 연구 샘플 크기는 100, 200, 300 등일 수 있습니다. 여러 가지 심리적 척도 (예 : 불안, 우울증, 성격, 태도, 기타 임상 척도, 아마도 지능 등)가 측정되었습니다. …

6
간단한 선형 회귀 출력 해석
두 변수의 자연 로그에 대한 간단한 선형 회귀 분석을 수행하여 변수의 상관 관계를 확인했습니다. 내 결과는 다음과 같습니다. R^2 = 0.0893 slope = 0.851 p < 0.001 혼란 스러워요. 상기 찾고 값, 나는 두 변수가되는 말을 하지 너무 가까이 있기 때문에, 상관 관계가 . 그러나 회귀선의 기울기는 거의 (플롯에서 거의 …

2
계절 분해 방법 선택
계절 조정 은 추가 연구를 위해 데이터를 전처리하는 중요한 단계입니다. 그러나 연구원은 추세주기 계절 분해를위한 여러 가지 옵션을 가지고 있습니다. 라이벌 계절 분해법 (경험적 문헌에서 인용 숫자로 판정) 가장 일반적인 X-11 (12) -ARIMA, Tramo / 좌석 (모두 구현된다 DEMETRA + ) 및 의 STL . 위에서 언급 한 분해 기술 …

2
비율 데이터 변환 : arcsin square root가 충분하지 않은 경우
백분율 / 비율 데이터에 대한 아크 신 제곱근 변환에 대한 (강한?) 대안이 있습니까? 현재 작업중 인 데이터 세트 에서이 변환을 적용한 후에도 현저한 이분산성이 남아 있습니다. 즉 잔차 대 적합치의 플롯은 여전히 ​​마름모꼴입니다. 의견에 응답하기 위해 편집 : 데이터는 10 %의 배수로 엔 다우먼트의 0-100 %를 투자 할 수있는 실험 …

10
귀무 가설은 어느 것입니까? 과학 이론, 논리 및 통계 사이의 충돌?
귀무 가설 을 설정하는 데있어 기본 논리를 이해하는 데 어려움이 있습니다. 이 답변 에서 명백하게 일반적으로 받아 들여지는 제안은 귀무 가설이 효과가 없을 것이라는 가설이며, 모든 것이 동일하게 유지됩니다. 대체 가설은 예를 들어 새로운 약물이 약속을 이행한다는 것을 증명하려는 것입니다. 이제 우리는 제안을 위조 할 수 있다는 것을 우리가 알고있는 …

2
StackExchange 질문에 대한 "흥미"기능
이 질문은 교차 검증에서 답변 될 수 있기 때문에 Mathematics Stack Exchange에서 마이그레이션 되었습니다. 8 년 전에 이주했습니다 . StackExchange 사이트를위한 데이터 마이닝 패키지를 만들려고하는데 특히 "가장 흥미로운"질문을 찾기 위해 노력하고 있습니다. 질문 점수를 사용하고 싶지만 조회수로 인한 편견을 제거하고 있지만 엄격하게 접근하는 방법을 모르겠습니다. 이상적인 세계에서는 을 계산하여 질문을 …

3
R에서 다항 로짓 모형을 설정하고 추정하는 방법?
JMP에서 다항 로짓 모델을 실행하고 각 매개 변수 추정치에 대한 카이 제곱 p- 값과 AIC를 포함하는 결과를 얻었습니다. 이 모델에는 하나의 범주 형 결과와 7 개의 범주 형 설명 변수가 있습니다. 그런 다음 nnet 패키지 의 multinom함수를 사용하여 R에서 동일한 모델을 만들 것이라고 생각한 것을 맞았습니다 . 코드는 기본적으로 다음과 …
20 r  logistic  multinomial  logit  jmp 

2
계층 적 모델의 피셔 정보
다음과 같은 계층 적 모델을 고려하면 및 여기서 정규 분포입니다. 의 한계 분포의 피셔 정보에 대한 정확한 표현을 얻을 수있는 방법이 있습니까 주어진 . 즉,의 피셔 정보 무엇인가 난의 여백 분포에 대한 식을 얻을 수있는 주어진 , 그러나 wrt 차별화 하고 기대를 취하는 것은 매우 어려운 것 같습니다. 나는 분명한 …

1
NYTimes에서 통계적 방법의 오용에 관한 기사
이 기사를 참조하고 있습니다 : http://www.nytimes.com/2011/01/11/science/11esp.html 다음 실험을 고려하십시오. 동전이 머리에 약간 무게가 있다고 믿는 이유가 있다고 가정하십시오. 테스트에서 동전은 1,000에서 527 번 머리 위로 나옵니다. 동전에 가중치가 부여되었다는 중요한 증거입니까? 고전적인 분석은 그렇습니다. 공정한 동전을 사용하면 1,000 플립에서 527 개 이상의 헤드를 얻을 확률은 기존 컷오프의 20 %에서 1 …

4
평균 상관 값
다른 실험 조건 Y에서 변수가 변수 X에 어떻게 의존 하는지 테스트 하고 다음 그래프를 얻습니다. 위 그래프의 대시 선은 각 데이터 계열 (실험 설정)에 대한 선형 회귀를 나타내고 범례의 숫자는 각 데이터 계열의 피어슨 상관 관계를 나타냅니다. 나는 사이의 "평균 상관 관계"(또는 "평균 상관 관계를")를 계산하고자 X하고 Y. 단순히 r값을 …

2
불이익 회귀 모형으로부터 R- 제곱 및 통계적 유의성 추정
나는 R 패키지를 사용하고 범 나는 사람이 중요하다있는 예측과 약간의 지식을 많이 가지고 어디에 데이터 집합에 대한 계수의 수축 추정치를 얻을 수 있습니다. 튜닝 매개 변수 L1 및 L2를 선택하고 계수에 만족 한 후 R- 제곱과 같은 모형 적합도를 통계적으로 알 수있는 방법이 있습니까? 또한, 모델의 전체적인 의미를 테스트하는 데 …

3
t 제곱의 합은 얼마입니까?
적당한 크기의 (예 : 100 미만)에 대해 자유도 를 갖는 Student t 분포에서 iid로 하자 . 정의 이며 카이 제곱 분포와 거의 자유도? 제곱 임의 변수의 합에 대한 중앙 한계 정리와 같은 것이 있습니까?titit_innnnnnT=∑1≤i≤kt2iT=∑1≤i≤kti2T = \sum_{1\le i \le k} t_i^2TTTkkk

2
파이썬 matplotlib boxplot에서 진드기 이름을 지정하는 방법
잠김 . 이 질문과 주제는 주제가 다르지만 역사적 의미가 있기 때문에이 질문과 답변은 잠겨 있습니다. 현재 새로운 답변이나 상호 작용을받지 않습니다. 파이썬 matplotlib 에는 boxplot 명령이 있습니다. 일반적으로 그래프의 모든 부분이 숫자로 표시됩니다. 진드기를 위치 대신 이름으로 바꾸려면 어떻게해야합니까? 예를 들어,이 상자 그림과 같은 Mon Tue Wed 레이블을 의미합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.