통계 및 빅 데이터 r

1

나는 경험적으로 얻은 일부 분포의 이형성 강도를 정량화하는 방법을 찾고 싶습니다. 내가 읽은 것으로부터, 바이 모달리티를 정량화하는 방법에 대한 논쟁이 여전히 남아 있습니다. 나는 R에서 사용할 수있는 유일한 것 인 Hartigans의 딥 테스트를 사용하기로 선택했습니다 (원본 : http://www.stat.washington.edu/wxs/Stat593-s03/Literature/hartigan85a.pdf ). Hartigans의 딥 테스트는 다음과 같이 정의됩니다. " 딥 테스트는 모든 샘플 …

18 r distributions

3

k- 평균의 갭 통계가 왜 두 군집이 있는데도 하나의 군집을 제안합니까?

K- 평균을 사용하여 데이터를 클러스터링하고 "최적의"클러스터 번호를 제안하는 방법을 찾고있었습니다. 갭 통계는 좋은 클러스터 번호를 찾는 일반적인 방법 인 것 같습니다. 어떤 이유로 든 최적의 클러스터 번호로 1을 반환하지만 데이터를 볼 때 2 개의 클러스터가 있음이 분명합니다. 이것이 R에서 간격을 부르는 방법입니다. gap <- clusGap(data, FUN=kmeans, K.max=10, B=500) with(gap, maxSE(Tab[,"gap"], …

18 r machine-learning clustering k-means

5

시계열 변화 감지 (R 예)

일반적으로 모양이 동일한 시계열 데이터의 변화를 감지하고 싶습니다. 지금까지 내가 함께 작업 한 changepointR에 대한 패키지와 cpt.mean(), cpt.var()및 cpt.meanvar()기능. cpt.mean()PELT 방법을 사용하면 데이터가 일반적으로 한 수준으로 유지 될 때 잘 작동합니다. 그러나 나는 또한 하강 중에 변화를 감지하고 싶습니다. 내가 감지하고 싶은 변화의 한 예는 검은 곡선이 갑자기 떨어지는 구간인데 …

18 r time-series change-point structural-change

1

H0에서 부트 스트랩을 사용하여 두 가지 방법의 차이에 대한 테스트 수행 : 그룹 내 또는 풀링 된 샘플 내에서 교체

두 개의 독립적 그룹이있는 데이터가 있다고 가정하십시오. g1.lengths <- c (112.64, 97.10, 84.18, 106.96, 98.42, 101.66) g2.lengths <- c (84.44, 82.10, 83.26, 81.02, 81.86, 86.80, 85.84, 97.08, 79.64, 83.32, 91.04, 85.92, 73.52, 85.58, 97.70, 89.72, 88.92, 103.72, 105.02, 99.48, 89.50, 81.74) group = rep (c ("g1", "g2"), c (length (g1.lengths), …

18 r hypothesis-testing bootstrap small-sample permutation-test

3

카운트 데이터에 대한 음 이항 GLM 대 로그 변환 : 유형 I 오류율 증가

여러분 중 일부는이 멋진 논문을 읽었을 것입니다. O'Hara RB, Kotze DJ (2010) 카운트 데이터를 로그 변환하지 마십시오. 생태와 진화의 방법 1 : 118–122. 톡 . 제 연구 분야 (생태 독성)에서는 제대로 복제되지 않은 실험을 다루고 있으며 GLM은 널리 사용되지 않습니다. 그래서 O'Hara & Kotze (2010)와 비슷한 시뮬레이션을 수행했지만 생태 독성 …

18 r generalized-linear-model simulation negative-binomial type-i-and-ii-errors

1

희소 데이터 수학에서 작동하는 클러스터링 알고리즘 [닫기]

닫은. 이 질문은 주제에 맞지 않습니다 . 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 교차 검증에 대한 주제가 되도록 질문을 업데이트하십시오 . 휴일 오년 전에 . 다음과 같은 클러스터링 알고리즘 목록을 컴파일하려고합니다. R로 구현 sparseMatrix 함수에 의해 생성 된 것과 같이 희소 데이터 행렬 (유사 행렬이 아님)에서 작동합니다. CV에는이 개념을 …

18 r clustering sparse

4

기울기 구속 조건이있는 선형 회귀

에서 매우 간단한 선형 회귀를 수행하고 싶습니다 R. 공식은 만큼 간단 합니다. 그러나 기울기 ( a )가 1.4와 1.6 사이의 간격 안에 있기를 원합니다 .y=ax+by=ax+by = ax + baㅏa 이것을 어떻게 할 수 있습니까?

18 r regression constrained-regression

3

프로파일 가능성과 신뢰 구간 사이의 관계는 무엇입니까?

이 차트를 만들기 위해 mean = 0 및 sd = 1 인 정규 분포와 다른 크기의 랜덤 표본을 생성했습니다. 그런 다음 t.test () 함수를 사용하여 .001에서 .999 (빨간색 선) 범위의 알파 컷오프를 사용하여 신뢰 구간을 계산 한 후, 강의 노트에서 찾은 아래 코드를 사용하여 프로파일 가능성을 계산했습니다. 편집 : 발견 …

18 r confidence-interval profile-likelihood

3

lmer의 분산 공분산 행렬

혼합 모델의 장점 중 하나는 데이터에 대해 분산 공분산 행렬을 지정할 수 있다는 것입니다 (복합 대칭, 자기 회귀, 비 구조적 등). 그러나 lmerR의 함수는이 행렬을 쉽게 지정할 수 없습니다. 누구든지 lmer기본적으로 어떤 구조를 사용하고 왜 쉽게 지정할 수 없는지 알고 있습니까?

18 r mixed-model lme4-nlme covariance-matrix

1

극도의 무작위 숲은 무작위 숲과 어떻게 다릅니 까?

ER이보다 효율적인 구현입니까 (예 Extreme Gradient Boosting: 그래디언트 부스팅). 실제 관점과의 차이점이 중요합니까? 그것들을 구현하는 R 패키지가 있습니다. 효율성뿐만 아니라 다른 영역에서도 "일반"구현 (R의 RandomForest 패키지)을 극복하는 새로운 알고리즘입니까? 극도의 랜덤 포레스트 http://link.springer.com/article/10.1007%2Fs10994-006-6226-1

18 r machine-learning algorithms random-forest

9

페어 와이즈 마할 라 노비스 거리

공변량 의 행렬 에서 모든 관측 쌍 사이의 R에서 샘플 Mahalanobis 거리를 계산해야합니다 . 효율적인 솔루션, 즉 거리 만 계산되고 바람직하게는 C / RCpp / Fortran 등으로 구현 되는 솔루션이 필요합니다 . 모집단 공분산 행렬 인 가 알려져 있지 않으며 샘플을 사용 한다고 가정합니다. 그 자리에 공분산 행렬이 있습니다.n ( …

18 r algorithms distance

6

핵심 데이터 분석 옵션

저는 5 년 가까이 SAS를 전문적으로 사용해 왔습니다. 랩톱에 설치했으며 1,000-2,000 개의 변수와 수십만 개의 관측치로 데이터 세트를 자주 분석해야합니다. 비슷한 크기의 데이터 세트에서 분석을 수행 할 수있는 SAS의 대안을 찾고있었습니다. 이런 상황에서 다른 사람들이 무엇을 사용하는지 궁금합니다. 이것은 오늘날 사용되는 방식에서 "빅 데이터"가 아닙니다. 또한 내 데이터 세트가 메모리에 …

18 r sas large-data

2

에서 coxph 모델의 요약에 주어진 “

의 coxph 모델 요약에 제공된 R 2 값 은 무엇입니까 ? 예를 들어아르 자형2아르 자형2R^2 Rsquare= 0.186 (max possible= 0.991 ) 나는 어리석게도 그것을 값 으로 원고를 포함 시켰고 , 검토자는 그가 Cox 모델을 위해 개발 된 고전적인 선형 회귀 와 R 2 통계 의 유사성을 알지 못한다고 말했고 , …

18 r survival r-squared cox-model

1

혼합 효과 모형 추정치의 표준 오차는 어떻게 계산해야합니까?

특히 선형 혼합 효과 모델에서 고정 효과의 표준 오차는 어떻게 자주 계산되어야합니까? Laird and Ware [1982]에 제시된 것과 같은 전형적인 추정치 ( )는 SE에게 추정 분산 성분이 실제 값인 것처럼 취급되므로 크기가 과소 평가됩니다.V a r ( β^) = ( X'V엑스)− 1Var(β^)=(X′VX)−1{\rm Var}(\hat\beta)=(X'VX)^{-1} R 패키지 의 lme및 summary함수에 의해 생성 …

18 r mixed-model random-effects-model

3

R에서 사용자 정의 기능을 최대화 / 최소화하는 방법이 있습니까?

사용자 정의 기능을 최소화하려고합니다. 5 개의 매개 변수와 데이터 세트를 허용하고 모든 종류의 계산을 수행하여 단일 숫자를 출력으로 생성합니다. 함수의 최소 출력을 생성하는 5 개의 입력 매개 변수 조합을 찾고 싶습니다.

18 r optimization

«r» 태그된 질문