통계 및 빅 데이터 r

1

긍정적 인 연속적인 세 개의 변수 y와 범주 형인 세 개의 변수가 주어지면 다음 과 같은 두 가지 후보 모델이 있습니다.xz fit.me <- lmer( y ~ 1 + x + ( 1 + x | factor(z) ) ) 과 fit.fe <- lm( y ~ 1 + x ) 어떤 모델이 …

10 r hypothesis-testing mixed-model lme4-nlme

3

"R"에서 그래프 클러스터링의 접근 및 예

'r'의 그래프 클러스터링을 사용하여 그래프에서 노드를 그룹화 / 병합하려고합니다. 여기 내 문제의 놀랍도록 장난감 변형이 있습니다. 두 개의 "클러스터"가 있습니다 클러스터를 연결하는 "브리지"가 있습니다 후보 네트워크는 다음과 같습니다. 연결 거리 "hopcount"를 보면 다음 행렬을 얻을 수 있습니다. mymatrix <- rbind( c(1,1,2,3,3,3,2,1,1,1), c(1,1,1,2,2,2,1,1,1,1), c(2,1,1,1,1,1,1,1,2,2), c(3,2,1,1,1,1,1,2,3,3), c(3,2,1,1,1,1,1,2,3,3), c(3,2,1,1,1,1,1,2,2,2), c(2,1,1,1,1,1,1,1,2,2), c(1,1,1,2,2,2,1,1,1,1), c(1,1,2,3,3,2,2,1,1,1), c(1,1,2,3,3,2,2,1,1,1)) …

10 r clustering data-visualization numerics

1

부드러운 스플라인 / 황토 회귀의 p- 값을 어떻게 찾습니까?

나는 몇 가지 변수를 가지고 있으며 그들 사이의 비선형 관계를 찾고 싶습니다. 그래서 스플라인이나 황토를 맞추고 멋진 음모를 인쇄하기로 결정했습니다 (아래 코드 참조). 그러나, 나는 또한 관계가 무작위의 문제 일 가능성이 어느 정도인지를 알려주는 통계를 원합니다. 예를 들어 선형 회귀와 같이 전체 p- 값이 필요합니다. 즉, 코드가 데이터에 곡선을 맞추기 …

10 r regression splines loess

1

부트 스트랩 : 추정값이 신뢰 구간을 벗어남

혼합 모델 (상호 작용과 무작위 변수가있는 여러 변수)로 부트 스트랩을 수행했습니다. 이 결과를 얻었습니다 (일부 만 해당). > boot_out ORDINARY NONPARAMETRIC BOOTSTRAP Call: boot(data = a001a1, statistic = bootReg, R = 1000) Bootstrap Statistics : original bias std. error t1* 4.887383e+01 -1.677061e+00 4.362948e-01 t2* 3.066825e+01 1.264024e+00 5.328387e-01 t3* 8.105422e+01 2.368599e+00 …

10 r confidence-interval bootstrap bias

2

강력한 표준 오류로 ANOVA 테이블을 얻는 방법?

R의 plm 패키지를 사용하여 풀링 된 OLS 회귀를 실행하고 있습니다.하지만 내 질문은 기본 통계에 대한 것이므로 먼저 여기에 게시하십시오.) 내 회귀 결과가이 분산 잔차를 생성하므로이 분산 강건한 표준 오류를 사용하려고합니다. 결과적으로 coeftest(mod, vcov.=vcovHC(mod, type="HC0"))각 독립 변수에 대한 추정치, 표준 오류, t- 값 및 p- 값이 포함 된 표를 얻습니다. 기본적으로 …

10 r anova multiple-regression heteroscedasticity robust-standard-error

3

R에서 glm-어떤 pvalue가 전체 모형의 적합도를 나타 냅니까?

R (일반 선형 모델)에서 glms를 실행 중입니다. glm에 대한 요약을 호출한다고해서 적어도 선형 모델이있는 곳이 아닌 전체 pmodel을 대표하는 pvalue를 대체하지는 않는다는 것을 알 때까지 pvalues를 알고 있다고 생각했습니다. 이것이 계수 테이블 상단에서 절편에 대한 p 값으로 제공되는지 궁금합니다. 따라서 다음 예에서는 Wind.speed..knots 및 canopy_density가 모델에 중요 할 수 있지만 …

10 r statistical-significance generalized-linear-model p-value descriptive-statistics

3

큰 N, 이산 데이터 및 많은 변수가있을 때 산점도 행렬에서 정보를 추출하는 방법은 무엇입니까?

나는 유방암 데이터 세트를 가지고 놀고 있으며 모든 속성의 산점도를 만들어 어떤 클래스가 malignant(파란색)의 클래스 (파란색) 를 예측하는 데 가장 큰 영향을 미치는지 알 수 있습니다 benign. 행이 x 축을 나타내고 열이 y 축을 나타내는 것을 이해하지만이 산점도의 데이터 또는 속성에 대해 어떤 관찰을 할 수 있는지 알 수 없습니다. …

10 r data-visualization interpretation scatterplot

2

R randomForests에서 분류 임계 값을 변경하는 방법은 무엇입니까?

모든 종 분포 모델링 문헌은 확률 (예를 들어, 랜덤 포레스트)을 출력하는 모델을 사용하여 종의 존재 유무를 예측할 때 실제로 존재 또는 부재로 종을 분류 할 수있는 임계치 확률의 선택이 중요하며 항상 기본값 인 0.5를 사용하지는 않습니다. 이것에 대한 도움이 필요합니다! 내 코드는 다음과 같습니다. library(randomForest) library(PresenceAbsence) #build model RFfit <- …

10 r classification random-forest threshold

2

randomForest 모델의 캐럿 변수

패키지가 varImp있는 randomForest 모델 에서 함수가 어떻게 작동 하는지 이해하는 데 어려움을 겪고 caret있습니다. 아래 예제에서 var3 기능은 caret의 varImp함수를 사용하여 중요도가 0 이지만 기본 randomForest 최종 모델은 var3 기능에 대해 0이 아닌 중요도가 없습니다. 왜 이런 경우입니까? require(randomForest) require(caret) rf <- train(x, y, method = "rf", trControl = trainControl(method …

10 r caret random-forest

3

R에서 (또는 일반적으로) 회귀 계수를 특정 부호로 만들 수 있습니까?

실제 데이터를 사용하고 있으며 회귀 모델이 반 직관적 인 결과를 산출합니다. 일반적으로 나는 통계를 신뢰하지만 실제로 이러한 것들 중 일부는 사실이 될 수 없습니다. 내가보고있는 주요 문제는 실제로 하나의 변수가 증가하면 실제로는 음의 상관 관계가 있어야 응답이 증가한다는 것입니다. 각 회귀 계수에 대해 특정 부호를 강제하는 방법이 있습니까? 이 작업을 …

10 r regression regression-coefficients computational-statistics

4

ARIMA 모델링을위한 매개 변수 결정 (p, d, q)

통계와 R에 익숙하지 않습니다. 데이터 세트의 ARIMA 매개 변수를 결정하는 프로세스를 알고 싶습니다. R을 사용하고 이론적으로 (가능한 경우) 똑같은 것을 알아낼 수 있습니까? 데이터는 1 월 12 일에서 3 월 14 일까지이며 월별 판매량을 나타냅니다. 데이터 세트는 다음과 같습니다. 99 58 52 83 94 73 97 83 86 63 77 …

10 r arima box-jenkins

1

R에 공변량이있는 GARCH (1,1) 모형을 적합합니다

간단한 ARIMA 모델 등의 시계열 모델링 경험이 있습니다. 이제 변동성 클러스터링을 나타내는 일부 데이터가 있으며 데이터에 GARCH (1,1) 모델을 맞추는 것으로 시작하고 싶습니다. 데이터 시리즈와 영향을 미치는 여러 변수가 있습니다. 따라서 기본 회귀 용어로 다음과 같습니다. yt=α+β1xt1+β2xt2+ϵt.yt=α+β1xt1+β2xt2+ϵt. y_t = \alpha + \beta_1 x_{t1} + \beta_2 x_{t2} + \epsilon_t . 그러나 …

10 r regression garch

1

다단계 모델링을위한 표기법

라이브러리 lmer에서 사용하는 다단계 모델을 훈련시키기 위해 공식 1을 지정해야합니다 lme4 R. 나는 수많은 교과서와 튜토리얼을 읽었지만 제대로 이해하지 못했습니다. 다음은 이 튜토리얼 에서 방정식으로 공식화하고 싶은 예입니다 . 우리는 다양한 시나리오에서 성별 (여성은 일반적으로 남성보다 음높이가 높음)과 사람의 태도 (정중 한 응답이든 비공식적 인 응답이든)에 따라 음성 주파수를 모델링하려고합니다. …

10 r multilevel-analysis lme4-nlme

4

신경망, auto.arima 및 ets를 사용한 R 시계열 예측

신경망을 사용하여 시계열을 예측하는 것에 대해 조금 들었습니다. 어떻게 시계열 (일일 소매 데이터)을 예측하는 방법이 더 좋은지 비교할 수 있습니다 : auto.arima (x), ets (x) 또는 nnetar (x). auto.arima와 AIC 또는 BIC의 ets를 비교할 수 있습니다. 그러나 어떻게 신경망과 비교할 수 있습니까? 예를 들면 다음과 같습니다. > dput(x) c(1774, 1706, …

10 r neural-networks forecasting arima exponential-smoothing

1

이 두 회귀 모형의 근본적인 차이점은 무엇입니까?

중요한 상관 관계가있는 이변 량 반응이 있다고 가정합니다. 이 결과를 모델링하는 두 가지 방법을 비교하려고합니다. 한 가지 방법은 두 결과 간의 차이를 모델링 할 수있다 : 또 다른 방법을 사용하는 것 또는 이를 모델링 : ( Y I의 J = β 0 + 시간 + X ' β )(yi2−yi1=β0+X′β)(yi2−yi1=β0+X′β)(y_{i2}-y_{i1}=\beta_0+X'\beta)glsgee(yij=β0+time+X′β)(yij=β0+time+X′β)(y_{ij}=\beta_0+\text{time}+X'\beta) 다음은 …

10 r regression model-selection

«r» 태그된 질문