통계 및 빅 데이터

통계, 기계 학습, 데이터 분석, 데이터 마이닝 및 데이터 시각화에 관심있는 사람들을위한 Q & A

1
R에서 신경망 모델을 훈련시키고 검증하는 방법?
신경망을 사용한 모델링에 익숙하지 않지만 관찰 된 데이터에 잘 맞는 모든 사용 가능한 데이터 포인트로 신경망을 구축 할 수있었습니다. 신경망은 nnet 패키지로 R에서 수행되었습니다. require(nnet) ##33.8 is the highest value mynnet.fit <- nnet(DOC/33.80 ~ ., data = MyData, size = 6, decay = 0.1, maxit = 1000) mynnet.predict <- predict(mynnet.fit)*33.80 …

5
SVM은 한 번에 하나의 예를 스트리밍 학습 할 수 있습니까?
스트리밍 데이터 세트가 있는데 예제를 한 번에 하나씩 사용할 수 있습니다. 나는 그들에 대해 다중 클래스 분류를해야합니다. 학습 과정에 학습 예제를 제공하자마자 예제를 삭제해야합니다. 동시에, 나는 레이블이없는 데이터에 대한 예측을 수행하기 위해 최신 모델을 사용하고 있습니다. 내가 아는 한 신경망은 한 번에 하나의 예제를 제공하고 예제에서 순방향 전파 및 역방향 …


3
R과 함께 ARIMAX 모델을 맞추는 방법?
시간별 측정에는 4 가지 시계열이 있습니다. 집안의 열 소비 집 밖 온도 태양 복사 풍속 집안의 열 소비량을 예측할 수 있기를 원합니다. 매년 계절과 계절에 따라 뚜렷한 계절 경향이 있습니다. 다른 계열간에 명확한 상관 관계가 있기 때문에 ARIMAX 모델을 사용하여 적합하게 만들고 싶습니다. 패키지 TSA의 arimax 함수를 사용하여 R에서 수행 …

3
물체의 색상을 결정하는 가장 정확한 방법은 무엇입니까?
컴퓨터 비전 (Gaussian Blur, thresholding, Hough-Transform 등)에 대한 몇 가지 표준 기술을 사용하여 정적 이미지 (.jpeg, .png 등)에서 동전을 감지 할 수있는 컴퓨터 프로그램을 작성했습니다. 주어진 이미지에서 가져온 동전의 비율을 사용하여 어떤 동전이 어느 것인지 확실하게 알 수 있습니다. 그러나 신뢰 수준을 높이고 유형 A로 추정되는 동전 (반지름 비율에서)이 올바른 …




4
R의 표준 오류 클러스터링 (수동 또는 plm)
표준 오류 "클러스터링"과 R에서 실행하는 방법을 이해하려고합니다 (Stata에서는 사소합니다). RI에서 plm나 자신의 기능을 사용 하거나 작성하는 데 실패했습니다 . 패키지 의 diamonds데이터를 사용하겠습니다 ggplot2. 더미 변수로 고정 효과를 할 수 있습니다 > library(plyr) > library(ggplot2) > library(lmtest) > library(sandwich) > # with dummies to create fixed effects > fe.lsdv <- …


2
하나의 랜덤 변수 함수의 분산
알려진 분산과 평균을 갖는 임의의 변수 가 있다고 가정 해 봅시다 . 문제는 주어진 함수 f에 대한 의 분산은 무엇인가입니다 . 내가 아는 유일한 일반적인 방법은 델타 방법이지만 근사치 만 제공합니다. 이제 에 관심이 있지만 일반적인 방법을 알고 있으면 좋을 것입니다.f ( X ) f ( x ) = √XXXf(X)f(X)f(X)f(x)=x−−√f(x)=xf(x)=\sqrt{x} …

10
통계를 두려워하는 학생들을 가르치는 방법?
이번 학기에 의대생에게 통계를 가르치려고합니다. 나는이 학생들이 통계를 배우는 것에 대한 두려움에 대한 많은 공포 이야기를 들었습니다. 누구나이 두려움으로 무엇을 할 수 있는지 제안 할 수 있습니까? (이 문제를 논의하는 사람들과 연결되거나 자신의 경험에서 제안을 제공)
33 teaching 

14
생존 분석에 대한 참조
생존 분석에 대해 배울 수있는 좋은 책 / 자습서를 찾고 있습니다. 또한 R에서 생존 분석을 수행하는 것에 대한 참고 자료에 관심이 있습니다.
33 r  survival  references 

1
GBM, XGBoost, LightGBM, CatBoost의 수학적 차이점은 무엇입니까?
다음과 같은 GBDT 모델 제품군에는 여러 가지 구현이 있습니다. GBM XGBoost 라이트 GBM Catboost. 이 다른 구현들 사이 의 수학적 차이점은 무엇입니까 ? Catboost는 이 벤치 마크 에 따라 기본 매개 변수 만 사용하더라도 다른 구현보다 성능이 뛰어나지 만 여전히 느립니다. 내 생각에 catboost는 희미한 변수를 사용하지 않으므로 각 (범주 …
33 boosting  xgboost 

1
L1 정규화를 사용한 회귀는 Lasso와 동일하고 L2 정규화를 사용한 회귀는 능선 회귀와 동일합니까? 그리고 "올가미"를 쓰는 방법?
저는 특히 Andrew Ng의 기계 학습 과정을 통해 소프트웨어 엔지니어 학습 기계 학습 입니다 . 정규화로 선형 회귀를 연구하는 동안 혼란스러운 용어를 발견했습니다. L1 정규화 또는 L2 정규화를 사용한 회귀 올가미 릿지 회귀 그래서 내 질문 : L1 정규화를 사용한 회귀는 LASSO와 정확히 동일합니까? L2 정규화를 사용한 회귀는 릿지 회귀와 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.