통계 및 빅 데이터

1

신경망을 사용한 모델링에 익숙하지 않지만 관찰 된 데이터에 잘 맞는 모든 사용 가능한 데이터 포인트로 신경망을 구축 할 수있었습니다. 신경망은 nnet 패키지로 R에서 수행되었습니다. require(nnet) ##33.8 is the highest value mynnet.fit <- nnet(DOC/33.80 ~ ., data = MyData, size = 6, decay = 0.1, maxit = 1000) mynnet.predict <- predict(mynnet.fit)*33.80 …

33 r neural-networks

5

SVM은 한 번에 하나의 예를 스트리밍 학습 할 수 있습니까?

스트리밍 데이터 세트가 있는데 예제를 한 번에 하나씩 사용할 수 있습니다. 나는 그들에 대해 다중 클래스 분류를해야합니다. 학습 과정에 학습 예제를 제공하자마자 예제를 삭제해야합니다. 동시에, 나는 레이블이없는 데이터에 대한 예측을 수행하기 위해 최신 모델을 사용하고 있습니다. 내가 아는 한 신경망은 한 번에 하나의 예제를 제공하고 예제에서 순방향 전파 및 역방향 …

33 machine-learning svm neural-networks

7

계량 경제학에서 함수를 지정할 때 밑 수가 10 인 로그 대신 자연 로그 (ln)를 사용하는 이유는 무엇입니까?

33 econometrics

3

R과 함께 ARIMAX 모델을 맞추는 방법?

시간별 측정에는 4 가지 시계열이 있습니다. 집안의 열 소비 집 밖 온도 태양 복사 풍속 집안의 열 소비량을 예측할 수 있기를 원합니다. 매년 계절과 계절에 따라 뚜렷한 계절 경향이 있습니다. 다른 계열간에 명확한 상관 관계가 있기 때문에 ARIMAX 모델을 사용하여 적합하게 만들고 싶습니다. 패키지 TSA의 arimax 함수를 사용하여 R에서 수행 …

33 time-series modeling arima

3

물체의 색상을 결정하는 가장 정확한 방법은 무엇입니까?

컴퓨터 비전 (Gaussian Blur, thresholding, Hough-Transform 등)에 대한 몇 가지 표준 기술을 사용하여 정적 이미지 (.jpeg, .png 등)에서 동전을 감지 할 수있는 컴퓨터 프로그램을 작성했습니다. 주어진 이미지에서 가져온 동전의 비율을 사용하여 어떤 동전이 어느 것인지 확실하게 알 수 있습니다. 그러나 신뢰 수준을 높이고 유형 A로 추정되는 동전 (반지름 비율에서)이 올바른 …

33 image-processing

4

기준 논증은 무엇이며 왜 받아들이지 않았습니까?

RA Fisher의 최근 기여 중 하나는 기준 간격과 기준 원칙 논거 였습니다. 그러나이 접근 방식은 빈번하거나 베이지안 원칙적 주장만큼 인기가 없습니다. 기준 논증은 무엇이며 왜 받아 들여지지 않았습니까?

33 inference philosophical fiducial

2

푸 아송 분산 데이터에 대한 상자 그림 변형이 있습니까?

Poisson 분산 데이터 (또는 다른 분포)에 적합한 상자 그림 변형이 있는지 알고 싶습니다. 가우스 분포, 수염 = L = Q1-1.5 IQR 및 U = Q3 + 1.5 IQR에 배치 된 상자 그림에는 높은 특이 치 (U 이상의 점)만큼 낮은 특이 치 (L 이하)가있을 수 있습니다. ). 그러나 데이터가 포아송 분포이면 …

33 data-visualization poisson-distribution boxplot

5

계수 데이터에 푸 아송 회귀 분석이 사용되는 이유는 무엇입니까?

투표와 같은 특정 데이터 세트의 경우 성능이 더 우수하다는 것을 이해합니다. 포아송 회귀 분석이 왜 일반 선형 회귀 분석 또는 로지스틱 회귀 분석에 사용됩니까? 그것에 대한 수학적 동기는 무엇입니까?

33 count-data poisson-regression

4

R의 표준 오류 클러스터링 (수동 또는 plm)

표준 오류 "클러스터링"과 R에서 실행하는 방법을 이해하려고합니다 (Stata에서는 사소합니다). RI에서 plm나 자신의 기능을 사용 하거나 작성하는 데 실패했습니다 . 패키지 의 diamonds데이터를 사용하겠습니다 ggplot2. 더미 변수로 고정 효과를 할 수 있습니다 > library(plyr) > library(ggplot2) > library(lmtest) > library(sandwich) > # with dummies to create fixed effects > fe.lsdv <- …

33 r panel-data standard-error fixed-effects-model clustered-standard-errors

6

두 히스토그램의 유사성을 평가하는 방법은 무엇입니까?

두 개의 히스토그램이 주어지면 비슷한 지 아닌지를 어떻게 평가합니까? 단순히 두 히스토그램을 보는 것으로 충분합니까? 간단한 일대일 매핑은 히스토그램이 약간 다르고 약간 이동하면 원하는 결과를 얻지 못한다는 문제가 있습니다. 어떤 제안?

33 histogram image-processing

2

하나의 랜덤 변수 함수의 분산

알려진 분산과 평균을 갖는 임의의 변수 가 있다고 가정 해 봅시다 . 문제는 주어진 함수 f에 대한 의 분산은 무엇인가입니다 . 내가 아는 유일한 일반적인 방법은 델타 방법이지만 근사치 만 제공합니다. 이제 에 관심이 있지만 일반적인 방법을 알고 있으면 좋을 것입니다.f ( X ) f ( x ) = √XXXf(X)f(X)f(X)f(x)=x−−√f(x)=xf(x)=\sqrt{x} …

33 variance random-variable delta-method

10

통계를 두려워하는 학생들을 가르치는 방법?

이번 학기에 의대생에게 통계를 가르치려고합니다. 나는이 학생들이 통계를 배우는 것에 대한 두려움에 대한 많은 공포 이야기를 들었습니다. 누구나이 두려움으로 무엇을 할 수 있는지 제안 할 수 있습니까? (이 문제를 논의하는 사람들과 연결되거나 자신의 경험에서 제안을 제공)

33 teaching

14

생존 분석에 대한 참조

생존 분석에 대해 배울 수있는 좋은 책 / 자습서를 찾고 있습니다. 또한 R에서 생존 분석을 수행하는 것에 대한 참고 자료에 관심이 있습니다.

33 r survival references

1

GBM, XGBoost, LightGBM, CatBoost의 수학적 차이점은 무엇입니까?

다음과 같은 GBDT 모델 제품군에는 여러 가지 구현이 있습니다. GBM XGBoost 라이트 GBM Catboost. 이 다른 구현들 사이 의 수학적 차이점은 무엇입니까 ? Catboost는 이 벤치 마크 에 따라 기본 매개 변수 만 사용하더라도 다른 구현보다 성능이 뛰어나지 만 여전히 느립니다. 내 생각에 catboost는 희미한 변수를 사용하지 않으므로 각 (범주 …

33 boosting xgboost

1

L1 정규화를 사용한 회귀는 Lasso와 동일하고 L2 정규화를 사용한 회귀는 능선 회귀와 동일합니까? 그리고 "올가미"를 쓰는 방법?

저는 특히 Andrew Ng의 기계 학습 과정을 통해 소프트웨어 엔지니어 학습 기계 학습 입니다 . 정규화로 선형 회귀를 연구하는 동안 혼란스러운 용어를 발견했습니다. L1 정규화 또는 L2 정규화를 사용한 회귀 올가미 릿지 회귀 그래서 내 질문 : L1 정규화를 사용한 회귀는 LASSO와 정확히 동일합니까? L2 정규화를 사용한 회귀는 릿지 회귀와 …

33 regression terminology lasso regularization ridge-regression