통계 및 빅 데이터

1

LASSO가 Laplace를 사용한 선형 회귀에 해당하는 경우 성분이 0 인 세트의 질량은 어떻게 될 수 있습니까?

우리는 LASSO 최적화 (단순성을 위해 여기서 선형 회귀의 경우에주의를 한정 함) 은 매개 변수에 Laplace prior \ exp (-\ lambda \ | \ beta \ | _1) 가 주어진 가우스 오류가있는 선형 모델과 같습니다. 또한 높은 값이 튜닝 매개 변수를 설정한다는 것을 알고 있습니다. \ lambda 이면 매개 변수 부분이 …

20 lasso laplace-distribution

5

왜 정규 분포의 에 대해 편향되고 잘못된 표준 편차 공식을 사용 합니까?

그것은 나에게 충격의 비트로의 평균 것을 나는 정규 분포 몬테카를로 시뮬레이션을했고, 발견 처음 온 에서 표준 편차 샘플, 모든 단지의 샘플 크기를 갖는 훨씬 적은 것으로 판명를, 즉, 모집단을 생성하는 데 사용되는 평균 회보다 . 그러나 이것은 거의 기억 나지 않는다면 잘 알려져 있으며, 내가 알거나 시뮬레이션을하지 않았을 것입니다. 시뮬레이션은 …

20 normal-distribution standard-deviation expected-value unbiased-estimator umvue

3

기계 학습에서 왜 첨자 대신 첨자가 사용됩니까?

내가 데려 갈거야 코 세라를 통해 기계 학습에 앤드류 응의 과정을 . 방정식의 경우 아래 첨자 대신 위 첨자가 사용됩니다. 예를 들어, 다음 방정식 에서 대신 이 사용됩니다 . X 난엑스( 나는 )x(i)x^{(i)}엑스나는xix_i J( θ0, θ1) = 12 M∑나는 = 1엠( 시간θ( x( 나는 )) − y( 나는 ))2J(θ0,θ1)=12m∑i=1m(hθ(x(i))−y(i))2J(\theta_0, \theta_1) …

20 machine-learning notation

1

스플라인을 예측에 사용할 수 있습니까?

나는 데이터가 독점적이므로 데이터의 특성에 대해 구체적으로 말할 수는 없지만 다음과 같은 데이터가 있다고 가정합니다. 매달 어떤 사람들은 서비스에 가입합니다. 그런 다음 각 달에 그 사람들은 서비스를 업그레이드하거나 서비스를 중단하거나 서비스를 거부 할 수 있습니다 (예 : 지불 실패). 데이터에서 가장 빠른 코호트의 경우 약 2 년의 데이터 (24 개월)가 …

20 panel-data splines mars

9

1과 2를 굴릴 확률이 1/18이라는 것을 어떻게 알 수 있습니까?

첫 번째 확률 수업 이후 다음에 대해 궁금해하고 있습니다. 확률 계산은 일반적으로 가능한 모든 이벤트에 대한 "인기 이벤트"의 비율을 통해 도입됩니다. 두 개의 6면 주사위를 굴릴 경우 가능한 이벤트의 양은 아래 표 참조).363636 12삼4561( 1 , 1 )( 2 , 1 )( 3 , 1 )( 4 , 1 )( …

20 probability dice

3

두 정규 분포 간의 차이 분포

정규 분포의 두 가지 확률 밀도 함수가 있습니다. f1(x1|μ1,σ1)=1σ12π−−√e−(x−μ1)22σ21f1(x1|μ1,σ1)=1σ12πe−(x−μ1)22σ12f_1(x_1 \; | \; \mu_1, \sigma_1) = \frac{1}{\sigma_1\sqrt{2\pi} } \; e^{ -\frac{(x-\mu_1)^2}{2\sigma_1^2} } 과 f2(x2|μ2,σ2)=1σ22π−−√e−(x−μ2)22σ22f2(x2|μ2,σ2)=1σ22πe−(x−μ2)22σ22f_2(x_2 \; | \; \mu_2, \sigma_2) = \frac{1}{\sigma_2\sqrt{2\pi} } \; e^{ -\frac{(x-\mu_2)^2}{2\sigma_2^2} } 과 사이의 분리 확률 확률 함수를 찾고 있습니다. 내 생각에 의 확률 밀도 함수를 찾고 …

20 distributions normal-distribution distance

2

랜덤 포레스트에서 "노드 크기"란 무엇입니까?

노드 크기의 의미를 정확히 이해하지 못합니다. 의사 결정 노드가 무엇인지 알고 있지만 노드 크기는 무엇인지 알지 못합니다.

20 machine-learning random-forest bagging

1

표본 표준 편차의 표준 오차는 무엇입니까?

에서 본인은 이 표본 분산의 표준 오차가 있음 에스이자형에스2= 2 σ4엔− 1−−−−−−√에스이자형에스2=2σ4엔−1SE_{s^2} = \sqrt{\frac{2 \sigma^4}{N-1}} 표본 표준 편차의 표준 오차는 무엇입니까? 나는 라고 추측하고 유혹하고 싶지만 확실하지 않습니다.에스이자형에스= S이자형에스2−−−−√에스이자형에스=에스이자형에스2SE_{s} = \sqrt{SE_{s^2}}

20 sampling standard-deviation standard-error

1

PCA / 대응 분석에서 "말발굽 효과"및 / 또는 "아치 효과"란 무엇입니까?

다차원 데이터의 탐색 적 데이터 분석을위한 생태 통계에는 많은 기술이 있습니다. 이것을 '조정'기술이라고합니다. 대부분 통계의 다른 곳에서 공통 기술과 동일하거나 밀접하게 관련되어 있습니다. 아마도 프로토 타입 예제는 주성분 분석 (PCA) 일 것입니다. 생태 학자들은 PCA와 관련 기술을 사용하여 '그라데이션'을 탐색 할 수 있습니다 (그라데이션이 무엇인지 완전히 명확하지는 않지만 조금 그것에 …

20 pca eda ecology correspondence-analysis

4

행렬 미적분학 교과서?

Math SE에서이 질문을 참조하십시오 . 짧은 이야기 : 통계 학습의 요소를 읽은 후 와 같이 일부 결과를 확인하려고 할 때 좌절했습니다. 그런 다음 I 전통적인 미적분학 책처럼 쓰여진 행렬 미적분학 책을 찾고 있습니다 (즉, 이론 증명, 예제, 계산 연습 등). 나는 이미이 질문을 보았다RSS ( β) = ( y − …

20 references matrix matrix-calculus

1

사용하는 경우합니까 스타 인의 역설은 여전히 유지 규범 대신 규범을?

Stein 's Paradox 는 3 개 이상의 매개 변수가 동시에 추정 될 때 매개 변수를 개별적으로 처리하는 방법보다 평균보다 더 정확한 평균 (즉, 예상 평균 제곱 오차가 더 낮은) 조합 추정기가 존재 함을 보여줍니다. 이것은 매우 반 직관적 인 결과입니다. 표준 (예상 평균 제곱 오차)을 사용하는 표준 (예상 평균 절대 …

20 paradox steins-phenomenon

5

정규화 알고리즘을 사용하는 동안 여전히 기능 선택이 필요합니까?

통계 학습 알고리즘을 실행하기 전에 기능 선택 방법 (랜덤 포리스트 기능 중요도 값 또는 일 변량 기능 선택 방법 등)을 사용해야하는 것과 관련하여 한 가지 질문이 있습니다. 우리는 과적 합을 피하기 위해 가중치 벡터에 정규화 페널티를 도입 할 수 있습니다. 따라서 선형 회귀를 원한다면 L2 또는 L1 또는 Elastic net …

20 regression machine-learning feature-selection lasso regularization

1

서수 데이터를 출력하도록 신경망을 설정하는 방법은 무엇입니까?

출력 변수가 서수 인 것을 예측하도록 신경망을 설정했습니다. 가능한 세 가지 출력 A <B <C를 사용하여 아래에 설명합니다. 신경망을 사용하여 범주 형 데이터를 출력하는 방법은 매우 분명합니다. 출력은 마지막 (보통 완전히 연결된) 레이어의 소프트 맥스이며 범주 당 하나씩이며 예측 된 범주는 가장 큰 출력값을 가진 레이어입니다 (이는 많은 인기있는 모델의 …

20 neural-networks ordinal-data softmax

1

Markov 의사 결정 프로세스의 실제 예

나는 많은 튜토리얼 비디오를보고 있었고 그들은 동일하게 보입니다. 예를 들면 다음과 같습니다. https://www.youtube.com/watch?v=ip4iSMRW5X4 그들은 상태, 행동 및 확률을 설명합니다. 그 사람은 그것을 잘 설명하지만 실제 생활에서 사용되는 것을 파악할 수는 없습니다. 아직 목록을 보지 못했습니다. 내가 보는 가장 일반적인 것은 체스입니다. 사물을 예측하는 데 사용할 수 있습니까? 그렇다면 어떤 유형의 …

20 markov-process

2

모멘트 방법의 논리는 무엇입니까?

"Moments of Moments"에서 왜 포인트 모멘트를 찾기 위해 샘플 모멘트를 모집 모멘트와 동일시합니까? 이것의 논리는 어디에 있습니까?

20 intuition method-of-moments