통계 및 빅 데이터

통계, 기계 학습, 데이터 분석, 데이터 마이닝 및 데이터 시각화에 관심있는 사람들을위한 Q & A

1
LASSO가 Laplace를 사용한 선형 회귀에 해당하는 경우 성분이 0 인 세트의 질량은 어떻게 될 수 있습니까?
우리는 LASSO 최적화 (단순성을 위해 여기서 선형 회귀의 경우에주의를 한정 함) 은 매개 변수에 Laplace prior \ exp (-\ lambda \ | \ beta \ | _1) 가 주어진 가우스 오류가있는 선형 모델과 같습니다. 또한 높은 값이 튜닝 매개 변수를 설정한다는 것을 알고 있습니다. \ lambda 이면 매개 변수 부분이 …

5
왜 정규 분포의 에 대해 편향되고 잘못된 표준 편차 공식을 사용 합니까?
그것은 나에게 충격의 비트로의 평균 것을 나는 정규 분포 몬테카를로 시뮬레이션을했고, 발견 처음 온 에서 표준 편차 샘플, 모든 단지의 샘플 크기를 갖는 훨씬 적은 것으로 판명를, 즉, 모집단을 생성하는 데 사용되는 평균 회보다 . 그러나 이것은 거의 기억 나지 않는다면 잘 알려져 있으며, 내가 알거나 시뮬레이션을하지 않았을 것입니다. 시뮬레이션은 …

3
기계 학습에서 왜 첨자 대신 첨자가 사용됩니까?
내가 데려 갈거야 코 세라를 통해 기계 학습에 앤드류 응의 과정을 . 방정식의 경우 아래 첨자 대신 위 첨자가 사용됩니다. 예를 들어, 다음 방정식 에서 대신 이 사용됩니다 . X 난엑스( 나는 )x(i)x^{(i)}엑스나는xix_i J( θ0, θ1) = 12 M∑나는 = 1엠( 시간θ( x( 나는 )) − y( 나는 ))2J(θ0,θ1)=12m∑i=1m(hθ(x(i))−y(i))2J(\theta_0, \theta_1) …

1
스플라인을 예측에 사용할 수 있습니까?
나는 데이터가 독점적이므로 데이터의 특성에 대해 구체적으로 말할 수는 없지만 다음과 같은 데이터가 있다고 가정합니다. 매달 어떤 사람들은 서비스에 가입합니다. 그런 다음 각 달에 그 사람들은 서비스를 업그레이드하거나 서비스를 중단하거나 서비스를 거부 할 수 있습니다 (예 : 지불 실패). 데이터에서 가장 빠른 코호트의 경우 약 2 년의 데이터 (24 개월)가 …


3
두 정규 분포 간의 차이 분포
정규 분포의 두 가지 확률 밀도 함수가 있습니다. f1(x1|μ1,σ1)=1σ12π−−√e−(x−μ1)22σ21f1(x1|μ1,σ1)=1σ12πe−(x−μ1)22σ12f_1(x_1 \; | \; \mu_1, \sigma_1) = \frac{1}{\sigma_1\sqrt{2\pi} } \; e^{ -\frac{(x-\mu_1)^2}{2\sigma_1^2} } 과 f2(x2|μ2,σ2)=1σ22π−−√e−(x−μ2)22σ22f2(x2|μ2,σ2)=1σ22πe−(x−μ2)22σ22f_2(x_2 \; | \; \mu_2, \sigma_2) = \frac{1}{\sigma_2\sqrt{2\pi} } \; e^{ -\frac{(x-\mu_2)^2}{2\sigma_2^2} } 과 사이의 분리 확률 확률 함수를 찾고 있습니다. 내 생각에 의 확률 밀도 함수를 찾고 …


1
표본 표준 편차의 표준 오차는 무엇입니까?
에서 본인은 이 표본 분산의 표준 오차가 있음 에스이자형에스2= 2 σ4엔− 1−−−−−−√에스이자형에스2=2σ4엔−1SE_{s^2} = \sqrt{\frac{2 \sigma^4}{N-1}} 표본 표준 편차의 표준 오차는 무엇입니까? 나는 라고 추측하고 유혹하고 싶지만 확실하지 않습니다.에스이자형에스= S이자형에스2−−−−√에스이자형에스=에스이자형에스2SE_{s} = \sqrt{SE_{s^2}}

1
PCA / 대응 분석에서 "말발굽 효과"및 / 또는 "아치 효과"란 무엇입니까?
다차원 데이터의 탐색 적 데이터 분석을위한 생태 통계에는 많은 기술이 있습니다. 이것을 '조정'기술이라고합니다. 대부분 통계의 다른 곳에서 공통 기술과 동일하거나 밀접하게 관련되어 있습니다. 아마도 프로토 타입 예제는 주성분 분석 (PCA) 일 것입니다. 생태 학자들은 PCA와 관련 기술을 사용하여 '그라데이션'을 탐색 할 수 있습니다 (그라데이션이 무엇인지 완전히 명확하지는 않지만 조금 그것에 …

4
행렬 미적분학 교과서?
Math SE에서이 질문을 참조하십시오 . 짧은 이야기 : 통계 학습의 요소를 읽은 후 와 같이 일부 결과를 확인하려고 할 때 좌절했습니다. 그런 다음 I 전통적인 미적분학 책처럼 쓰여진 행렬 미적분학 책을 찾고 있습니다 (즉, 이론 증명, 예제, 계산 연습 등). 나는 이미이 질문을 보았다RSS ( β) = ( y − …

1
사용하는 경우합니까 스타 인의 역설은 여전히 유지 규범 대신 규범을?
Stein 's Paradox 는 3 개 이상의 매개 변수가 동시에 추정 될 때 매개 변수를 개별적으로 처리하는 방법보다 평균보다 더 정확한 평균 (즉, 예상 평균 제곱 오차가 더 낮은) 조합 추정기가 존재 함을 보여줍니다. 이것은 매우 반 직관적 인 결과입니다. 표준 (예상 평균 제곱 오차)을 사용하는 표준 (예상 평균 절대 …

5
정규화 알고리즘을 사용하는 동안 여전히 기능 선택이 필요합니까?
통계 학습 알고리즘을 실행하기 전에 기능 선택 방법 (랜덤 포리스트 기능 중요도 값 또는 일 변량 기능 선택 방법 등)을 사용해야하는 것과 관련하여 한 가지 질문이 있습니다. 우리는 과적 합을 피하기 위해 가중치 벡터에 정규화 페널티를 도입 할 수 있습니다. 따라서 선형 회귀를 원한다면 L2 또는 L1 또는 Elastic net …

1
서수 데이터를 출력하도록 신경망을 설정하는 방법은 무엇입니까?
출력 변수가 서수 인 것을 예측하도록 신경망을 설정했습니다. 가능한 세 가지 출력 A <B <C를 사용하여 아래에 설명합니다. 신경망을 사용하여 범주 형 데이터를 출력하는 방법은 매우 분명합니다. 출력은 마지막 (보통 완전히 연결된) 레이어의 소프트 맥스이며 범주 당 하나씩이며 예측 된 범주는 가장 큰 출력값을 가진 레이어입니다 (이는 많은 인기있는 모델의 …

1
Markov 의사 결정 프로세스의 실제 예
나는 많은 튜토리얼 비디오를보고 있었고 그들은 동일하게 보입니다. 예를 들면 다음과 같습니다. https://www.youtube.com/watch?v=ip4iSMRW5X4 그들은 상태, 행동 및 확률을 설명합니다. 그 사람은 그것을 잘 설명하지만 실제 생활에서 사용되는 것을 파악할 수는 없습니다. 아직 목록을 보지 못했습니다. 내가 보는 가장 일반적인 것은 체스입니다. 사물을 예측하는 데 사용할 수 있습니까? 그렇다면 어떤 유형의 …


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.