통계 및 빅 데이터

6

볼록한 문제의 경우 SG (Stochastic Gradient Descent)의 그래디언트가 항상 전역 극단 값을 가리 킵니까?

볼록한 비용 함수가 주어지면 최적화를 위해 SGD를 사용하여 최적화 프로세스 중에 특정 지점에서 그라디언트 (벡터)를 갖게됩니다. 내 질문은 볼록한 점을 감안할 때 그라디언트가 함수가 가장 빠르게 증가 / 감소하는 방향만을 가리 키거나 그라디언트는 항상 비용 함수의 최적 / 극한 점을 가리 킵 니까? 전자는 지역 개념이고, 후자는 글로벌 개념입니다. SGD는 …

25 neural-networks optimization gradient-descent sgd convex

1

통계가 매끄럽다면 부트 스트랩이 유효한 결과가 있습니까?

우리가 가정에 걸쳐 통계 일부 데이터의 함수 인 X 1 , ... X N 분포 함수로부터 인출되는 F ; 우리의 샘플의 경험적 분포 함수는 F . 그래서 θ ( F는 ) 임의의 변수로 간주 통계입니다 θ ( F가 ) 통계의 부트 스트랩 버전입니다. 우리는 d ∞ 를 KS 거리로 사용합니다θ …

25 probability mathematical-statistics bootstrap asymptotics consistency

3

여러 LSTM을 스태킹하면 어떤 이점이 있습니까?

딥 네트워크에서 여러 개의 LSTM을 나란히 쌓아 두는 이점은 무엇입니까? LSTM을 사용하여 일련의 입력을 단일 입력으로 나타냅니다. 그래서 일단 그 단일 표현을 가졌는데 왜 다시 통과해야합니까? 나는 자연어 생성 프로그램에서 이것을 보았 기 때문에 이것을 요구하고 있습니다.

25 classification neural-networks deep-learning lstm rnn

1

정류 선형 단위가 비선형으로 간주되는 이유는 무엇입니까?

정류 선형 유닛 (ReLU) 의 활성화 기능이 비선형으로 간주되는 이유는 무엇 입니까? f(x)=max(0,x)f(x)=max(0,x) f(x) = \max(0,x) 입력이 긍정적 일 때 선형 적이며 딥 네트워크의 대표적 힘을 풀기위한 나의 이해에서 비선형 활성화는 필수입니다. 그렇지 않으면 전체 네트워크가 단일 계층으로 표현 될 수 있습니다.

25 neural-networks deep-learning

4

독립적 인 랜덤 변수의 함수

독립적 인 랜덤 변수의 기능 자체가 독립적이라는 주장이 사실입니까? 예를 들어 표본 분포와 정규 분포의 표본 분산 사이의 독립성 증거와 같이 일부 증거에서 종종 결과가 암시 적으로 사용되는 것을 보았지만 그에 대한 정당성을 찾을 수 없었습니다. 일부 저자는 주어진대로 가져 오는 것처럼 보이지만 이것이 항상 그런 것인지는 확실하지 않습니다.

25 probability self-study random-variable independence

5

누락 된 데이터를 처리하기위한 기계 학습 알고리즘

실험실 값을 포함한 고차원 임상 데이터를 사용하여 예측 모델을 개발하려고합니다. 5k 샘플과 200 개의 변수로 데이터 공간이 희소합니다. 아이디어는 피처 선택 방법 (IG, RF 등)을 사용하여 변수의 순위를 매기고 예측 모델을 개발하기 위해 최상위 피처를 사용하는 것입니다. Naïve Bayes 접근 방식으로 기능 선택이 잘 진행되는 동안 가변 공간에서 데이터 누락 …

25 machine-learning missing-data

2

Dirichlet 배포판에서 그리기

차원 벡터 모수 갖는 Dirichlet 분포가 있다고 가정 해 봅시다 . 이 분포에서 표본 ( K- 차원 벡터)을 어떻게 그릴 수 있습니까? (아마도) 간단한 설명이 필요합니다.→ α = [ α 1 , α 2 , … . . , α K ] KKKKα⃗ =[α1,α2,...,αK]α→=[α1,α2,...,αK]\vec\alpha = [\alpha_1, \alpha_2,...,\alpha_K]KKK

25 sampling dirichlet-distribution

2

로지스틱 회귀의 직관

최근 기계 학습을 시작했지만 로지스틱 회귀 의 직관을 파악하지 못했습니다 . 다음은 내가 이해하는 로지스틱 회귀에 대한 사실입니다. 가설의 기초로 우리는 시그 모이 드 함수를 사용 합니다 . 그것이 왜 나는 이해한다 올바른 선택 그것은이다 그러나 왜, 단지 이해가 안 선택. 가설은 적절한 출력이 일 확률을 나타내 므로 함수 영역이 …

25 regression machine-learning logistic

5

이진 변수를 표준화해야합니까?

기능 세트가있는 데이터 세트가 있습니다. 이들 중 일부는 이진 활성 또는 해고, 0 = 비활성 또는 휴면)이고 나머지는 실제 값입니다 (예 : 4564.342) .( 1 =(1=(1=0 =0=0=4564.3424564.3424564.342 이 데이터를 기계 학습 알고리즘에 공급하고 싶기 때문에 모든 실제 가치 기능을 점수로 매 깁니다. 나는 범위 사이에 그들을 얻을 3 과 - …

25 machine-learning normalization binary-data

1

일대일 교차 검증은 어떻게 작동합니까? 다른 모델 중에서 최종 모델을 선택하는 방법은 무엇입니까?

데이터가 있고이 데이터로 모델 (선형 회귀 모델)을 만들고 싶습니다. 다음 단계에서는 모델에 LOOCV (Leave-One-Out Cross-Validation)를 적용하여 성능이 어느 정도인지 확인하고 싶습니다. LOOCV를 올바르게 이해했다면이 샘플 (훈련 세트)을 제외한 모든 샘플을 사용하여 각 샘플 (테스트 세트)에 대해 새 모델을 작성합니다. 그런 다음 모델을 사용하여 테스트 세트를 예측하고 오류 합니다.( 예측 - …

25 cross-validation

1

행과 열 길이에 제약이있는 랜덤 행렬

행과 열을 갖는 임의의 비 제곱 행렬 , 평균 = 0으로 임의로 분포 된 요소 를 생성 하고 각 행의 길이 (L2 규범)가 이고 각 열의 길이가 . 마찬가지로, 제곱 값의 합은 각 행에 대해 1이고 각 열에 대해 입니다.RRRCCC111RC−−√RC\sqrt{\frac{R}{C}}RCRC\frac{R}{C} 지금까지 나는 이것을 달성하는 한 가지 방법을 발견했다. 매트릭스 요소를 …

25 random-generation normalization markov-process random-matrix

3

R에서 열 단위 행렬 정규화 [닫기]

닫은. 이 질문은 주제에 맞지 않습니다 . 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 교차 검증에 대한 주제가 되도록 질문을 업데이트하십시오 . 휴일 육년 전 . R에서 행렬의 열 단위 정규화를 수행하고 싶습니다. 행렬이 주어지면 m각 요소를 열의 합으로 나누어 각 열을 정규화하고 싶습니다. 이 작업을 수행하는 한 가지 방법은 …

25 r data-transformation normalization matrix

1

유한 보정 계수의 설명

유한 모집단에서 표본을 추출 할 때 표본 크기가 모집단의 5 % 이상인 경우 다음 공식을 사용하여 표본의 평균 및 표준 오류를 수정해야합니다. 에프피기음= N− n엔− 1−−−−√에프피기음=엔−엔엔−1\hspace{10mm} FPC=\sqrt{\frac{N-n}{N-1}} 여기서 은 모집단 크기이고 은 표본 크기입니다.엔엔N엔엔n 이 공식에 대해 3 가지 질문이 있습니다. 임계 값이 5 %로 설정된 이유는 무엇입니까? 공식은 어떻게 …

25 sampling finite-population

2

R 시계열 벡터 서브 셋팅

시계열이 있고 시계열로 유지하면서 시작, 끝 및 빈도를 유지하면서 부분 집합을 만들고 싶습니다. 예를 들어 시계열이 있다고 가정 해 보겠습니다. > qs <- ts(101:110, start=c(2009, 2), frequency=4) > qs Qtr1 Qtr2 Qtr3 Qtr4 2009 101 102 103 2010 104 105 106 107 2011 108 109 110 이제 서브셋을 만들겠습니다. > …

25 r time-series

4

상호 작용이 회귀에서 직접 효과를 없애면 어떻게됩니까?

회귀에서 교호 작용 항은 관련된 직접 효과를 모두 제거합니다. 상호 작용을 삭제하거나 결과를보고합니까? 상호 작용은 원래 가설의 일부가 아니 었습니다.

25 regression interaction