«feature-selection» 태그된 질문

추가 모델링에 사용할 속성의 하위 집합을 선택하는 방법 및 원리

1
심층 신경망에서의 민감도 분석
이미 한 질문 ( One-Layer 피드 포워드 네트워크에서 가중치 중요성 추출 )에 따라 신경망에서 입력의 관련성에 대한 추론을 찾고 있습니다. 관심있는 출력 노드에서 레이어를 통해 뒤로 이동하여 입력 중요도를 재구성하는 것이 어렵거나 시간이 많이 걸리는 딥 넷을 고려할 때 신경망에 대한 감도 분석을 수행하는 데 이론적 프레임 워크가 있는지 궁금해했습니다. …

1
베이지안 올가미 및 스파이크 및 슬래브
질문 : 변수 선택을 위해 하나를 사용하는 것의 장점 / 단점은 무엇입니까? I는 가능성이 있다고 가정 I를 넣을 수 어느 사도 중 하나 : 또는 y∼N(Xw,σ2I)y∼N(Xw,σ2I)y\sim\mathcal{N}(Xw,\sigma^2I)wi∼πδ0+(1−π)N(0,100)π=0.9,wi∼πδ0+(1−π)N(0,100)π=0.9, w_i\sim \pi\delta_0+(1-\pi)\mathcal{N}(0,100)\\ \pi=0.9\,, wi∼exp(−λ|wi|)λ∼Γ(1,1).wi∼exp⁡(−λ|wi|)λ∼Γ(1,1). w_i\sim \exp(-\lambda|w_i|)\\ \lambda \sim \Gamma(1,1)\,. 나는 '정규화'매개 변수를 선택 하기 위해 대부분의 가중치가 0이고 이전의 감마를 강조하기 위해 를 넣었습니다 …

3
신경망에 기능 선택 / 엔지니어링이 필요한 이유는 무엇입니까?
특히 kaggle 경쟁과 관련하여 모델의 성능이 기능 선택 / 엔지니어링에 관한 것임을 알았습니다. 더 전통적인 / 구식 ML 알고리즘을 처리 할 때 그 이유가 무엇인지 완전히 이해할 수는 있지만 심층 신경망을 사용할 때 왜 그런지 알 수 없습니다. 딥 러닝 책 인용 : 딥 러닝은 다른 더 단순한 표현으로 표현되는 …

3
기계 학습 파이프 라인에서 기능 선택 및 하이퍼 파라미터 최적화를 어떻게 주문해야합니까?
내 목표는 센서 신호를 분류하는 것입니다. 지금까지 내 솔루션의 개념은 다음과 같습니다. i) 원시 신호에서 엔지니어링 기능 ii) ReliefF 및 클러스터링 방식으로 관련 기능 선택 iii) NN, 랜덤 포레스트 및 SVM 적용 그러나 나는 딜레마에 갇혀있다. ii) 및 iii)에는 ReliefF의 k-Nearest Neigbours 또는 센서 신호가 평가되는 창 길이 또는 NN의 …

2
올가미와 비교하여 최상의 서브 세트 선택이 선호되지 않는 이유는 무엇입니까?
통계 학습 서적의 요소에서 최상의 하위 집합 선택에 대해 읽고 있습니다. 3 개의 예측 변수 이 있으면 2 3 = 8 부분 집합을 만듭니다 .엑스1, x2, x삼x1,x2,x3x_1,x_2,x_32삼= 823=82^3=8 예측 변수가없는 부분 집합 예측 변수가 x 1 인 부분 집합엑스1x1x_1 예측 변수가 x 2 인 부분 집합엑스2x2x_2 예측 변수 x 3의 …

2
변수 선택에 대한 충돌 접근법 : AIC, p- 값 또는 둘 다?
내가 이해 한 바에 따르면, p- 값을 기반으로 한 변수 선택 (적어도 회귀 컨텍스트에서)에는 결함이 있습니다. AIC (또는 유사한)를 기반으로 한 변수 선택도 비슷한 이유로 약간의 결함으로 간주됩니다. 비록 이것이 다소 불분명 한 것처럼 보이지만 (예를 들어 내 질문 과이 주제에 대한 일부 링크를 참조하십시오 : "단계적 모델 선택"은 정확히 …


2
p> n 인 경우 올가미는 최대 n 개의 변수를 선택합니다.
탄력적 그물의 동기 중 하나는 다음과 같은 LASSO의 한계였습니다. 에서 경우로 인해 볼록 최적화 문제의 본질 올가미 최대 선택 변수 N 그것을 전에 포화된다. 이것은 변수 선택 방법에 대한 제한 기능인 것 같습니다. 또한, 계수의 L1- 노름에 대한 경계가 특정 값보다 작지 않으면 올가미가 잘 정의되지 않습니다.p > np>np > …

1
랜덤 포레스트에서 왜 트리 레벨이 아닌 노드 레벨에서 기능의 랜덤 서브 세트가 선택됩니까?
내 질문 : 왜 임의 포리스트 는 트리 수준이 아닌 각 트리 내의 노드 수준 에서 분할하기 위해 기능의 임의 하위 집합을 고려 합니까? 배경 : 이것은 역사 문제입니다. 주석 캄 호 출판 이 논문을 무작위로 성장하기 위해서 사용하는 기능의 일부를 선택하여 "결정 숲을"건설에 나무를 2001 년 이후 1998 년 …

2
단계적 회귀를 사용해야하는 상황이 있습니까?
과거에 많은 생물 의학 논문에서 단계적 회귀가 과도하게 사용되었지만 많은 문제에 대한 더 나은 교육으로 개선되고있는 것으로 보입니다. 그러나 많은 오래된 검토 자들은 여전히 ​​그것을 요구합니다. 단계적 회귀는 역할을하고 상황은 무엇입니까 해야합니다 (있는 경우)를 사용할 수는?


1
LLE (local linear embedding) 알고리즘의 단계를 설명 하시겠습니까?
LLE 알고리즘의 기본 원리는 세 단계로 구성되어 있습니다. k-nn과 같은 메트릭으로 각 데이터 포인트의 주변을 찾습니다. 이웃이 데이터 포인트에 미치는 영향을 나타내는 각 이웃에 대한 가중치를 찾으십시오. 계산 된 가중치를 기반으로 데이터의 저 차원 임베딩을 구성하십시오. 그러나 2 단계와 3 단계에 대한 수학적 설명은 내가 읽은 모든 교과서와 온라인 자료에서 …


2
상호 작용 모델에서 최상의 기능 찾기
기능 값이있는 단백질 목록이 있습니다. 샘플 테이블은 다음과 같습니다. ...............Feature1...Feature2...Feature3...Feature4 Protein1 Protein2 Protein3 Protein4 행은 단백질이고 열은 기능입니다. 또한 상호 작용하는 단백질 목록도 있습니다. 예를 들어 Protein3, Protein4 Protein1, Protein2 Protein4, Protein1 문제점 : 예비 분석을 위해 어떤 기능이 단백질 상호 작용에 가장 큰 영향을 미치는지 알고 싶습니다. 내 이해는 …

3
군집 확률 분포-방법 및 지표?
나는 각각 5 개의 벡터로 된 응집 된 이산 결과를 포함하고, 각각의 벡터의 결과는 다른 분포에 의해 생성 된 일부 데이터 포인트를 가지고 있습니다 (구체적으로는 확실하지 않습니다. 법칙 (대략 1 ~ 0). K-Means와 같은 클러스터링 알고리즘을 사용하여 5 가지 구성 요소 분포의 속성을 기반으로 각 데이터 포인트를 그룹으로 분류하려고합니다. 이러한 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.