«feature-extraction» 태그된 질문

회귀 또는 회귀 유사 모델 (클러스터링, 차별 등)에 사용되는 변수 (예측 또는 설명에 사용됨). 이러한 변수를 구성하거나 변수 중에서 가장 좋은 것을 선택하는 것에 대한 질문에이 태그를 사용하십시오.



6
월 또는 시간과 같은 기능을 범주 또는 숫자로 인코딩합니까?
기계 학습 모델에서 월 및 시간과 같은 기능을 요소 또는 숫자로 인코딩하는 것이 더 낫습니까? 한편으로, 나는 시간이 앞으로 진행되는 과정이기 때문에 숫자 인코딩이 합리적이라고 생각하지만 (5 개월은 6 개월이 뒤 따름), 반면에 순환 인코딩으로 인해 범주 형 인코딩이 더 합리적이라고 생각합니다 연도 및 일수 (12 번째 달 다음에 첫 …

3
입력 데이터의 기능 변환
나는이 OTTO Kaggle 챌린지 에 대한 솔루션에 대해 읽고 있었고 첫 번째 장소 솔루션은 입력 데이터 X에 대해 몇 가지 변환을 사용하는 것 같습니다 (예 : Log (X + 1), sqrt (X + 3/8) 등). 다양한 분류 자에게 어떤 종류의 변환을 적용 할 것인지에 대한 일반 지침? 평균-평균 및 최소-최대 …


3
알 수없는 기능에서 기능 엔지니어링을 수행하는 방법은 무엇입니까?
카글 경쟁에 참여하고 있습니다. 데이터 세트에는 약 100 개의 기능이 있으며 모두 실제로는 무엇을 나타내는 지 알 수 없습니다. 기본적으로 그들은 단지 숫자입니다. 사람들은 이러한 기능에 대해 많은 기능 엔지니어링을 수행하고 있습니다. 정확히 알려지지 않은 기능에 대해 기능 공학을 정확히 수행 할 수있는 방법이 궁금합니다. 알려지지 않은 기능에 대해 기능 …

3
파이썬에서 이미지 추출 기능
내 수업에서는 이미지의 객체가 phylum porifera (seasponge) 또는 다른 객체의 예인지 여부를 결정하기 위해 두 개의 분류자를 사용하여 응용 프로그램을 만들어야합니다. 그러나 파이썬에서 기능 추출 기술과 관련하여 완전히 잃어 버렸습니다. 조언자는 수업 시간에 다루지 않은 이미지를 사용하도록 설득했습니다. 누구든지 의미있는 문서 나 독서를 지시하거나 고려할 방법을 제안 할 수 있습니까?

5
seaborn 히트 맵을 더 크게 만들기
corr()원본 df 에서 df를 만듭니다 . corr()DF는 70 X 70에서 나와는 히트 맵을 시각화하는 것은 불가능합니다 ... sns.heatmap(df). 를 표시하려고 corr = df.corr()하면 테이블이 화면에 맞지 않으며 모든 상관 관계를 볼 수 있습니다. df크기에 관계없이 전체를 인쇄 하거나 히트 맵의 크기를 제어하는 ​​방법입니까?
17 visualization  pandas  plotting  machine-learning  neural-network  svm  decision-trees  svm  efficiency  python  linear-regression  machine-learning  nlp  topic-model  lda  named-entity-recognition  naive-bayes-classifier  association-rules  fuzzy-logic  kaggle  deep-learning  tensorflow  inception  classification  feature-selection  feature-engineering  machine-learning  scikit-learn  tensorflow  keras  encoding  nlp  text-mining  nlp  rnn  python  neural-network  feature-extraction  machine-learning  predictive-modeling  python  r  linear-regression  clustering  r  ggplot2  neural-network  neural-network  training  python  neural-network  deep-learning  rnn  predictive-modeling  databases  sql  programming  distribution  dataset  cross-validation  neural-network  deep-learning  rnn  machine-learning  machine-learning  python  deep-learning  data-mining  tensorflow  visualization  tools  sql  embeddings  orange  feature-extraction  unsupervised-learning  gan  machine-learning  python  data-mining  pandas  machine-learning  data-mining  bigdata  apache-spark  apache-hadoop  deep-learning  python  convnet  keras  aggregation  clustering  k-means  r  random-forest  decision-trees  reference-request  visualization  data  pandas  plotting  neural-network  keras  rnn  theano  deep-learning  tensorflow  inception  predictive-modeling  deep-learning  regression  sentiment-analysis  nlp  encoding  deep-learning  python  scikit-learn  lda  convnet  keras  predictive-modeling  regression  overfitting  regression  svm  prediction  machine-learning  similarity  word2vec  information-retrieval  word-embeddings  neural-network  deep-learning  rnn 

2
신경망의 기능을 선택하는 방법은 무엇입니까?
나는이 질문에 대한 명확한 대답이 없다는 것을 알고 있지만 많은 데이터가있는 거대한 신경망이 있고 새로운 기능을 입력에 추가하고 싶다고 가정 해 봅시다. "가장 좋은"방법은 새로운 기능으로 네트워크를 테스트하고 결과를 보는 것이지만 기능이 도움이되지 않는지 테스트하는 방법이 있습니까? 상관 관계 측정 ( http://www3.nd.edu/~mclark19/learn/CorrelationComparison.pdf ) 등?

5
특징 선택 대 특징 추출. 언제 사용할 것인가?
지형지 물 추출 및 지형지 물 선택은 본질적으로 데이터의 차원을 감소 시키지만, 지형지 물 추출은 또한 내가 옳다면 데이터를 더 분리 가능하게 만듭니다. 어떤 기술이 다른 기술 보다 언제 선호 됩니까? 나는 기능 선택이 원본 데이터와 속성을 수정하지 않기 때문에 훈련하고있는 기능이 변경되지 않아야 할 때 기능 선택을 사용한다고 가정합니다. …


2
NLP의 분류 프로세스에서 구문 분석 트리에서 일반적으로 사용되는 기능은 무엇입니까?
다른 유형의 구문 분석 트리 구조를 탐색하고 있습니다. 널리 알려진 두 가지 구문 분석 트리 구조는 a) 구성 요소 기반 구문 분석 트리 및 b) 종속성 기반 구문 분석 트리 구조입니다. Stanford NLP 패키지를 사용하여 두 가지 유형의 구문 분석 트리 구조를 모두 사용할 수 있습니다. 그러나 분류 작업에 이러한 …


3
NER에 대한 감독되지 않은 기능 학습
나는 수작업으로 만들어진 CRF 알고리즘을 사용하여 NER 시스템을 구현하여 꽤 좋은 결과를 얻었습니다. 문제는 POS 태그 및 보조 정리를 포함하여 많은 다른 기능을 사용했다는 것입니다. 이제 다른 언어에 대해 동일한 NER를 만들고 싶습니다. 여기서 문제는 POS 태그와 젬마를 사용할 수 없다는 것입니다. 딥 러닝 및 비지도 기능 학습에 대한 기사를 …

3
이미지에서 감독되지 않은 기능 추출에 GAN을 사용하는 방법은 무엇입니까?
두 네트워크 (생성 및 차별적)가 서로 경쟁하는 동안 GAN의 작동 방식을 이해했습니다. 나는 MNIST 데이터 세트와 유사한 자필 숫자를 성공적으로 생성하는 DCGAN (컨볼 루션 판별 기 및 디볼 루션 생성기가있는 GAN)을 만들었습니다. 이미지에서 기능을 추출하기위한 GAN의 애플리케이션에 대해 많이 읽었습니다. 훈련 된 GAN 모델 (MNIST 데이터 세트)을 사용하여 MNIST 필기 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.