«visualization» 태그된 질문

데이터의 의미 있고 유용한 그래픽 표현 구성. (당신의 질문이 특정 효과를 내기 위해 특정 소프트웨어를 얻는 방법에 관한 것이라면 여기에서 다루지 않을 것입니다.)


3
팬더와 상관 행렬의 계산 및 시각화
여러 항목이있는 팬더 데이터 프레임이 있으며 일부 유형의 상점 수입 간의 상관 관계를 계산하려고합니다. 수입 데이터, 활동 영역 분류 (극장, 옷가게, 음식 ...) 및 기타 데이터가있는 여러 상점이 있습니다. 나는 새로운 데이터 프레임을 만들고 같은 카테고리에 속하는 모든 종류의 상점의 수입으로 열을 삽입하려고 시도했으며 반환 데이터 프레임에는 첫 번째 열만 …

1
xgboost가 GradientBoostingClassifier를 sklearn보다 훨씬 빠른 이유는 무엇입니까?
100 개의 숫자 기능을 가진 50k 개 이상의 그라디언트 부스팅 모델을 훈련하려고합니다. XGBClassifier동안 내 컴퓨터 43 초 이내에 핸들 (500) 나무, GradientBoostingClassifier핸들 10 나무 (!) 일분 2 초 :( 내가 귀찮게하지 않았다에서 그것은 시간이 걸릴 것으로 500 그루의 나무를 성장하려고합니다. 나는 같은 사용하고 있습니다 learning_rate및 max_depth설정 아래를 참조하십시오. XGBoost를 훨씬 …
29 scikit-learn  xgboost  gbm  data-mining  classification  data-cleaning  machine-learning  reinforcement-learning  data-mining  bigdata  dataset  nlp  language-model  stanford-nlp  machine-learning  neural-network  deep-learning  randomized-algorithms  machine-learning  beginner  career  xgboost  loss-function  neural-network  software-recommendation  naive-bayes-classifier  classification  scikit-learn  feature-selection  r  random-forest  cross-validation  data-mining  python  scikit-learn  random-forest  churn  python  clustering  k-means  machine-learning  nlp  sentiment-analysis  machine-learning  programming  python  scikit-learn  nltk  gensim  visualization  data  csv  neural-network  deep-learning  descriptive-statistics  machine-learning  supervised-learning  text-mining  orange  data  parameter-estimation  python  pandas  scraping  r  clustering  k-means  unsupervised-learning 

7
고차원 데이터 시각화의 목적?
T-SNE, isomap, PCA, Supervised PCA 등과 같은 고차원 데이터 세트를 시각화하기위한 많은 기술이 있습니다. 그리고 우리는 2D 또는 3D 공간으로 데이터를 투사하는 동작을 수행하므로 "예쁜 그림이 있습니다. ". 이러한 포함 (매니 폴드 학습) 방법 중 일부가 여기 에 설명되어 있습니다 . 그러나이 "예쁜 그림"은 실제로 의미가 있습니까? 이 임베디드 공간을 …

3
복잡한 레이더 차트는 어떻게 만듭니 까?
따라서 다음과 같은 플레이어 프로파일 레이더 차트 를 만들고 싶습니다. 각 변수의 척도가 다를뿐만 아니라 'dispossessed'통계와 같은 일부 통계에 대해서는 반대로 척도를 원합니다. 각 통계량에 대한 변동 척도에 대한 한 가지 해결책은 벤치 마크를 설정 한 다음 100 척도에서 점수를 계산하는 것입니다. 그러나 차트에 실제 숫자를 어떻게 표시합니까? 또한 일부 …

6
R에서 대시 보드를 생성하는 데 사용하는 것은 무엇입니까?
정기적 (매일, 매월) 웹 분석 대시 보드 보고서를 생성해야합니다. 정적이며 상호 작용이 필요하지 않으므로 PDF 파일을 대상 출력으로 가정하십시오. 보고서는 테이블과 차트를 혼합합니다 (주로 ggplot2로 생성 된 스파크 라인 및 불릿 그래프). 다음과 같은 Stephen Few / Perceptual Edge 스타일 대시 보드를 생각해보십시오. 웹 분석에는 적용됩니다. 이러한 대시 보드 보고서를 …
17 r  visualization 

7
백만 개의 정점으로 그래프 시각화
1000000 개의 정점이있는 그래프를 시각화 (정점 및 모서리 그리기)하는 데 가장 적합한 도구는 무엇입니까? 그래프에는 약 50000 개의 가장자리가 있습니다. 개별 정점과 모서리의 위치를 ​​계산할 수 있습니다. svg를 생성하는 프로그램을 작성하려고합니다. 다른 제안?

5
seaborn 히트 맵을 더 크게 만들기
corr()원본 df 에서 df를 만듭니다 . corr()DF는 70 X 70에서 나와는 히트 맵을 시각화하는 것은 불가능합니다 ... sns.heatmap(df). 를 표시하려고 corr = df.corr()하면 테이블이 화면에 맞지 않으며 모든 상관 관계를 볼 수 있습니다. df크기에 관계없이 전체를 인쇄 하거나 히트 맵의 크기를 제어하는 ​​방법입니까?
17 visualization  pandas  plotting  machine-learning  neural-network  svm  decision-trees  svm  efficiency  python  linear-regression  machine-learning  nlp  topic-model  lda  named-entity-recognition  naive-bayes-classifier  association-rules  fuzzy-logic  kaggle  deep-learning  tensorflow  inception  classification  feature-selection  feature-engineering  machine-learning  scikit-learn  tensorflow  keras  encoding  nlp  text-mining  nlp  rnn  python  neural-network  feature-extraction  machine-learning  predictive-modeling  python  r  linear-regression  clustering  r  ggplot2  neural-network  neural-network  training  python  neural-network  deep-learning  rnn  predictive-modeling  databases  sql  programming  distribution  dataset  cross-validation  neural-network  deep-learning  rnn  machine-learning  machine-learning  python  deep-learning  data-mining  tensorflow  visualization  tools  sql  embeddings  orange  feature-extraction  unsupervised-learning  gan  machine-learning  python  data-mining  pandas  machine-learning  data-mining  bigdata  apache-spark  apache-hadoop  deep-learning  python  convnet  keras  aggregation  clustering  k-means  r  random-forest  decision-trees  reference-request  visualization  data  pandas  plotting  neural-network  keras  rnn  theano  deep-learning  tensorflow  inception  predictive-modeling  deep-learning  regression  sentiment-analysis  nlp  encoding  deep-learning  python  scikit-learn  lda  convnet  keras  predictive-modeling  regression  overfitting  regression  svm  prediction  machine-learning  similarity  word2vec  information-retrieval  word-embeddings  neural-network  deep-learning  rnn 

1
T-SNE 시각화에서 더 가까운 점이 더 유사한 것으로 간주 될 수 있습니까?
나는 Hinton의 논문에서 T-SNE가 지역적 유사성을 유지하는 데 훌륭한 역할을하고 글로벌 구조 (클러스터 화)를 보존하는 데 알맞은 역할을한다는 것을 이해합니다. 그러나 2D t-sne 시각화에서 더 가깝게 나타나는 포인트가 "더 유사한"데이터 포인트로 간주 될 수 있는지 확실하지 않습니다. 25 가지 기능이있는 데이터를 사용하고 있습니다. 예를 들어 아래 이미지를 보면 파란색 데이터 …

1
파이썬에서 맵의 히트 맵
Mode Analytics에는 멋진 히트 맵 기능이 있습니다 ( https://community.modeanalytics.com/gallery/geographic-heat-map/ ). 그러나지도를 비교하는 데 도움이되지 않습니다 (보고서 당 하나만). 그들이 허용하는 것은 랩핑 된 파이썬 노트북에 데이터를 쉽게 가져올 수 있다는 것입니다. 그런 다음 파이썬의 모든 이미지를 보고서에 쉽게 추가 할 수 있습니다. 그래서 내 질문은 : 파이썬의 실제 맵에서 히트 …

2
심층 신경망 훈련 시각화
훈련 중에 가중치를 플롯하기 위해 멀티 레이어 네트워크에 해당하는 Hinton Diagrams를 찾으려고합니다. 훈련 된 네트워크는 Deep SRN과 다소 유사합니다. 즉, 여러 개의 힌튼 다이어그램의 동시 플롯을 시각적으로 혼란스럽게 만드는 다중 가중치 매트릭스가 많이 있습니다. 누구나 여러 계층의 반복 네트워크에 대한 가중치 업데이트 프로세스를 시각화하는 좋은 방법을 알고 있습니까? 주제에 관한 …

2
항공 요금-경쟁력있는 가격 결정 동작과 가격 상관 관계를 탐지하기 위해 어떤 분석을 사용해야합니까?
항공사의 가격 결정 동작, 특히 항공사가 경쟁사 가격에 반응하는 방식을 조사하고 싶습니다. 더 복잡한 분석에 대한 내 지식은 상당히 제한적이라고 말하지만 데이터의 전체적인 관점을 수집하기 위해 대부분 기본 방법을 모두 사용했습니다. 여기에는 유사한 패턴을 식별하는 데 도움이되는 간단한 그래프가 포함됩니다. SAS Enterprise 9.4도 사용하고 있습니다. 그러나 나는 더 많은 숫자 …

3
소셜 네트워크의 성장을 애니메이션으로 만드는 방법은 무엇입니까?
새로운 노드 / 에지가 추가 될 때 소셜 네트워크가 어떻게 변하는 지 시각화 할 라이브러리 / 도구를 찾고 있습니다. 기존 솔루션 중 하나는 SoNIA : Social Network Image Animator 입니다. 그것은 당신이 좋아하는 영화를 만들어 보자 이 하나 . SoNIA의 문서에 따르면 현재는 고장 났으며 그 외에도 JavaScript 기반 솔루션을 …

1
몇 개의 LSTM 셀을 사용해야합니까?
사용해야하는 최소, 최대 및 "합리적인"양의 LSTM 셀과 관련된 경험 법칙 (또는 실제 규칙)이 있습니까? 특히 TensorFlow 및 속성의 BasicLSTMCell 과 관련이 num_units있습니다. 분류 문제가 다음과 같이 정의되었다고 가정하십시오. t - number of time steps n - length of input vector in each time step m - length of output vector …
12 rnn  machine-learning  r  predictive-modeling  random-forest  python  language-model  sentiment-analysis  encoding  machine-learning  deep-learning  neural-network  dataset  caffe  classification  xgboost  multiclass-classification  unbalanced-classes  time-series  descriptive-statistics  python  r  clustering  machine-learning  python  deep-learning  tensorflow  machine-learning  python  predictive-modeling  probability  scikit-learn  svm  machine-learning  python  classification  gradient-descent  regression  research  python  neural-network  deep-learning  convnet  keras  python  tensorflow  machine-learning  deep-learning  tensorflow  python  r  bigdata  visualization  rstudio  pandas  pyspark  dataset  time-series  multilabel-classification  machine-learning  neural-network  ensemble-modeling  kaggle  machine-learning  linear-regression  cnn  convnet  machine-learning  tensorflow  association-rules  machine-learning  predictive-modeling  training  model-selection  neural-network  keras  deep-learning  deep-learning  convnet  image-classification  predictive-modeling  prediction  machine-learning  python  classification  predictive-modeling  scikit-learn  machine-learning  python  random-forest  sampling  training  recommender-system  books  python  neural-network  nlp  deep-learning  tensorflow  python  matlab  information-retrieval  search  search-engine  deep-learning  convnet  keras  machine-learning  python  cross-validation  sampling  machine-learning 


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.