«high-dimensional» 태그된 질문

데이터에 대한 많은 기능 또는 차원 (변수)과 관련됩니다. (데이터 포인트 수가 많은 경우 [large-data] 태그를 사용하고 데이터보다 변수 수가 많은 경우 [underdetermined] 태그를 사용합니다.)

2
샘플링없이 고차원 적 추론 문제에서 불확실성 추정?
그라디언트 기반 최적화와 유전자 알고리즘의 조합을 사용하여 로그 최대의 전역 최대 값을 찾아 MAP 추정을 강력하게 수행 할 수있는 고차원 추론 문제 (약 2000 개의 모델 매개 변수)를 연구하고 있습니다. MAP 추정값을 찾는 것 외에도 모델 매개 변수에 대한 불확실성을 추정 할 수 있기를 바랍니다. 우리는 매개 변수와 관련하여 로그 …

1
아이들은 어떻게 GWAS 데이터 세트의 PCA 프로젝션에서 부모를 어떻게 함께 모을 수 있습니까?
에서 각 좌표 iid로 10,000 차원 공간에서 20 개의 임의의 점을 취합니다 . 10 쌍 ( "커플")으로 나누고 각 쌍의 평균 ( "자식")을 데이터 세트에 추가하십시오. 그런 다음 결과 30 점에서 PCA를 수행하고 PC1 대 PC2를 플로팅합니다.엔( 0 , 1 )N(0,1)\mathcal N(0,1) 놀라운 일이 일어납니다. 각 "가족"은 서로 가까이있는 삼중점을 …

1
고차원의 상관 데이터와 주요 특징 / 공변량이 발견되었습니다. 다중 가설 검정?
약 5,000 개의 관련 기능 / 공변량 및 이진 반응이있는 데이터 세트가 있습니다. 데이터가 나에게 주어졌지만 나는 그것을 수집하지 않았다. 올가미와 그라디언트 부스팅을 사용하여 모델을 만듭니다. 반복적이고 중첩 된 교차 유효성 검사를 사용합니다. 나는 올가미의 가장 큰 (절대적인) 40 계수와 그라디언트 부스트 트리에서 40 개의 가장 중요한 특징을보고합니다 (40에 대해서는 …

3
n, p가 둘 다 크면 PCA가 너무 느림 : 대안?
문제 설정 2D로 시각화하려고하는 높은 차원 (4096)의 데이터 포인트 (이미지)가 있습니다. 이를 위해 Karpathy의 다음 예제 코드 와 비슷한 방식으로 t-sne을 사용하고 있습니다. scikit 배우기 문서는 먼저 데이터의 차원을 낮추기 위해 PCA를 사용하는 것이 좋습니다 : 피처 수가 매우 많은 경우 차원 수를 적당한 양 (예 : 50)으로 줄이려면 다른 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.