논문은“주요 구성 요소의 수를 결정하기위한 몬테 카를로 시뮬레이션”을 언급합니다. 어떻게 작동합니까?


10

10304x236 크기의 매트릭스에서 PCA를 수행 한 MRI 데이터에 대해 Matlab 분석을 수행하고 있습니다. 여기서 10304는 복셀 수 (픽셀로 생각)이고 236은 시점 수입니다. PCA는 236 개의 고유 값과 관련 계수를 제공합니다. 이건 다 괜찮아 그러나 보유 할 구성 요소 수를 결정해야 할 때 복제중인 용지는 다음과 같이 말합니다 (전체 용지의 짧은 부분이므로 설명이 필요한지 알려주세요).

그런 다음 Monte Carlo 시뮬레이션을 수행하여 각 스캔에 대한 불필요한 ROI 데이터에서 추출 할 주성분 (PC) 수를 결정했습니다. 예상 고유 값의 널 분포는 인코딩 및 휴식 방해 ROI 데이터와 동일한 순위의 정규 분포 데이터에 대해 PCA를 수행함으로써 각 주제에 대한 인코딩 및 휴식 데이터에 대해 별도로 생성되었다. 그런 다음 관련 고유 값이 Monte Carlo 시뮬레이션에서 고유 값의 99 번째 신뢰 구간을 초과 한 경우 지정된 휴식 또는 인코딩 스캔에 대해 진정한 귀찮은 ROI 데이터의 PC를 선택했습니다.

Tambini & Davachi, PNAS 2013, postencoding rest로 hippocampal multivoxel 패턴의 지속성은 메모리와 관련이 있습니다.

나는 여기서 무엇을 해야할지 전혀 모른다. 설명 된 누적 분산을 기반으로 구성 요소를 선택하는 데 익숙합니다. 내 생각은 이것입니다.

그런 다음 Monte Carlo 시뮬레이션을 수행하여 각 스캔에 대한 불필요한 ROI 데이터에서 추출 할 주성분 (PC) 수를 결정했습니다.

몬테카를로 심은 다음 1000 번 (또는 그와 같은) 시간을하는 것을 의미합니다.

예상 고유 값의 널 분포는 인코딩 및 나머지 방해 ROI 데이터와 동일한 순위의 정규 분포 데이터에 대해 PCA를 수행하여 생성되었습니다.

첫째, '균등 순위'는 기본적으로 원래 크기 (10304x236)와 동일한 크기의 행렬을 생성한다는 것을 의미한다고 가정합니다. '동일한 순위의 정규 분포 데이터'와 관련하여 이것은 정규 분포에서 난수로 구성된 10304x236 행렬을 만들어야합니까? Matlab에는 'normrnd'라는 기능이 있지만 mu 및 sigma 입력이 필요합니다. 초기 데이터 세트에서 파생 된 것과 동일한 mu 및 sigma를 사용합니까? EXPECTED 고유 값의 분포가 어떤지 알 수 없기 때문에 이것이 '예상 고유 값'이 의미하는 바입니까?

내 문제는 다소 고유 값의 '널 분포'를 만드는 방법을 모른다는 것입니다.

답변:


6

이 질문과 관련된 용어는 "병렬 분석"입니다.

간단히 말해서, 몬테 카를로 시뮬레이션은 임의의 정규 분포 데이터 1000 (또는 이와 같은) 10304x236 행렬을 생성합니다 (물론 분석하는 데이터가 정상적으로 분포되어 있다고 가정합니다. 데이터가 다르게 분포 된 경우 다른 무작위 분포). 그런 다음 생성 한 각 데이터 세트의 고유 값을 추출하고 1000 회 (또는 이와 같은) 모든 복제에서 고유 값을 평균화하는 동시에 신뢰 구간을 만듭니다. 그런 다음 데이터 세트의 고유 값을 시뮬레이션의 평균 고유 값과 비교합니다.

데이터 집합의 고유 값이 몬테 카를로 시뮬레이션의 고유 값에 대한 99 번째 신뢰 구간을 초과 할 때마다 분석에서 유지할 여러 요소가 있습니다.

예를 들어, 데이터의 25 번째 고유 값이 2.10이고 26 번째는 1.97이고 1000 (또는 기타) 임의 데이터 세트의 25 번째 고유 값의 99 번째 신뢰 구간은 2.04이고 26 번째는 2.01 인 경우, 25 개의 부품을 유지하십시오.

이를 위해 내장 된 기능이 있습니다. Matlab에 대한 하나의 링크는 다음과 같습니다.

http://www.mathworks.com/matlabcentral/fileexchange/44996-parallel-analysis--pa--to-for-determining-the-number-of-components-to-retain-from-pca/content/pa_test. 미디엄

나는 "Malablab의 병렬 분석"을 인터넷 검색하여 찾았습니다.


+1. 이것은 매우 분명하며 링크는 매우 도움이 될 것입니다! 무작위로 분포 된 고유 값을 올바르게 추출하도록 코딩했지만 올바른 방식으로 신뢰 구간을 사용하지 않았습니다. 응답 해주셔서 감사합니다.
chainhomelow

도와 줄 수있어서 기뻐! 도움이 되서 다행입니다.
maxwelldeux의
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.