이 prcomp()함수를 사용하여 R에서 PCA (주성분 분석)를 수행했습니다. 그러나 해당 함수에 na.action매개 변수가 작동하지 않는 버그 가 있습니다. 나는 stackoverflow에 대한 도움을 요청했다 . 두 명의 사용자가 두 가지 방법으로 NA가치 를 처리했습니다 . 그러나 두 솔루션의 문제점은 NA값 이있을 때 해당 행이 삭제되고 PCA 분석에서 고려되지 않는다는 것입니다. 내 실제 데이터 세트는 100 x 100의 행렬이며 단일 NA값을 포함하기 때문에 전체 행을 잃고 싶지 않습니다 .
다음 예제는 prcomp()함수가 NA값을 포함하므로 행 5의 기본 구성 요소를 리턴하지 않음을 보여줍니다 .
d <- data.frame(V1 = sample(1:100, 10), V2 = sample(1:100, 10),
V3 = sample(1:100, 10))
result <- prcomp(d, center = TRUE, scale = TRUE, na.action = na.omit)
result$x # $
d$V1[5] <- NA # $
result <- prcomp(~V1+V2, data=d, center = TRUE, scale = TRUE, na.action = na.omit)
result$x
나는 설정할 수 있는지 궁금 해서요 NA특정 수치 값을 때 center와 scale로 설정되어 TRUE있으므로 그 prcomp()기능이 작동하고 포함 된 행을 제거하지 않습니다 NAPCA에 분석의 결과에 영향을 미치지도의, 그러나.
NA단일 열에서 값을 중간 값으로 바꾸 거나 0에 매우 가까운 값으로 바꾸는 것에 대해 생각했습니다. 그러나 그것이 PCA 분석에 어떤 영향을 미치는지 잘 모르겠습니다.
아무도 그 문제를 해결하는 좋은 방법을 생각할 수 있습니까?
NA가치 가 무엇을 의미 하는지 설명하는 것입니다 : "누락"의 원인은 무엇입니까?