«compositional-data» 태그된 질문

3
등각 로그 비율 변환을 수행하는 방법
나는 대략 24에 해당하는 움직임 행동 (자고있는 시간, 앉아있는 시간, 신체 활동을하는 시간)에 대한 데이터를 가지고 있습니다 (하루에 시간 단위로). 이러한 각 동작에 소요되는 상대적 시간을 캡처하는 변수를 만들고 싶습니다. 아이소 메트릭 로그 비율 변환이이 작업을 수행한다고 들었습니다. R에서 ilr 함수를 사용해야하는 것처럼 보이지만 코드가있는 실제 예제는 찾을 수 없습니다. …


3
kmeans를 실행하기 전에 상관 관계 / 공 선형 변수를 삭제해야합니까?
고객의 클러스터를 식별하기 위해 kmeans를 실행하고 있습니다. 클러스터를 식별하는 약 100 개의 변수가 있습니다. 이러한 각 변수는 고객이 카테고리에서 지출 한 비율을 나타냅니다. 따라서 100 개의 카테고리가있는 경우 각 고객에 대해이 변수의 합이 100 %가되도록 100 개의 변수를 갖습니다. 이제이 변수들은 서로 밀접하게 연관되어 있습니다. kmeans를 실행하기 전에 공선 성을 …

2
CLR (중앙 로그 비율 변환)을 사용하여 PCA에 대한 데이터를 준비 할 수 있습니까?
스크립트를 사용하고 있습니다. 핵심 레코드입니다. 주어진 깊이 (열의 첫 번째 열)에 대한 열의 다른 원소 구성을 보여주는 데이터 프레임이 있습니다. PCA를 수행하고 싶습니다. 선택해야하는 표준화 방법이 혼란 스럽습니다. clr()귀하를 위해 데이터를 준비하기 위해 를 사용한 사람이 prcomp()있습니까? 아니면 내 솔루션을 방해합니까? 에서 scale 속성을 사용하는 것 외에도 함수를 clr()사용하기 전에 …

2
매우 비뚤어진 카운트 데이터의 클러스터링 : 수행 할 제안 (변환 등)이 있습니까?
기본 문제 기본 문제는 다음과 같습니다. 매우 치우친 변수가 포함 된 데이터 세트를 개수로 묶으려고합니다. 변수는 많은 0을 포함하므로 클러스터링 절차에 대한 정보가 많지 않습니다. k- 평균 알고리즘 일 가능성이 큽니다. 예를 들어, 제곱근, 박스 콕스 또는 로그를 사용하여 변수를 변환하면됩니다. 그러나 내 변수는 범주 형 변수를 기반으로하기 때문에 변수를 …


4
커뮤니티 구성을 비교하기위한 테스트는 무엇입니까?
이 초보자 질문이이 사이트에 맞는 질문이기를 바랍니다. 두 사이트 A, B에서 생태 공동체의 구성을 비교하고 싶다고 가정 해 봅시다. 세 사이트 모두 개, 고양이, 소, 조류가 있다는 것을 알고 있습니다. 따라서 각 사이트마다 풍부함을 샘플링합니다. 각 사이트의 각 동물에 대한 예상 "풍부함). 예를 들어, 각 현장에서 각 동물 중 5 …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.