최대 1을 더하는 여러 비율을 포함하는 데이터 집합이 있습니다. 그래디언트를 따라 이러한 비율을 변경하는 데 관심이 있습니다 (데이터 예는 아래 참조).
gradient <- 1:99
A1 <- gradient * 0.005
A2 <- gradient * 0.004
A3 <- 1 - (A1 + A2)
df <- data.frame(gradient = gradient,
A1 = A1,
A2 = A2,
A3 = A3)
require(ggplot2)
require(reshape2)
dfm <- melt(df, id = "gradient")
ggplot(dfm, aes(x = gradient, y = value, fill = variable)) +
geom_area()
추가 정보 : 반드시 선형 일 필요는 없으며 예제의 편의를 위해이 작업을 수행했습니다. 이러한 비율이 계산되는 원래 개수도 사용할 수 있습니다. 실제 데이터 셋에는 1을 더하는 변수가 더 많습니다 (예 : B1, B2 & B3, C1에서 C4 등). 통계 측면.
질문 : 그런 종류의 데이터를 어떻게 분석 할 수 있습니까? 나는 조금 주위를 읽었고 아마도 다항식 모델이나 glm이 적합합니까? -3 개 (또는 2 개)의 glm을 실행하는 경우 예측 된 값의 합이 1로 제한되는 제약 조건을 어떻게 통합 할 수 있습니까? 나는 그런 종류의 데이터를 플롯하고 싶지 않으며 분석과 같은 더 깊은 회귀를 원합니다. R을 사용하고 싶습니다. R에서 어떻게 할 수 있습니까?
proprcspline
Stata 의 명령 은 당신이 찾고있는 것일 수 있습니다 (사용하고 싶다는 것을 알고R
있지만 아마도 시작점이 될 수 있습니다) : proprcspline은 xvar이 주어진 yvar의 각 범주에서 관측 비율의 부드러운 입방 스플라인을 계산합니다. 누적 영역 플롯으로 그래프를 표시합니다. 선택적으로 이러한 평활화 된 비율은 일련의 제어 변수 (cvar)에 맞게 조정할 수 있습니다.