평균 기울기 계산 : 고조파 또는 산술 평균?


11

큰 데이터 세트에 대한 평균 상승 경사 백분율 기울기를 계산해야합니다. 기본 방법은 여기 에 자세히 설명되어 있습니다. 그러나 기술적으로 변화율이기 때문에 고조파 평균 이 표준 산술 평균보다 더 적합한 지 궁금해 졌습니다. 나는 점, 면적, 선 등에 대한 기울기 평균화에 대한 다른 토론 에서이 결과를 보지 못했습니다. 달성하기가 매우 간단해야합니다.

편집 :이 경우 평균 기울기를 계산하는 목적은 채널 시작 임계 값을 모델링하는 데 사용할 하나의 매개 변수를 생성하는 것입니다. 흐름 수집, 다양한 평균 상향 기울기 매개 변수 등을 수집하고 여러 선형 회귀 분석을 사용하여 다른 매개 변수와 관련하여 축적 임계 값을 설명하려고하는 필드 수집 채널 헤드 위치 세트가 있습니다.


4
평균 경사를 계산하는 이유에 따라 다릅니다. 목적은 무엇입니까? 어떤 물리량을 측정하려고합니까? 여러 형태의 평균이 합법적이지만 고조파 평균에주의하십시오. 기울기가 0 일 때 문제가 발생하며 이는 종종 발생합니다.
whuber

답변:


10

평균 경사는 자연적인 양처럼 들리지만 다소 이상한 것입니다. 예를 들어, 평평한 수평 평야의 평균 경사는 0이지만, 평평한 DEM에 약간의 임의의 0 평균 잡음을 추가하면 평균 경사가 올라갈 수 있습니다. 다른 이상한 행동은 여기서 문서화 한 DEM 해상도에 대한 평균 기울기 의 의존성과 DEM 생성 방법에 대한 의존성입니다. 예를 들어, 등고선 맵에서 생성 된 일부 DEM은 실제로 약간 계단식으로 구성되어 있습니다. 등고선이있는 곳에서 작은 급격한 점프로 전체 표면의 정확한 표현입니다. 평균화 과정에서 가중치가 너무 많거나 너무 적은 경우 급격한 점프는 평균 경사를 변경할 수 있습니다.

가중치를 높이는 것은 실제로 고조파 평균 (및 기타 수단)이 기울기에 차이를 가중시키기 때문에 관련이 있습니다. 이를 이해하려면 두 개의 양수 xy 의 조화 평균을 고려하십시오 . 정의에 따라

Harmonic mean(x,y) = 1 / ((1/x + 1/y)/2) = x (y/(x+y)) + y (x/(x+y)) = a x + b y

여기서 가중치는 a = y / (x + y) 및 b = x / (x + y)입니다. (이 값은 양수이고 단일로 합산되므로 "가중치"라고 부를 수 있습니다. 산술 평균의 경우 가중치는 a = 1 / 2 및 b = 1 / 2입니다). 분명히 부착 무게 x는 경우에 Y / (X + Y)을 동일 크고, X작은 비교 . 따라서 고조파는 더 작은 값을 과중하게 의미 합니다.

질문을 넓히는 데 도움이 될 수 있습니다. 고조파 평균은 실제 값 p로 매개 변수화 된 평균 계열 중 하나입니다 . xy역수 를 평균하여 (그리고 그 평균의 역수 를 취하여) 고조파 평균을 얻는 것처럼, 일반적으로 우리는 xy 의 p 제곱을 평균화 할 수 있습니다 (그리고 결과의 1 / p 제곱을 취합니다) ). p = 1 및 p = -1의 경우는 각각 산술 및 고조파 평균입니다. ( 한계를 취하여 p = 0에 대한 평균을 정의 하여이 패밀리의 구성원으로서 기하 평균을 얻을 수도 있습니다.) As p1에서 감소할수록 더 작은 값은 점점 더 무겁게됩니다. 와 같은 P의 1가 증가함에 따라, 더 큰 값이 더 많이 가중된다. 평균은 p가 증가함에 따라 증가 할 수 있고 p가 감소함에 따라 감소 해야 한다는 것이 뒤 따른다 . (이것은 아래 두 번째 그림에서 분명합니다. 세 줄이 모두 평평하거나 왼쪽에서 오른쪽으로 증가합니다.)

문제에 대한 실질적인 견해를 취하면 대신 다양한 경사 수단의 동작을 연구하고 분석 도구 상자에이 지식을 추가 할 수 있습니다. 영향은 p 가 1보다 작은 평균을 선택할 수 있습니다 . 반대로, 가장 큰 경사를 강조하기 위해 p를 1 이상으로 올릴 수 있습니다. 이를 위해 점 근처에서 다양한 형태의 배수 프로필을 고려해 봅시다.

진행할 수있는 것을 보여주기 위해 3 가지 질적으로 다른 지역 지형을 고려했습니다 . 하나는 모든 경사가 동일한 곳입니다 (이는 좋은 참조를 만듭니다). 또 다른 곳은 보울의 바닥에 국부적으로 위치하는 곳입니다. 우리 주변의 경사는 0이지만 점차적으로 증가하고 결국 림 주위에서 임의로 커집니다. 이 상황의 반대는 근처의 경사가 온화하지만 우리와 수평을 이룰 때 발생합니다. 그것은 사실적으로 광범위한 행동을 다루는 것 같습니다.

다음은 이러한 세 가지 유형의 배수 형태에 대한 의사 3D 플롯입니다.

3D 플롯

여기서 I는 각각의 평균 기울기를 계산 한 - 코딩 동색 -의 함수로서 P ,시키는 P의 2 통해 -1에서 (조화 평균) 범위.

경사 평균 대 p

물론 파란색 선은 수평입니다. p 가 어떤 값을 취하상수 기울기 의 평균은 해당 상수 이외의 다른 값이 될 수 없습니다 (참조로 1로 설정 됨). 빨간 보울의 먼 주변의 높은 경사는 p가 변함에 따라 평균 경사에 큰 영향을 미칩니다. p 가 1을 초과하면 그 크기가 얼마나 커지는 지 확인 하십시오. 1) 0이됩니다.

p = 0에서 3 개의 곡선의 상대 위치가 변하는 것이 주목할 만하다 : 0보다 큰 p의 경우, 빨간색 보울은 파란색보다 큰 평균 기울기를 가지며, 음의 p의 경우에는 빨간색 보울이 더 작다 파랑보다 경사. 따라서 p를 선택 하면 평균 경사 의 상대 순위 까지도 변경할 수 있습니다 .

황록색 모양에 대한 고조파 평균 (p = -1)의 심오한 영향으로 인해 일시 정지해야합니다. 배수관에 작은 경사가 충분히 있으면 고조파 평균이 너무 작아서 다음과 같은 영향을 줄 수 있습니다. 다른 모든 슬로프.

의 정신을 탐구 데이터 분석, 당신은 다양한 고려해 볼 수 있습니다 p는 그것을시키는 --perhaps 피하기 극단적 인 가중치를 위해 1보다 약간 더 큰 범위는 0 - 어느 값 결과는 평균 기울기와 변수 당신의 가장 좋은 관계를 만들어 모델링입니다 (예 : 채널 초기화 임계 값). "최상"은 일반적으로 회귀 모델에서 "가장 선형 적"또는 "일정한 [균일 한] 잔차 생성"의 의미로 이해된다.


철저한 분석에 감사드립니다! 나는 이것에 대해 조금 반박해야 할 것이다.
Jay Guarneri

1

나는 whuber의 훌륭한 이론적 답변에 대한 보완적인 답변을 찾기 위해 경험적인 접근 방식을 취했습니다. 나는 각도 평균 을 사용하여 기울기와 각도를 계산하기로 결정했습니다 . 다음으로, 연구 영역에 무작위로 위치한 일련의 샘플 포인트를 생성 한 퍼센트 경사의 산술 및 고조파 평균을 계산했습니다. 최소 거리 100m의 2000 포인트를 요청하여 1326 포인트를 얻었습니다. 각 지점에서 각 평균 경사 래스터의 값을 샘플링하고 공식을 사용하여 백분율 평균을 도로 변환했습니다 Degrees = atan(percent/100). 여기에서의 각 가정은 각도 평균이 "정확한"평균 기울기를도 단위로 생성 할 것이며, 백분율 평균에 가까울수록 올바른 절차가 될 것입니다.

다음으로 Kruskal-Wallace 검정을 사용하여 0이 아닌 모든 값을 비교했습니다 (가장 0이 아닌 기울기 값의 경우 3 개 모두에서 0이되고 0 값이 방법 간의 차이를 가린다는 가정). 나는 3 (chi-square = 17.9570, DF = 2, p = 0.0001) 사이에 큰 차이가 있음을 알았으므로 alpha = 0.05 (Elliot and Hynan 2011)를 사용하여 Dunn 's Procedure를 사용하여 데이터를 추가로 조사했습니다 . 최종 결과는 산술 평균과 조화 평균이 서로 크게 다르지만 이웃은 각도 평균과 크게 다릅니다.

Comparison           Diff        SE        q         q(0.05)    Conclude                      
------------------------------------------------------------------------------                
arith     harm      164.12    38.78     4.23       2.394    Reject                            
arith     angular   75.3      38.8      1.94       2.394    Do not reject                     
angular   harm      88.82     38.68     2.3        2.394    Do not reject                     

내 가정이 모두 정확하다면 (아주 ​​잘되지 않을 수도 있음) 이것은 고조파와 산술 수단이 서로 다른 값을 생성하지만, 각 평균에 대해 "밀착되어"수용 가능하다는 것을 의미합니다. 여기에 내가 생각할 수있는 두 가지 경고가 있습니다 (생각할 경우 다른 것을 추가하십시오).

  1. 표본 크기 클수록 백분율 평균과 각도 평균간에 유의 한 차이 가있을있습니다 . 그러나 샘플 크기는 0이 아닌 값에 대해 ~ 1000 포인트였습니다.
  2. 배수지와 상관없이 샘플 포인트가 배치 되었기 때문에 평균 경사가 그 위의 평균 경사와 관련되어 있기 때문에 의사 복제가 발생할 수 있습니다.

1
이것은 흥미롭지 만 (+1) 제한 사항에주의하십시오. (1) 예. 더 큰 표본 크기를 선택하면 모든 차이점이 중요합니다. 따라서 통계적 가설 검정을 수행하는 것은 의미가 없습니다 . 절차 간 차이 의 에 초점을 맞추고 싶습니다 . (2) 결과는 전적으로 데이터의 실제 속성에 따라 다릅니다. 다른 데이터 세트에 따라 다릅니다. (3) 각도 평균은 기준으로서 유용하지만 결코 바람직한 값은 아니다. 참조로 사용할 것은 전적으로 분석 또는 매핑에 평균이 어떻게 사용되는지에 달려 있습니다.
whuber

0

기울기를 정의하는 매개 변수가 알려져 있지 않다고 가정하면 모든 통계학자는 기울기에서 데이터의 RMS 편차를 최소화하는 기울기를 사용한다고 말합니다. (물론, whuber의 예제는 수학적으로 생성 된 지형을 선택했기 때문에 자격이 없지만 실제 지형의 경우 알려진 매개 변수가 없다는 가정은 유효해야합니다.)


이 답변에 감사 드리지만 상황을 오해한다고 생각합니다. 가장 중요한 것은 이러한 기울기는 곡선에 맞추는 데 사용되지 않습니다. "데이터의 RMS 편차"개념은 적용 할 수 없습니다. 둘째, 나는 실제로 직면하게 될 것의 광범위한 스펙트럼에 걸쳐 질적 인 지형 유형을 선택했기 때문에 예상되는 것에 대한 유용한 정보를 제공합니다. 실제 데이터 세트는 "진정한"평균 기울기와 같은 것이 없기 때문에 현재 진행중인 작업을 이해하는 데 크게 도움이되지 않습니다. 주요 질문은 어떤 평균이 유용 하거나 유익 할 것인가 입니다.
whuber

1
BTW, 나는 통계 학자로서의 자격이 있다고 생각 합니다. 그것은 다른 사람과 마찬가지로 가능한 한 명확하고 객관적으로 그것을 백업해야하며, 잘못되고 마음이 바뀌어야합니다. ). 나는 단지이 점을 당신의 "통계 학자"발언에 대한 카운터로 제공합니다.
whuber

어떤 적합이 유용한 지에 대한 질문은 경사가 무엇에 사용되는지에 달려 있습니다. 예를 들어, 토지 슬럼프 전위의 경우, 슬로프 전위 대 슬로프 모델에 따라 가파른 경사가 온화한 경사에 비해 가중 될 경우, RMS 적합 접근법이 유효해야합니다. 다른 가중치 모델은 다른 용도와 일치하여 사용됩니다. 간단히 말해서, 가중치 또는 다른 수단으로 우리가 알고있는 모든 것을 모델링 한 다음 우리가하지 않는 모든 것에 대한 모델로 RMS에 의존하는 것이 제가 제안하는 것입니다.
johnsankey

나는 그 의견의 전제에 동의합니다. 가파른 경사가 더 무거운 가중치를받는 경우 RMS는 경사에 관계없이 모든 편차에 동일하게 가중치를 부여하기 때문에 원하지 않는 것 같습니다 . 더욱이, 2 차 손실 함수 인 RMS는 기울기의 비선형 재 표현 및 대체 손실 함수의 사용 (예를 들어 견고한 피팅 방법에 의해 이용됨)을 포함하여 다른 기술이 달성 할 수있는 것을 대체 할 수는 없습니다.
whuber

RMS에는 무게가 포함됩니다
johnsankey
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.