몇 달 전에 나는이 조직에서 인턴을했다. 그리고 외출 선물로, 나는 지난 주에 내가 가진 시간과 상관없이 교사 급여에 영향을 미치는 요인들을 조사하기로 결정했다. 교사 급여와 관련된 한 가지 문제는 주어진 주에 대한 분포가 왜곡되었다는 것입니다. 나는 임금 스펙트럼의 하한선에 매달린 많은 관측을했다. 필자는 종속 임금 (교사 임금)에 Comparable Wage Index를 통합하여이 문제를 해결하려했지만 발견 한 결과는 프로젝트 범위에서 완전히 최신이 아닙니다. 대신 종속 변수를 기록하기로 결정했습니다. 이것은 내 임금이 정규 분포를 가지고 있고 막대 그래프에서 완벽하게 보였기 때문에 좋았습니다. 테스트를 시작했을 때, 마지막 독립 변수 인 재산세 신고서가 남은 시점에 도달했습니다. 저의 규범 적 임금 문제는 저의 재산세 신고서에서도 분명했습니다. 나는 스펙트럼의 하단을 향해 재산세 환급 수치가 크게 왜곡되었습니다. 따라서이 변수도 기록했지만 여전히 귀무 가설 검정을 통과했습니다.
이것이 정확한지 확실하지 않지만 한 로그 변수의 변경 내용을 다른 로그 변수와 비교하면 탄력이 생겼습니다. 이것이 정확하다고 가정하면 내 회귀 방정식 (LogWages = B0 + B1 (LogPropertyTaxReturns)과 같은 것)은 두 변수 사이의 탄성을 보여줍니다. 이것이 의미가 있습니까? 저의 목표가 어떤 주에서 어떤 카운티의 교사 급여에 가장 많은 영향을 미치는 변수를 보는 것이라면 두 변수 사이의 탄력성을 보여주는 것이 도움이됩니까? 우리는 생활 수준을 높이기 위해 가장 낮은 교사 급여를 가진 카운티를 더 높이기 원하지만, 실제 회상에서 멀리 떨어져 내 결론 회귀 방정식이 의미가 없다는 것을 두려워합니다.
편집 : 가장 큰 두려움 중 하나는 비선형 모델을 사용하여 관계를 보여야한다는 것입니다. 이 선형 회귀 분석에서 종속 변수와 독립 변수를 강제로 강제하는 것은 어떤 식 으로든 오해의 소지가 있다고 생각합니다.