기술 통계량을보고하는 요점은 무엇입니까?


21

로지스틱 회귀를 사용하여 데이터를 분석했지만 보고서에 기술 통계 부분이 있어야합니다. 나는 솔직히 이것의 요점을 보지 못했고 누군가 왜 그것이 필요한지 설명 할 수 있기를 바랐습니다.

예를 들어, 독립적 인 연속 변수 중 하나의 히스토그램을 플로팅하고 정규성을 보이거나 왜이 값이 보고서에 어떤 값을 추가 할 것인가를 보여주는 경우?

내 데이터는 취업에 따른 종속 변수 true 또는 false로 구성되며 독립 변수는 중급 성적, 최종 시험 성적 및 남성 또는 여성입니다.


IV의 히스토그램을 플롯 할 때 어떤 가치도 볼 수 없다면 그렇게하지 말아야 할 것입니다. 그러나 수집 한 데이터가 현재보고있는 작업에 가치가 있다고 생각합니다 보고서?
Ian_Fin

안녕 이안, 나는 내 문제에 관한 좀 더 자세한 내용을 추가했습니다. 통계에 익숙하지 않아서 로지스틱 회귀 분석을 수행하기 전에 취하는 일반적인 접근 방식이 궁금합니다.
user3223190

또한 다양한 데이터 플롯을보고 포함시킬 것을 제안합니다. 예를 들어 성별로 색상으로 구분하고 "취업"및 "취업 실패"로 기호로 구분하여 최종 성적과 중급 성적을 비교할 수 있습니다.
Emil M Friedman

답변:


42

내 분야에서, 보고서의 설명 부분은 결과의 일반화에 대한 맥락을 설정하기 때문에 매우 중요합니다. 예를 들어, 한 연구원은 병원 샘플에서 오토바이 사고로 인한 외상성 뇌 손상의 예측 인자를 확인하고자합니다. 그녀의 종속 변수는 이진수이고 일련의 독립 변수가있었습니다. 다변량 로지스틱 회귀 분석을 통해 다음과 같은 결과를 얻을 수있었습니다.

  • 헬멧 사용에 비해 헬멧 사용 조정 OR = 4.5 (95 % CI 3.6, 5.5).
  • 다른 모든 변수는 최종 모델에 포함되지 않았습니다.

분명히, 모델링에는 문제가 없었습니다. 우리는 기술 통계가 추가 할 수있는 가치에 중점을 둡니다.

설명 통계가 없으면 독자는 이러한 결과를 원근감있게 넣을 수 없습니다. 왜? 설명 통계를 보여 드리겠습니다.

age, years, mean (SD)                  54 (2)
males, freq (%)                       490 (98)
blood alcohol level, %, mean (SD)    0.10 (0.01)
...

위의 샘플에서 나이가 많고 술에 취한 남성으로 구성되어 있음을 알 수 있습니다. 이 정보를 통해 독자는이 결과가 젊은 남성의 부상 또는 무 중독 라이더 또는 여성 라이더의 부상에 대해 무엇을 말할 수 있는지 말할 수 있습니다.

기술 통계량을 무시하지 마십시오.


5
좋은 예입니다. 진짜인가요 메이크업인가요?
amoeba 말한다 Reinstate Monica

5
감사합니다, @amoeba. 숫자와 통계는 실제입니다. 그러나 나는 무고한 사람들을 보호하기 위해 주제를 외상성 뇌 손상으로 바꿨습니다.

3
헬멧없이 오토바이를 타는 술 취한 남자들 ... 누가 외상성 뇌 손상을 입을 수 있다고 생각했을까요?
gung-Monica Monica 복원

나는 당시 멋진 호주 빨강의 유리를 즐기고 밥은 당신의 삼촌 ...

25

설명 통계를 제공하는 요점은 다른 센터 나 국가의 사람들이 결과가 상황에 일반화되는지 여부를 평가할 수 있도록 표본을 특성화하는 것입니다. 따라서 귀하의 경우 성별, 성적 등을 표로 묶는 것이 로지스틱 회귀에 유리한 추가 요소가 될 것입니다. 사람들이 그렇게하려고 시도하더라도 가정을 확인할 수는 없습니다.

============== 건강에 사용되는 일부 지침에 대한 링크를 제공하도록 편집

친숙한 건강 분야에는보고에 대한 특정 지침이 있습니다. 이들은 EQUATOR 네트워크 에서 함께 수집되었으며 최신 세부 정보를 위해 상담해야합니다.

예를 들어 관련 지침이 CONSORT 인 임상 시험을 볼 수 있습니다. 여기 및 다른 곳에서 사용 가능한 지침을 요약 한 문서 에서 표 1 권장 사항 15 "각 그룹의 기본 인구 통계 및 임상 특성을 보여주는 표"를 읽습니다.

다른 연구 유형에 대해서도 비슷한 권장 사항이 있습니다.


mdewey에게 감사드립니다. 다양한 설명을 할 때 그리고 우리가 정상이나 왜곡을 발견하면 왜 단지 그것에 대해 언급하는 것입니까? 따라서 기본적으로 설명 통계는 실제 데이터 만 사용하여 독자에게 작업중인 데이터를 알려줍니다. 이것이 기본적으로 보일 수 있다면 정말 죄송합니다.
user3223190

그것이 내가 가장 친숙한 건강 분야에서 작동하는 방식입니다.
mdewey

8
+1. 처음에는 "다른 센터 나 국가에서" "다른 세기에"라고 잘못 읽었습니다.
amoeba 말한다 Reinstate Monica

4

또 다른 것은 변수가 얼마나 잘 작동하는지 보여주는 것입니다. 예를 들어 변수 중 하나가 급여이고 정확히 10 억 장을 인터뷰 한 경우 그의 급여를 로지스틱 회귀에 입력하면 다른 모든 항목을 지배하게되므로 급여를 무시하는 법을 배우게 될 것입니다. 실제로 보유 할 수있는 정보의 양

일부 방법은 다른 방법보다 왜곡 및 극단 값에 더 민감하며 로지스틱 회귀는 민감한 측면에 있습니다. 물론 최종 증거는 푸딩에 있으며 원시 데이터 또는 각 기능이 정규로 변환 된 결과를 비교할 수 있습니다.


1

설명 부분은 독자에게 데이터 세트를 이해하는 데 도움이됩니다. 적용된 econ에서는 분석에서 첫 번째 잠재적 결함을 보여줄 수 있으므로 일반적으로 권장됩니다.

다른 소스의 데이터를 사용하여 설명을 날려 버릴 수 있습니다.

1 테이블이면 충분합니다. 당신이 첨부 한 것은 그리 직관적이지 않습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.