내 데이터에 몇 가지 특이 치가 있으며 결과가 변경되는지 확인하기 위해 이들을 제외하고 싶었습니다. 당신은 자신을 제한해야하는 최대 특이 치의 수는 얼마입니까?
감사!
내 데이터에 몇 가지 특이 치가 있으며 결과가 변경되는지 확인하기 위해 이들을 제외하고 싶었습니다. 당신은 자신을 제한해야하는 최대 특이 치의 수는 얼마입니까?
감사!
답변:
최대 값 또는 최소값이 없습니다. 이상 치가 나쁜 데이터이거나 제거해야 할 실질적인 이유가있는 경우 이상 치를 제거해야합니다. 실질적인 이유가 없다면 특이 치에 대한 강력한 방법을 사용하는 것이 좋습니다. 특이점은 다른 점과 약간 떨어져 있기 때문에 제거하지 않습니다.
나는 다른 답변과 의견에서 언급 된 것에 중점을 둘 것입니다 (@Peter Flom의 답변은 정확하고 EdM은 무엇보다도 측정에 대해 적절하다고 생각합니다).
데이터 분석은 신중하게 수행해야합니다. 연락처에서 특이 치의 의미를 잘 알고 있어야합니다. 예를 들어, 측정 절차가 "정확하게"수행되었다고 가정하면 (바이어스를 도입하지 않았고, 장비가 보정되었고, 장비를 읽는 사람이 올바르게 수행 한 등 등), 일부 이상 치가 흥미로운 것을 말할 수 있습니다. 언젠가는 매우 중요합니다.
다음은 구성 예입니다. 모든 측면에서 100 %가 아니라면 방종하십시오 (주석으로 지적하십시오). ;)
어떤 사람이 박테리아의 일부 배양 (인구)에 일정량의 물질을 적용하는 효과를 테스트한다고 가정 해보십시오. 이제 "일반적으로"효과는 개체군의 박테리아 수를 안정화시키는 것이지만 다른 문화에는 특이 치가 있습니다.
모든 특이 치가 모든 박테리아가 죽은 상황을 나타낸다고 상상해보십시오. 또는 모든 특이 치는 박테리아 개체군이 통제 할 수없는 문화를 나타냅니다.
내가 지적하고 싶은 것은 당신의 인식 된 이상치의 본질이 의미가 있고 각각의 결과가 다르다는 것입니다. 박테리아 수가 증가하거나 감소하는 것이 참을 수없는 상황에있을 수 있습니다.
물론 물질에 의해 일부 집단이 사라진 것을 발견했다면, 물질은 쉽게 알아볼 수있는 상황이기 때문에 문제에 대해 조사 할 것입니다. 그러나 모든 현상이 쉽게 감지되는 것은 아닙니다.
결론적으로, 이상치 개념은 다소 임의적이지만 그 의미는 여러 가지이며 다른 중요성을 갖습니다. 그것이 당신이 문제에 대해 생각하게하기를 바랍니다 ... :)