아이리스 데이터 세트는 당연히 널리 특히 통계 그래픽, 다변량 통계 및 기계 학습의 다양한 문제를 설명하기 위해, 통계 과학 전반에 걸쳐 사용된다.
150 개의 관측치가 포함되어 있지만 작지만 사소한 것은 아닙니다.
꽃잎과 꽃받침의 측정에서 세 종의 홍채 를 구별하는 작업 은 간단하지만 도전적입니다.
데이터는 실제 데이터이지만 품질은 양호합니다. 원칙적으로 그리고 실제로, 테스트 데이터 세트는 종합적 일 수 있으며 포인트를 만드는 데 필요하거나 유용 할 수 있습니다. 그럼에도 불구하고 실제 데이터에 반대하는 사람은 거의 없습니다.
이 데이터는 1936 년 영국의 유명한 통계 학자 로널드 피셔 (Ronald Fisher)가 사용했습니다. (나중에 기사를 썼고 로널드 경이되었습니다.) 적어도 일부 교사들은 현장에서 잘 알려진 사람과 연결되어있는 데이터 세트 아이디어를 좋아합니다. 이 데이터는 원래 통계적 식물학자인 Edgar S. Anderson에 의해 출판되었지만, 그 초기의 출처는 연관성을 축소하지 않습니다.
몇 가지 유명한 데이터 세트를 사용하는 것은 우리가 전승하는 전통 중 하나입니다. 예를 들어, 학생이 기네스를 위해 일했거나 많은 유명한 통계 학자들이 서로 빠졌다고 이야기합니다. 관성처럼 들릴지 모르지만, 기존 방법과 새로운 방법을 비교하고 모든 방법을 평가할 때 알려진 데이터 세트에서 시도해 보는 것이 도움이되는 것으로 간주되어 방법을 평가하는 방법에있어 일부 연속성을 유지합니다.
마지막으로, 아이리스 데이터 셋은 예를 들어 데이터 셋의 유용한 위키 백과 엔트리 에서와 같이 해당 꽃의 그림과 즐겁게 결합 될 수 있습니다 .
노트. 관련 식물을 조심스럽게 인용하면서 생물학적 정확성을 위해 조금만 노력하십시오. 홍채 setosa , 홍채 versicolor 및 홍채 virginica 는 3 종 (일부 통계적 설명과 같이 품종이 아님)입니다. 이항식은 여기에서 이탤릭체로 표시되어야합니다. 와 아이리스 속 이름과 특정 종을 나타내는 다른 이름으로 각각 대문자와 소문자로 시작해야합니다.