내가 읽고있는 이 내 수업, 무작위 알고리즘에 대한 책. 이 특정 책에는 무작위 선택을 사용하여 배열의 중앙값을 찾는 데 전념하는 전체 섹션이 있으며, 이는 더 효율적인 알고리즘으로 이어집니다. 이제 저는 컴퓨터 과학 분야에서 이론적 인 개선 외에도이 알고리즘의 실제 적용이 있는지 알고 싶었습니다. 배열의 중앙값을 찾아야하는 알고리즘이나 데이터 구조가 있습니까?
내가 읽고있는 이 내 수업, 무작위 알고리즘에 대한 책. 이 특정 책에는 무작위 선택을 사용하여 배열의 중앙값을 찾는 데 전념하는 전체 섹션이 있으며, 이는 더 효율적인 알고리즘으로 이어집니다. 이제 저는 컴퓨터 과학 분야에서 이론적 인 개선 외에도이 알고리즘의 실제 적용이 있는지 알고 싶었습니다. 배열의 중앙값을 찾아야하는 알고리즘이나 데이터 구조가 있습니까?
답변:
이론적 인 개선 외에 컴퓨터 과학 분야에서이 알고리즘을 실제로 적용 할 수있는 경우
이 알고리즘의 적용은 간단합니다. 데이터 집합의 중앙값 을 계산할 때마다 (즉, 배열) 사용합니다. 이 데이터는 천문 관측, 사회 과학, 생물학적 데이터 등 다른 영역에서 나올 수 있습니다.
그러나 중간을 의미하는 것이 언제 (또는 모드) 선호하는지 언급 할 가치가 있습니다. 기본적으로 기술 통계량에서 데이터가 완전히 정규 분포 일 때 평균, 모드 및 중앙값이 동일합니다. 즉, 일치합니다. 반면에, 데이터가 왜곡 될 때, 즉 데이터의 주파수 분포가 (왼쪽 / 오른쪽) 기울어지면, 왜도가 전형적인 값에서 왼쪽 또는 오른쪽으로 드래그하기 때문에 평균이 최상의 중앙 위치를 제공하지 못합니다. 중간 값은 치우친 데이터의 영향을 크게받지 않으므로 일반적인 값을 가리키는이 위치를 가장 잘 유지합니다. 따라서 치우친 데이터를 처리 할 때 중앙값을 계산하는 것이 좋습니다.
또한 기계 학습은 통계 방법이 많이 사용되는 곳입니다 (예 : medians clustering) .
중앙값 필터링 은 이미지 처리에서 특정 유형의 노이즈를 줄이는 데 일반적입니다. 특히 소금과 후추 소음. 이미지의 각 로컬 이웃에있는 각 색상 채널의 중앙값을 선택하고이를 대체하여 작동합니다. 이 지역의 규모는 다를 수 있습니다. 널리 사용되는 필터 크기 (이웃)는 예를 들어 3x3 및 5x5 픽셀입니다.
중간 값의 평균은 일부 응용 프로그램이 있습니다