나는 통계를 연구하고 종종를 포함하는 수식을 접하게되는데 log
이것을 log
기본 10 의 기본 의미로 해석해야 하거나 통계에서 기호 log
가 일반적으로 자연 로그라고 가정 하면 항상 혼란스러워합니다 ln
.
특히 저는 Good-Turing Frequency Estimation 을 예로 들어 공부하고 있지만 제 질문은 더 일반적인 질문입니다.
나는 통계를 연구하고 종종를 포함하는 수식을 접하게되는데 log
이것을 log
기본 10 의 기본 의미로 해석해야 하거나 통계에서 기호 log
가 일반적으로 자연 로그라고 가정 하면 항상 혼란스러워합니다 ln
.
특히 저는 Good-Turing Frequency Estimation 을 예로 들어 공부하고 있지만 제 질문은 더 일반적인 질문입니다.
답변:
기본 10 로그는 통계에서 자주 사용되지 않으므로 통계에 명시적인 기본 이없는 것으로 가정하는 것이 안전 합니다. 그러나 다른 포스터는 통계가 적용되는 다른 분야 (예 : 정보 이론)에서 통나무 10 또는 다른 염기가 일반적 일 수 있다는 점을 제시합니다. 따라서 다른 분야의 논문을 읽으면 때때로 혼란스러워집니다.
Wikipedia의 엔트로피 페이지 는 혼란스러운 사용법의 좋은 예입니다 . 같은 페이지에서 그것들은베이스 2, e 및 베이스를 의미 합니다. 문맥의 의미를 파악할 수 있지만 텍스트를 읽어야합니다. 이것은 자료를 제시하는 좋은 방법이 아닙니다. 모든 공식에서 밑이 분명하게 나타나거나 ln 이 사용되는 Logarithm 페이지 와 비교하십시오 . 나는 개인적으로 이것이 갈 길이라고 생각합니다 . 로그 표시가 사용될 때 항상 기초를 보여주십시오 . 이것은 또한 표준에 대해 ISO를 준수 하며 @Henry가 지적한 것처럼 로그 기호 가있는 지정되지 않은 기본 사용법을 정의하지 않습니다 .
마지막으로, ISO 31-11 표준 은 밑이 2 및 10 인 로그에 및 lg 부호를 규정 합니다. 요즘에는 거의 사용되지 않습니다. 우리 는 고등학교에서 lg 를 사용 했지만 다른 세계에서는 한 세기가 지났음 을 기억합니다 . 통계적 맥락에서 사용 된 이후로는 본 적이 없습니다. LaTeX 에는 lb 에 대한 태그조차 없습니다 .
때에 따라 다르지.
값을 데시벨로 변환하는 것과 같은 몇 가지 컨텍스트를 제외하면 기본 10 로그는 방정식에서 매우 드 rare니다. 그러나 로그 스케일 플롯은 종종 기본 10에 있지만 축의 레이블에서 쉽게 확인할 수 있습니다.
수학적 맥락에서, 꾸미지 않은 는 자연 로그 일 가능성이 높습니다 (즉, log e 또는 ln ). 반면에 컴퓨터 과학은 종종 밑이 2 인 로그 ( log 2 )를 사용하며 항상 명확하게 표시되지는 않습니다. 좋은 소식은베이스 간을 사소하게 변환 할 수 있으며 "잘못된"베이스를 사용하면 일정한 요인으로 만 답을 얻을 수 있다는 것입니다.
Gale의 1995 년 “눈물이없는 좋은 여행” 논문에서 텍스트의 로그는 실제로 (5 페이지에 나와 있음)이지만 부록의 R / S + 코드 는 실제로 로그 e 또는 ln 인 함수를 사용합니다. . @Henry가 아래에서 지적했듯이 이것은 실질적인 차이가 없습니다.log
내가 추측해야한다면 휴리스틱은 다음과 같습니다.
2, 또는 10의 거듭 제곱 도 존재하는 경우 로그에 해당하는 염기가있을 수 있습니다.
적분 (또는 더 일반적으로 미적분학 포함)에서 발생하면 자연 로그 일 가능성이 큽니다.
이진 검색에서와 같이 반복적으로 무언가를 반으로 나누는 경우 일 가능성이 큽니다 . 더 일반적으로, 무언가에 의해 나누어 질 수 n은 약 로그 N 시간.
정보 이론적 계산은 일반적으로 특히 현대 작업에서 사용 합니다. 그러나 비트 → log 2 , nats → ln 및 bans → log 10 단위를 확인하십시오 .
함수가 1로 떨어지거나 상승하는 지점 찾기초기 값의 e (각각 37 % 및 63 %)는 자연 로그를 나타냅니다.
귀하의 질문에 대답하기 위해 : 아니오, 로그에 대한 일반적인 고정 표기법을 취할 수 없습니다.
비슷한 질문이 SE.Math 에서 최근에 논의되었습니다 . 세 가지 유형의 로그의 차이점은 무엇입니까? 수학적 관점에서. 일반적으로 습관에 따라 다른 표기법이 있습니다 ( 의료 연구 에 사용되는 ) 또는 언어 (예 : 독일어, 러시아어, 프랑스어)에 있습니다. 불행하게도, 같은 표기법으로 인해 때로는 다른 정의를 나타냅니다. 위의 SE.Math 링크에서 인용 :
표기법 (거의)는 자연 로그 log e x (라틴 : logarithmus naturalis) 또는 밑 e의 로그를 분명하게 나타냅니다 . 표기법 로그 x 는 자연 로그에 대해 채택 된 표기법이어야하며 수학에서도 마찬가지입니다. 그러나 그것은 종종 현장에 따라 "가장 자연 스럽다"는 것을 나타냅니다 : 나는 이것을 기초 10 * 로그 ( log 10 학교에서 ) 으며 공학에서 (예를 들어 데시벨의 정의에서) 이런 식으로 자주 사용됩니다.
물리 단위 (데시벨 @Mat Krause와 같은)의 의미에 관심이 없거나 특정 변화율 (생체 통계에서)에 관심이없는 경우, 종종 접힘 변화에 대한 비율은 기본 2 로그 로그 2를 나타냅니다. )에서 자연 로그 ( log e )가 사용 되었을 수 있습니다.
예를 들어, 거듭 제곱 또는 Box-Cox 변환 (분산 안정화)에서 자연 로그는 지수가 때 한계로 나타납니다 .
에서 아카 이케 정보 기준 기본이다, 최대 가능성의 매개 변수 수와 비교하여 :
따라서 AIC의 로그에 다른 기초를 사용하면 잘못된 결론을 도출하고 잘못된 모델을 선택할 수 있습니다.
ln
고려됩니다. 그러나이 둘은 서로 관련이log(x) = ln(x) / ln(10) = ln(x) / 2.303
있으며 ln- likelihood 함수는 log10- likelihood 함수 와 같은 시점에서 극단에 도달합니다 .