통계에서

18

나는 통계를 연구하고 종종를 포함하는 수식을 접하게되는데 log이것을 log기본 10 의 기본 의미로 해석해야 하거나 통계에서 기호 log 가 일반적으로 자연 로그라고 가정 하면 항상 혼란스러워합니다 ln.

특히 저는 Good-Turing Frequency Estimation 을 예로 들어 공부하고 있지만 제 질문은 더 일반적인 질문입니다.

mathematical-statistics notation logarithm

— 주세페 로마 뉴올로
소스

2

"많은 응용 분야 에서 로그 우도 (log-likelihood)라고하는 우도 함수 의 자연 로그 는 작업하기가 더 편리합니다." en.wikipedia.org/wiki/Likelihood_function#Log-likelihood 통계에서 우리는 종종 우도 함수와 함께 작동하지만 일반적으로 ln고려됩니다. 그러나이 둘은 서로 관련이 log(x) = ln(x) / ln(10) = ln(x) / 2.303있으며 ln- likelihood 함수는 log10- likelihood 함수 와 같은 시점에서 극단에 도달합니다 .

— John_West

5

몇 가지 특정 응용 분야에서 때,

언급베이스 (10)는 것입니다,하지만 Aksakal 알 수 있듯이, 그렇지 않은 경우는 수학에서 사용되는 규칙입니다 - 캐스팅하지 것을

자연 로그를 의미한다.

\log

$\log$

\log

$\log$

— Glen_b-복지 주 모니카

2

@John_West가 말했듯이

및

는 스케일링 계수까지 동일합니다. 따라서 그들은 다른 단위로 측정하는 것과 동일합니다.

l n (x)

$ln(x)$

l o g_{a} (x)

$log_a(x)$

1

@ 악사 칼; 당신이 말한 것은 내가 동의하는 단위가 중요하다는 것입니다 (위의 주석 참조). 또한 베이스를 명시 적으로 나타 내기 위해

를 썼습니다 . 최대 가능성과 같은 통계의 (일부) 응용 프로그램의 경우이 스케일링 계수는 관련이 없습니다. 스케일링 계수를 추가 한 후 최대 값은 변경되지 않습니다. OP의 참조 (good-turing ...)에서 그들은

(또는

) 대

를 플롯하려고합니다.

l o g_{a}

$log_a$

l o g (N_{r})

$log(N_r)$

l o g (Z_{r})

$log(Z_r)$

l o g (r)

$log(r)$ . 이것은 플롯의``곡선 ''이 변경되지 않도록 플롯의 두 축에서 단위가 변경됨을 의미합니다.

1

논문을 작성하지 않는 한, 로그 우도를 사용할 때도 척도 (대수의 기본)가 중요합니다. 예를 들어, 로그 우도 비율 검정 통계는

을 사용하므로 임계 값을 사용하려면 다른 기준에서 조정해야합니다. 소프트웨어를 작성하는 경우 논문 등에서 로그 우도 함수를 사용할 때 기본을 확보하는 것이 중요합니다. 중요하지 않다고 언급하기 위해 기본이 중요한 경우가 너무 많습니다.

\ln

$\ln$

— Aksakal

20

기본 10 로그는 통계에서 자주 사용되지 않으므로 통계에 명시적인 기본 이없는 것으로 가정하는 것이 안전 합니다. 그러나 다른 포스터는 통계가 적용되는 다른 분야 (예 : 정보 이론)에서 또는 다른 염기가 일반적 일 수 있다는 점을 제시합니다. 따라서 다른 분야의 논문을 읽으면 때때로 혼란스러워집니다. $\log=\ln$ $\log_{10}$

Wikipedia의 엔트로피 페이지 는 혼란스러운 사용법의 좋은 예입니다 . 같은 페이지에서 그것들은베이스 2, 및 베이스를 의미 합니다. 문맥의 의미를 파악할 수 있지만 텍스트를 읽어야합니다. 이것은 자료를 제시하는 좋은 방법이 아닙니다. 모든 공식에서 밑이 분명하게 나타나거나 이 사용되는 Logarithm 페이지 와 비교하십시오 . 나는 개인적으로 이것이 갈 길이라고 생각합니다 . 표시가 사용될 때 항상 기초를 보여주십시오 . 이것은 또한 표준에 대해 ISO를 준수 하며 @Henry가 지적한 것처럼 기호 가있는 지정되지 않은 기본 사용법을 정의하지 않습니다 . $\log$ $e$ $\ln$ $\log$ $\log$

마지막으로, ISO 31-11 표준 은 밑이 2 및 10 인 로그에 및 부호를 규정 합니다. 요즘에는 거의 사용되지 않습니다. 우리 는 고등학교에서 를 사용 했지만 다른 세계에서는 한 세기가 을 기억합니다 . 통계적 맥락에서 사용 된 이후로는 본 적이 없습니다. LaTeX 에는 에 대한 태그조차 없습니다 . $\text{lb}$ $\lg$ $\lg$ $\text{lb}$

— 악사 칼
소스

1

밑이 2 인 로그도 일부 필드에서 매우 일반적입니다. 원치 않는 로그는 거의 10이 아니지만 항상 e 가 아닙니다 .

— 원자력 왕

도움이 되긴하지만 "드물게"너무 강하다고 생각합니다. 사람들이 기본 10 대수에 대해서만 알고 있거나 가장 친숙하게 느낄 수있는 실질적인 분야가 있습니다. 많은 그래프는 10의 거듭 제곱을 사용한 로그 스케일을 보여줍니다. 자연 로그를 선호하는 사람은 이러한 스케일을 디코딩하는 데 어려움이 없지만 추정치는 기본 10입니다.

— Nick Cox

@NickCox, OP는 구체적으로 "통계"를 필드로 표시하며 통계에 자주 사용되는 10 진 로그를 보지 못합니다.

— Aksakal

ISO 31-11 지정 것으로 보인다

에 대한

, 그리고 꾸밈 떠나

정의되지 않은

\ln

$\ln$

\log_{e}

$\log_e$

\log

$\log$

— 헨리

1

@NickCox, 나는 언어를 부드럽게했다, 당신은 공정한 포인트를 제기

— Aksakal

14

때에 따라 다르지.

값을 데시벨로 변환하는 것과 같은 몇 가지 컨텍스트를 제외하면 기본 10 로그는 방정식에서 매우 드 rare니다. 그러나 로그 스케일 플롯은 종종 기본 10에 있지만 축의 레이블에서 쉽게 확인할 수 있습니다.

수학적 맥락에서, 꾸미지 않은 는 자연 로그 일 가능성이 높습니다 (즉, 또는 ). 반면에 컴퓨터 과학은 종종 밑이 2 인 로그 ( )를 사용하며 항상 명확하게 표시되지는 않습니다. 좋은 소식은베이스 간을 사소하게 변환 할 수 있으며 "잘못된"베이스를 사용하면 일정한 요인으로 만 답을 얻을 수 있다는 것입니다. $\log$ $\log_{e}$ $\ln$ $\log_2$

Gale의 1995 년 “눈물이없는 좋은 여행” 논문에서 텍스트의 로그는 실제로 (5 페이지에 나와 있음)이지만 부록의 R / S + 코드 는 실제로 또는 함수를 사용합니다. . @Henry가 아래에서 지적했듯이 이것은 실질적인 차이가 없습니다. $\log_{10}$ log $\log_e$ $\ln$

내가 추측해야한다면 휴리스틱은 다음과 같습니다.

2, 또는 10의 거듭 제곱 도 존재하는 경우 로그에 해당하는 염기가있을 수 있습니다. $e$
적분 (또는 더 일반적으로 미적분학 포함)에서 발생하면 자연 로그 일 가능성이 큽니다. $1/x$
이진 검색에서와 같이 반복적으로 무언가를 반으로 나누는 경우 일 가능성이 큽니다 . 더 일반적으로, 무언가에 의해 나누어 질 수 약 시간. $\log_2$ $n$ $\log_n$
정보 이론적 계산은 일반적으로 특히 현대 작업에서 사용 합니다. 그러나 , 및 단위를 확인하십시오 . $\log_2$ $\textrm{bits} \rightarrow \log_2$ $\textrm{nats} \rightarrow \ln$ $\textrm{bans} \rightarrow \log_{10}$
함수가 떨어지거나 상승하는 지점 찾기초기 값의 (각각 37 % 및 63 %)는 자연 로그를 나타냅니다. $\frac{1}{e} \textrm{ or } 1- \frac{1}{e}$

— 맷 크라우스
소스

5

+1. 작은 지수는 지수

가 근처에서 발견 되면 자연 로그가 10 또는 2의 거듭 제곱 일 가능성이 높고 반대로 될 수 있다는 것입니다. 사용중인 염기가 불분명 한 경우 저자의 예제 계산을 재현 해보십시오.

\exp ()

$\exp()$

— Nick Cox

2

강풍의 종이 페이지 6 및 7의 그래프 때문에 로그 스케일 일본어 유닛을 표시하고, 계산은 로그 - 로그 관계의 기울기, 즉 겨냥

발현에

에 대응하는

,이 경우에 실질적인 차이가 없다

b

$b$

\log (N_{r}) = a + b \log (r)

$\log(N_r ) = a + b \log(r)$

N_{r} = A r^{b}

$N_r=Ar^b$

— 헨리

2

또 다른 예는 주식 시장 데이터를 플래 팅 할 때, 로그 가격 축을 사용할 때 항상 10을 기준으로합니다.

b a s e 10

$base 10$

— Marcus D

3

귀하의 질문에 대답하기 위해 : 아니오, 로그에 대한 일반적인 고정 표기법을 취할 수 없습니다.

비슷한 질문이 SE.Math 에서 최근에 논의되었습니다 . 세 가지 유형의 로그의 차이점은 무엇입니까? 수학적 관점에서. 일반적으로 습관에 따라 다른 표기법이 있습니다 ( $\log_{10}$ 의료 연구 에 사용되는 ) 또는 언어 (예 : 독일어, 러시아어, 프랑스어)에 있습니다. 불행하게도, 같은 표기법으로 인해 때로는 다른 정의를 나타냅니다. 위의 SE.Math 링크에서 인용 :

표기법 (거의)는 자연 로그 (라틴 : logarithmus naturalis) 또는 밑 로그를 분명하게 나타냅니다 . 표기법 는 자연 로그에 대해 채택 된 표기법이어야하며 수학에서도 마찬가지입니다. 그러나 그것은 종종 현장에 따라 "가장 자연 스럽다"는 것을 나타냅니다 : 나는 이것을 기초 로그 ( $\ln x$ $\log_e x$ $e$ $\log x$ $*10$ $\log_{10}$ 학교에서 ) 으며 공학에서 (예를 들어 데시벨의 정의에서) 이런 식으로 자주 사용됩니다.

물리 단위 (데시벨 @Mat Krause와 같은)의 의미에 관심이 없거나 특정 변화율 (생체 통계에서)에 관심이없는 경우, 종종 접힘 변화에 대한 비율은 기본 로그 나타냅니다. )에서 자연 로그 ( )가 사용 되었을 수 있습니다. $\log$ $2$ $\log_2$ $\log_e$

예를 들어, 거듭 제곱 또는 Box-Cox 변환 (분산 안정화)에서 자연 로그는 지수가 때 한계로 나타납니다 . $0$

$\log$ $\log_e$ $\log_{10}$

— 로랑 듀발
소스

0

에서 아카 이케 정보 기준 기본이다 $e$ , $\ln(\hat L)$ 최대 가능성의 $\hat L$ 매개 변수 수와 비교하여 $k$ :

ㅏ 나는 씨 = 2 (케이 - \ln (엘)) .

$\mathrm{AIC} = 2(k-\ln(L)).$

따라서 AIC의 로그에 다른 기초를 사용하면 잘못된 결론을 도출하고 잘못된 모델을 선택할 수 있습니다.

— 비요른 호스 한센
소스