Log()
이 분산 데이터가 있으므로 음수 값을로 변환하는 방법을 알고 싶습니다 . 수식에서 작동한다는 것을 읽었 Log(x+1)
지만 데이터베이스에서는 작동하지 않으며 결과적으로 NaN을 계속 얻습니다. 예를 들어이 경고 메시지가 나타납니다 (음수 값 중 하나를 사용하면 예를 보여주기에 충분하다고 생각하기 때문에 전체 데이터베이스를 넣지 않았습니다).
> log(-1.27+1)
[1] NaN
Warning message:
In log(-1.27 + 1) : NaNs produced
>
미리 감사드립니다
최신 정보:
여기 내 데이터의 히스토그램이 있습니다. 나는 고 생물학적 시계열 화학 측정을 사용하고 있습니다. 예를 들어 Ca와 Zn과 같은 변수의 차이가 너무 큽니다. 그런 다음 일부 유형의 데이터 표준화가 필요 log()
합니다. 그래서 함수를 테스트하고 있습니다.
이것은 내 원시 데이터입니다
범위, 평균, 음수, 제로 및 양수 값의 주파수를 포함한 데이터에 대해 자세히 알려주십시오. 평균 응답이 긍정적이라고 생각하는 것이 합리적이라면 로그 링크가있는 일반화 된 선형 모델이 데이터에 가장 적합 할 수 있습니다. 전혀 변형되어서는 안될 수도 있습니다.
—
Nick Cox
세부 정보를 추가해 주셔서 감사합니다. 이러한 데이터의 경우 0은 실제로 보존되어야하는 의미 (같음!)를 갖습니다 . 그와 다른 이유로 큐브 루트를 사용합니다. 실제로
—
Nick Cox
sign(x) * (abs(x))^(1/3)
소프트웨어 구문에 따라 세부 사항에 대한 변형이 필요 합니다. 큐브 루트에 대한 자세한 내용은 stata-journal.com/sjpdf.html?articlenum=st0223 ( 예 : pp.152-3 참조)을 참조하십시오. 큐브 루트를 사용하여 본질적
차이점 대신 원래 변수 를 변환하지 않는 이유는 무엇 입니까?
—
whuber
수학적 문제를 해결했습니다. @ whuber의 제안이나 큐브 뿌리는 여전히 상수가 순전히 경험적이거나 변수간에 다른 경우 더 쉽게 작업 할 수 있다고 생각합니다. 변환을 선택하는 좋은 규칙은 상상할 수있는 유사한 데이터에 적합한 변환 만 사용하는 것입니다. 따라서 "작품"에 대한 하지만 다음 배치에 의해 경계 경우 실패 ..x > − 4 − 5
—
닉 콕스
log(x+1)
변환 만 정의되는 것x > -1
다음으로,x + 1
긍정적이다. 데이터를 로그 변환하려는 이유를 아는 것이 좋습니다.