awk 고정밀 산술


11

대체 작업에서 awk에게 고정밀 산술을 수행하는 방법을 찾고 있습니다. 여기에는 파일에서 필드를 읽고 해당 값에서 1 % 단위로 대체하는 것이 포함됩니다. 그러나 나는 거기에서 정밀도를 잃고 있습니다. 다음은 문제를 간단히 재현 한 것입니다.

 $ echo 0.4970436865354813 | awk '{gsub($1, $1*1.1)}; {print}'
   0.546748

여기에 십진 정밀도 뒤에 16 자리가 있지만 awk는 6 개만 제공합니다. printf를 사용하면 동일한 결과가 나타납니다.

$ echo 0.4970436865354813 | awk '{gsub($1, $1*1.1)}; {printf("%.16G\n", $1)}'
0.546748

원하는 정밀도를 얻는 방법에 대한 제안?


아마도 awk는 더 높은 해상도를 갖지만 출력 형식이 잘립니다. printf를 사용하십시오.
dubiousjim

printf를 사용한 후 결과 값이 변경되지 않습니다. 이에 따라 질문이 수정되었습니다.
mkc

@manatwork가 지적했듯이 그것은 gsub불필요합니다. 문제는 gsub숫자가 아닌 문자열에서 작동하므로 먼저을 사용하여 변환이 수행 CONVFMT되며 기본값은 %.6g입니다.
jw013

@ jw013, 질문에서 언급했듯이 원래 문제는 1 % 단위로 숫자를 대체해야하기 때문에 gsub가 필요합니다. 단순화 된 예에서는 필요하지 않습니다.
mkc

답변:


12
$ echo 0.4970436865354813 | awk -v CONVFMT=%.17g '{gsub($1, $1*1.1)}; {print}'
0.54674805518902947

또는 오히려 여기에 :

$ echo 0.4970436865354813 | awk '{printf "%.17g\n", $1*1.1}'
0.54674805518902947

아마도 당신이 달성 할 수있는 최선일 것입니다. bc임의의 정밀도를 위해 대신 사용하십시오 .

$ echo '0.4970436865354813 * 1.1' | bc -l
.54674805518902943

당신은에서 임의 정밀도 싶은 경우에 AWK당신이 사용할 수있는 -M플래그를하고, 설정 PREC많은 수의 값을
로버트 벤슨

3
@RobertBenson, GNU awk 및 최신 버전 (4.1 이상, 답변이 작성된 시점이 아님) 및 컴파일 타임에 MPFR이 활성화 된 경우에만 가능합니다.
Stéphane Chazelas

2

(GNU) awk (bignum이 컴파일 된 상태)로 더 높은 정밀도를 얻으려면 다음을 사용하십시오.

$ echo '0.4970436865354813' | awk -M -v PREC=100 '{printf("%.18f\n", $1)}'
0.497043686535481300

PREC = 100은 기본 53 비트 대신 100 비트를 의미합니다.
해당 awk를 사용할 수 없으면 bc를 사용하십시오.

$ echo '0.4970436865354813*1.1' | bc -l
.54674805518902943

또는 수레의 고유 한 부정확성을 가지고 사는 법을 배워야합니다.


원래 줄에는 몇 가지 문제가 있습니다.

  • 1.1의 인수는 1 %가 아니라 10 % 증가한 것입니다 (1.01 배수 여야 함). 10 %를 사용하겠습니다.
  • 문자열에서 (부동) 숫자로의 변환 형식은 CONVFMT에 의해 제공됩니다. 기본값은 %.6g입니다. 값이 소수점 이하 6 자리로 제한됩니다. 이는의 gsub 변경 결과에 적용됩니다 $1.

    $ a='0.4970436865354813'
    $ echo "$a" | awk '{printf("%.16f\n", $1*1.1)}'
    0.5467480551890295
    
    $ echo "$a" | awk '{gsub($1, $1*1.1)}; {printf("%.16f\n", $1)}'
    0.5467480000000000
  • printf 형식 g은 후행 0을 제거합니다.

    $ echo "$a" | awk '{gsub($1, $1*1.1)}; {printf("%.16g\n", $1)}'
    0.546748
    
    $ echo "$a" | awk '{gsub($1, $1*1.1)}; {printf("%.17g\n", $1)}'
    0.54674800000000001

    두 가지 문제를 모두 해결할 수 있습니다.

    $ echo "$a" | awk '{printf("%.17g\n", $1*1.1)}'
    0.54674805518902947

    또는

    $ echo "$a" | awk -v CONVFMT=%.30g '{gsub($1, $1*1.1)}; {printf("%.17f\n", $1)}'
    0.54674805518902947 

그러나 이것이 더 높은 정밀도를 의미한다는 생각을하지 마십시오. 내부 숫자 표현은 여전히 ​​두 배 크기의 부동입니다. 즉, 정밀도는 53 비트이며 최대 17 자리가 여러 번 올바르게 표시 되더라도 15 자리의 정확한 10 진수 만 확신 할 수 있습니다. 신기루입니다.

$ echo "$a" | awk -v CONVFMT=%.30g '{gsub($1, $1*1.1}; {printf("%.30f\n", $1)}'
0.546748055189029469325134868996

올바른 값은 다음과 같습니다.

$ echo "scale=18; 0.4970436865354813 * 1.1" | bc
.54674805518902943

bignum 라이브러리가 다음과 같이 컴파일 된 경우 (GNU) awk로 계산할 수도 있습니다.

$ echo "$a" | awk -M -v PREC=100 -v CONVFMT=%.30g '{printf("%.30f\n", $1)}'
0.497043686535481300000000000000
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.