PHP json_encode 함수가 UTF-8 문자열을 16 진수 엔티티로 변환하는 이유는 무엇입니까?


148

다양한 언어를 다루는 PHP 스크립트가 있습니다. 불행히도를 사용하려고 할 때마다 json_encode모든 유니 코드 출력은 16 진수 엔터티로 변환됩니다. 이것이 예상되는 동작입니까? 출력을 UTF-8 문자로 변환하는 방법이 있습니까?

다음은 내가보고있는 예입니다.

입력

echo $text;

산출

База данни грешка.

입력

json_encode($text);

산출

"\u0411\u0430\u0437\u0430 \u0434\u0430\u043d\u043d\u0438 \u0433\u0440\u0435\u0448\u043a\u0430."

답변:


355

PHP / 5.4.0부터라는 옵션이 "JSON_UNESCAPED_UNICODE"있습니다. 확인 해봐:

http://se2.php.net/json_encode

따라서 다음을 시도해야합니다.

json_encode( $text, JSON_UNESCAPED_UNICODE );

3
아하. 감사! 설명서를보다 자세히 읽었어야합니다. 감사.
David Jones

3
JSON_UNESCAPED_UNICODE는 PHP 5.4.0에서 도입되었으며 이전 버전에서는 사용할 수 없습니다. 이전 버전에서 사용하면 다음과 같은 오류가 발생합니다. "경고 : json_encode ()는 매개 변수 2가 길고 문자열이 ...로 제공 될 것으로 예상합니다." 5.3 해결책은 아래 CertaiN의 답변을 참조하십시오.
Octavian Naicu

이것은 덴마크어 Æ, æ, Ø, ø, Å, å 와도 작동합니다. 감사합니다!
ymerdrengene

환상적인, 이것은 내가 찾던 대답이었습니다!
randomizer

2
당신은 내 생명을 구했습니다. 감사.
Jon Zangitu

57

JSON_UNESCAPED_UNICODE는 PHP 버전 5.4 이상에서 사용 가능합니다.
다음 코드는 버전 5.3 용입니다.

업데이트

  • html_entity_decodepack+ 보다 조금 더 효율적 mb_convert_encoding입니다.
  • (*SKIP)(*FAIL)백 슬래시 자체와 지정된 문자를 JSON_HEX_*플래그 별로 건너 뜁니다 .

 

function raw_json_encode($input, $flags = 0) {
    $fails = implode('|', array_filter(array(
        '\\\\',
        $flags & JSON_HEX_TAG ? 'u003[CE]' : '',
        $flags & JSON_HEX_AMP ? 'u0026' : '',
        $flags & JSON_HEX_APOS ? 'u0027' : '',
        $flags & JSON_HEX_QUOT ? 'u0022' : '',
    )));
    $pattern = "/\\\\(?:(?:$fails)(*SKIP)(*FAIL)|u([0-9a-fA-F]{4}))/";
    $callback = function ($m) {
        return html_entity_decode("&#x$m[1];", ENT_QUOTES, 'UTF-8');
    };
    return preg_replace_callback($pattern, $callback, json_encode($input, $flags));
}

1
\ u가 \ U가 아니어야합니까?
malhal

4
PHP를위한 멋진 솔루션 <5.4;)
qdev

호스트가 5.4로 업그레이드되지 않았으므로 버전 5.3에 대한이 솔루션을 찾기 위해 3 일을 찾고있었습니다. 나에게 당신은 생명의 은인이며 너무 완벽하기 때문에 나는 이것을 받아 들인 대답으로 표시하고 싶습니다!
Laci

string에 포함 된 버그를 수정했습니다 \\ . 최신 버전 \\ 보다 우선 순위가 높습니다 \u.
mpyw

이것은 php 라이브러리에 추가되어야합니다. 잘 했어.
Beraki

7

문자셋과 이스케이프되지 않은 유니 코드를 설정하고 싶습니다

 header('Content-Type: application/json;charset=utf-8');  
 json_encode($data,JSON_UNESCAPED_UNICODE|JSON_PRETTY_PRINT);

4

한 가지 해결책은 먼저 데이터를 인코딩 한 다음 동일한 파일에서 디코딩하는 것입니다.

$string =json_encode($input, JSON_UNESCAPED_UNICODE) ; 
echo $decoded = html_entity_decode( $string );

1

다음은 다양한 PHP 버전에 대한 통합 솔루션입니다.

우리 회사에서는 다양한 PHP 버전의 다른 서버를 사용하고 있으므로 모든 솔루션을 찾아야했습니다.

$phpVersion = substr(phpversion(), 0, 3)*1;

if($phpVersion >= 5.4) {
  $encodedValue = json_encode($value, JSON_UNESCAPED_UNICODE);
} else {
  $encodedValue = preg_replace('/\\\\u([a-f0-9]{4})/e', "iconv('UCS-4LE','UTF-8',pack('V', hexdec('U$1')))", json_encode($value));
}

크레딧은 Marco Gasi & abu 로 가야합니다 . PHP> = 5.4에 대한 솔루션은 json_encode 문서에서 제공됩니다.


0

raw_json_encode () 함수는 위에서 나에게 문제가 해결되지 않았다 (어떤 이유로, 콜백 함수 내 PHP 5.2.5 서버에 오류가 제기).

그러나이 다른 솔루션은 실제로 작동했습니다.

https://www.experts-exchange.com/questions/28628085/json-encode-fails-with-special-characters.html

크레딧은 Marco Gasi 에게 가야합니다 . json_encode ()를 호출하는 대신 그의 함수를 호출합니다.

function jsonRemoveUnicodeSequences( $json_struct )
{ 
    return preg_replace( "/\\\\u([a-f0-9]{4})/e", "iconv('UCS-4LE','UTF-8',pack('V', hexdec('U$1')))", json_encode( $json_struct ) );
}


-2

당신이 요청한 이후 :

출력을 UTF-8 문자로 변환하는 방법이 있습니까?

또 다른 해결책은 utf8_encode 를 사용하는 것 입니다.

문자열을로 인코딩합니다 UTF-8.

예 :

foreach ($rows as $key => $row) {
  $rows[$key]["keyword"] = utf8_encode($row["keyword"]);
}

echo json_encode($rows);

2
이것을 사용하지 마십시오. PHP 문서 페이지에 명시된 바와 같이, utf8_encode는 원본 문자열이 ISO-8859-1 (Latin1)로 인코딩 된 경우에만 적합합니다. "이 문자열이 utf-8로 인코딩되어 있는지 확인"기능의 목적은 아닙니다.
telomere

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.