잘못된 바이트 수 길이로 인해 손상된 직렬화 된 문자열을 복구하는 방법은 무엇입니까?


96

이미지 업로드 플러그인과 함께 Hotaru CMS를 사용하고 있습니다. 게시물에 이미지를 첨부하려고하면이 오류가 발생합니다. 그렇지 않으면 오류가 없습니다.

unserialize () [function.unserialize] : 오프셋 오류

문제가되는 코드 (오류가 **와 일치 함) :

/**
     * Retrieve submission step data
     *
     * @param $key - empty when setting
     * @return bool
     */
    public function loadSubmitData($h, $key = '')
    {
        // delete everything in this table older than 30 minutes:
        $this->deleteTempData($h->db);

        if (!$key) { return false; }

        $cleanKey = preg_replace('/[^a-z0-9]+/','',$key);
        if (strcmp($key,$cleanKey) != 0) {
            return false;
        } else {
            $sql = "SELECT tempdata_value FROM " . TABLE_TEMPDATA . " WHERE tempdata_key = %s ORDER BY tempdata_updatedts DESC LIMIT 1";
            $submitted_data = $h->db->get_var($h->db->prepare($sql, $key));
            **if ($submitted_data) { return unserialize($submitted_data); } else { return false; }** 
        }
    }

테이블의 데이터, 끝 비트에 이미지 정보가 있음을 알 수 있습니다. 저는 PHP 전문가가 아니므로 여러분이 어떻게 생각할지 궁금합니다.

tempdata_value :

a:10:{s:16:"submit_editorial";b:0;s:15:"submit_orig_url";s:13:"www.bbc.co.uk";s:12:"submit_title";s:14:"No title found";s:14:"submit_content";s:12:"dnfsdkfjdfdf";s:15:"submit_category";i:2;s:11:"submit_tags";s:3:"bbc";s:9:"submit_id";b:0;s:16:"submit_subscribe";i:0;s:15:"submit_comments";s:4:"open";s:5:"image";s:19:"C:fakepath100.jpg";}

편집 : 직렬화 비트를 찾은 것 같습니다 ...

/**
     * Save submission step data
     *
     * @return bool
     */
    public function saveSubmitData($h)
    {
        // delete everything in this table older than 30 minutes:
        $this->deleteTempData($h->db);

        $sid = preg_replace('/[^a-z0-9]+/i', '', session_id());
        $key = md5(microtime() . $sid . rand());
        $sql = "INSERT INTO " . TABLE_TEMPDATA . " (tempdata_key, tempdata_value, tempdata_updateby) VALUES (%s,%s, %d)";
        $h->db->query($h->db->prepare($sql, $key, serialize($h->vars['submitted_data']), $h->currentUser->id));
        return $key;
    }

3
나를 위해 이것에 대한 빠른 수정은 직렬화 / 직렬화 해제 전에 base64_encode / 디코딩을 사용하는 것이 었습니다. davidwalsh.name/php-serialize-unserialize-issues
Valentin Despa

1
난 이유를 잘 모릅니다하지만 내 추가로 해결 @,@unserialize($product->des_txtmopscol);
Bhavin라나

2
@BhavinRana 추가 @는 오류 해결이 아니라 오류 침묵입니다. 실제로 해당 기술로 "수정되는"것은 없습니다.
mickmackusa

답변:


219

unserialize() [function.unserialize]: Error at offsetinvalid serialization data유효하지 않은 길이 로 인해

빠른 수정

당신이 할 수있는 것은 recalculating the length직렬화 된 배열의 요소입니다.

현재 직렬화 된 데이터

$data = 'a:10:{s:16:"submit_editorial";b:0;s:15:"submit_orig_url";s:13:"www.bbc.co.uk";s:12:"submit_title";s:14:"No title found";s:14:"submit_content";s:12:"dnfsdkfjdfdf";s:15:"submit_category";i:2;s:11:"submit_tags";s:3:"bbc";s:9:"submit_id";b:0;s:16:"submit_subscribe";i:0;s:15:"submit_comments";s:4:"open";s:5:"image";s:19:"C:fakepath100.jpg";}';

재 계산이없는 예

var_dump(unserialize($data));

산출

Notice: unserialize() [function.unserialize]: Error at offset 337 of 338 bytes

재 계산

$data = preg_replace('!s:(\d+):"(.*?)";!e', "'s:'.strlen('$2').':\"$2\";'", $data);
var_dump(unserialize($data));

산출

array
  'submit_editorial' => boolean false
  'submit_orig_url' => string 'www.bbc.co.uk' (length=13)
  'submit_title' => string 'No title found' (length=14)
  'submit_content' => string 'dnfsdkfjdfdf' (length=12)
  'submit_category' => int 2
  'submit_tags' => string 'bbc' (length=3)
  'submit_id' => boolean false
  'submit_subscribe' => int 0
  'submit_comments' => string 'open' (length=4)
  'image' => string 'C:fakepath100.jpg' (length=17)

추천 .. 나

이런 종류의 빠른 수정을 사용하는 대신 ... 질문을 업데이트 할 때 조언을 드리겠습니다.

  • 데이터 직렬화 방법

  • 저장 방법 ..

=============================== 편집 1 ================ ===============

오류

오류 때문에 큰 따옴표의 사용으로 생성 된 "대신 작은 따옴표 '이유 C:\fakepath\100.png로 전환되었다C:fakepath100.jpg

오류를 수정하려면

당신은 변경해야합니다 $h->vars['submitted_data'](꽤 분량의 주에서 ')

바꾸다

 $h->vars['submitted_data']['image'] = "C:\fakepath\100.png" ;

 $h->vars['submitted_data']['image'] = 'C:\fakepath\100.png' ;

추가 필터

serialize를 호출하기 전에이 간단한 필터를 추가 할 수도 있습니다.

function satitize(&$value, $key)
{
    $value = addslashes($value);
}

array_walk($h->vars['submitted_data'], "satitize");

UTF 문자가 있으면 실행할 수도 있습니다.

 $h->vars['submitted_data'] = array_map("utf8_encode",$h->vars['submitted_data']);

향후 직렬화 된 데이터에서 문제를 감지하는 방법

  findSerializeError ( $data1 ) ;

산출

Diffrence 9 != 7
    -> ORD number 57 != 55
    -> Line Number = 315
    -> Section Data1  = pen";s:5:"image";s:19:"C:fakepath100.jpg
    -> Section Data2  = pen";s:5:"image";s:17:"C:fakepath100.jpg
                                            ^------- The Error (Element Length)

findSerializeError 함수

function findSerializeError($data1) {
    echo "<pre>";
    $data2 = preg_replace ( '!s:(\d+):"(.*?)";!e', "'s:'.strlen('$2').':\"$2\";'",$data1 );
    $max = (strlen ( $data1 ) > strlen ( $data2 )) ? strlen ( $data1 ) : strlen ( $data2 );

    echo $data1 . PHP_EOL;
    echo $data2 . PHP_EOL;

    for($i = 0; $i < $max; $i ++) {

        if (@$data1 {$i} !== @$data2 {$i}) {

            echo "Diffrence ", @$data1 {$i}, " != ", @$data2 {$i}, PHP_EOL;
            echo "\t-> ORD number ", ord ( @$data1 {$i} ), " != ", ord ( @$data2 {$i} ), PHP_EOL;
            echo "\t-> Line Number = $i" . PHP_EOL;

            $start = ($i - 20);
            $start = ($start < 0) ? 0 : $start;
            $length = 40;

            $point = $max - $i;
            if ($point < 20) {
                $rlength = 1;
                $rpoint = - $point;
            } else {
                $rpoint = $length - 20;
                $rlength = 1;
            }

            echo "\t-> Section Data1  = ", substr_replace ( substr ( $data1, $start, $length ), "<b style=\"color:green\">{$data1 {$i}}</b>", $rpoint, $rlength ), PHP_EOL;
            echo "\t-> Section Data2  = ", substr_replace ( substr ( $data2, $start, $length ), "<b style=\"color:red\">{$data2 {$i}}</b>", $rpoint, $rlength ), PHP_EOL;
        }

    }

}

데이터베이스에 저장하는 더 좋은 방법

$toDatabse = base64_encode(serialize($data));  // Save to database
$fromDatabase = unserialize(base64_decode($data)); //Getting Save Format 

1
바바, 나는 당신의 놀라운 findSerializeError기능을 사용 했고 많은 오류를 발견했습니다. 살펴 보시기 바랍니다 내 주제
최대 Koretskyi

1
base64데이터베이스에 추가하기 전에 Article에 사용 ... null 문자를 유지합니다
Baba

1
그것은 데이터베이스에 저장하는 더 좋은 방법이 아닙니다. 데이터베이스의 목적을 완전히 무시하고 싶지 않다면 그렇습니다. 암호화 된 값 묶음에서 검색을 어떻게 수행 하시겠습니까? 팽창은 말할 것도없고, 으. 올바른 인코딩이 올바른 대답입니다.
Deji

4
PHP 5.5를 사용하는 경우 @ r00tAcc3ss 답변을 참조하십시오! stackoverflow.com/a/21389439/1003020
Vinicius Garcia

5
이 오류가 나타나면 ") (preg_replace이다를 다음은 / 전자 수정 더 이상 지원되지 않습니다, 사용 preg_replace_callback 대신"php7에 -이 답변이 작동 stackoverflow.com/a/21389439/2011434
BENB

81

나는 논평 할만한 평판이 충분하지 않기 때문에 위의 "정확한"답변을 사용하는 사람들이 이것을 보길 바랍니다.

PHP 5.5 이후 preg_replace ()의 / e 수정자는 완전히 사용되지 않으며 위의 preg_match는 오류가 발생합니다. PHP 문서는 대신 preg_match_callback을 사용하도록 권장합니다.

위에서 제안한 preg_match의 대안으로 다음 솔루션을 찾으십시오.

$fixed_data = preg_replace_callback ( '!s:(\d+):"(.*?)";!', function($match) {      
    return ($match[1] == strlen($match[2])) ? $match[0] : 's:' . strlen($match[2]) . ':"' . $match[2] . '";';
},$bad_data );

3
이것은 실제로 첫 번째 캡처 그룹을 유용하게 사용하는 유일한 답변 인 것 같습니다. 바이트 수가 실제로 잘못된 경우에만 교체하는 현명한 프로그래밍이지만 이 솔루션은을 캐시하지 않으므로 strlen()중복 함수 호출을 수행합니다. 개인적으로 인라인 조건 추가가 너무 장황하다는 것을 알지만이 스 니펫은 좋은 이유로 좋은 일을하고 있습니다.
mickmackusa

3
다음 정규식으로 나를 위해 일했습니다 '!s:(\d+):"(.*?)";!s'(새 줄을 사용하는 끝 's'도 있음). 아래 adilbo의 의견에 감사드립니다.
ArnoHolo

13

unserialize()직렬화 된 데이터를 데이터베이스에 부적절하게 넣었 기 때문에 실패한 또 다른 이유 가 있습니다. 여기의 공식 설명을 참조 하십시오. 이후 serialize()반환 이진 데이터와 PHP 변수 방법을 인코딩 상관 없어, TEXT로 퍼팅 그래서, VARCHAR ()이 오류가 발생합니다.

솔루션 : 직렬화 된 데이터를 테이블의 BLOB에 저장하십시오.


이것은 Laravel 5에서 내 문제를 해결했습니다. 저는 열 정의를 string ()에서 binary ()로 변경했습니다.
WNRosenberg 2015 년

OP의 질문에 mysql 열 유형 문제가없는 것 같습니다. image값 에 대한 잘못된 바이트 계산으로 인해 분명히 손상되었습니다 . 귀하의 답변은 OP의 특정 질문과 관련이 없습니다. : 당신은 당신의 조언을 이동하실 수 있습니다 stackoverflow.com/q/5544749/2943403
mickmackusa

11

빠른 수정

직렬화 된 배열의 요소 길이 재 계산-사용하지 마십시오 (preg_replace) 더 이상 사용되지 않음-더 나은 preg_replace_callback 사용 :

편집 : 새 버전 지금은 단지 잘못되지 길이지만 또한 수정 행 구분 및 aczent와 올바른 문자를 계산 (덕분에 mickmackusa )

// New Version
$data = preg_replace_callback('!s:\d+:"(.*?)";!s', function($m) { return "s:" . strlen($m[1]) . ':"'.$m[1].'";'; }, $data);

1
이 잘못된 솔루션에는 어떻게 8 개의 찬성표가 있습니까? 얼마나 많은 사람들이 무의식적으로이 한 줄을 붙여 넣었을 지 생각합니다. [슬픈 얼굴은 여기서이 코드가 실패하는 두 가지 방법의 증거입니다 3v4l.org/Cf6Nh는 @ 내 세련된 패턴과 사용자 정의 교체를 참조하십시오 stackoverflow.com/a/55074706/2943403
mickmackusa

1
내 솔루션은 치명적으로 손상된 직렬화 된 문자열에 대한 잘못된 솔루션이기 때문에 더 이상 다른 페이지에 없습니다. 이 페이지에 스 니펫을 추가하고 설명과 데모를 제공했습니다. stackoverflow.com/a/55566407/2943403
mickmackusa

5

이 오류는 문자 세트가 잘못 되었기 때문에 발생합니다.

열린 태그 뒤에 문자 세트 설정 :

header('Content-Type: text/html; charset=utf-8');

그리고 데이터베이스에 charset utf8을 설정하십시오.

mysql_query("SET NAMES 'utf8'");

OP의 게시 된 질문에서 손상이 문자 집합으로 인한 것임을 제안하는 표시가 없습니다. 청구를 방어하는 데 비용이 image들지 않지만 내가 말할 수있는 한 누군가가 수동으로 값을 업데이트하고 바이트 수를 업데이트하지 못했습니다. 달리 통보하지 않는 한이 답변이 OP의 질문에 맞지 않는다고 가정해야합니다.
mickmackusa

4

멀티 바이트 문자 처리 와 함께 다음 함수를 사용하여 끊어진 직렬화 문자열을 수정할 수 있습니다 .

function repairSerializeString($value)
{

    $regex = '/s:([0-9]+):"(.*?)"/';

    return preg_replace_callback(
        $regex, function($match) {
            return "s:".mb_strlen($match[2]).":\"".$match[2]."\""; 
        },
        $value
    );
}

이 답변이 권장하는 핵심은 단순히 잘못되었으며 완벽하게 유효한 직렬화 문자열을 잠재적으로 손상시킬 수 있습니다. 이 스 니펫은 사용 / 신뢰할 수 없습니다.
mickmackusa 19

@mickmackusa 요점을 이해하지 못합니다. 최선의 방법을 제안 해 주시겠습니까? 또는이 답변에 수정 제안 ...
인 Rajesh Meniya에게

여기에 올바른 솔루션을 제공했습니다 : stackoverflow.com/a/55566407/2943403 및 문자 수가 아닌 바이트 수를 저장 mb_strlen()하기 때문에 부적절하다고 설명했습니다 serialize(). 정답을 수정하면 페이지에 중복 된 조언 만 생성됩니다.
mickmackusa

4

public function unserializeKeySkills ($ string) {

    $output = array();
    $string = trim(preg_replace('/\s\s+/', ' ',$string));
    $string = preg_replace_callback('!s:(\d+):"(.*?)";!', function($m) { return 's:'.strlen($m[2]).':"'.$m[2].'";'; }, utf8_encode( trim(preg_replace('/\s\s+/', ' ',$string)) ));
    try {
        $output =  unserialize($string);
    } catch (\Exception $e) {
        \Log::error("unserialize Data : " .print_r($string,true));
    }
    return $output;
}

PHP unserialize
Pardeep Goyal

이 솔루션은 많은 경우에 적합하지 않습니다. 모든 사람이 직렬화 된 문자열의 값을 변형하여 2 개 이상의 공백 문자를 리터럴 공백과 trim()일치하는 모든 하위 문자열로 변환하려고한다고 가정합니다 . 그 점만으로는이 솔루션을 추천 할 수 없습니다. 또한 개행 문자에 질식하고 어쨌든 덮어 쓸 기존 바이트 수를 불필요하게 캡처합니다. 마지막으로, 이것은 "코드 전용 답변"이며 이러한 유형의 답변은 미래의 연구자들을 교육 / 권한을 거의 제공하지 않기 때문에 가치가 낮습니다.
mickmackusa

4
$badData = 'a:2:{i:0;s:16:"as:45:"d";
Is \n";i:1;s:19:"as:45:"d";
Is \r\n";}';

제안 된 정규식을 사용하여 끊어진 직렬화 문자열을 수정할 수 없습니다.

$data = preg_replace('!s:(\d+):"(.*?)";!e', "'s:'.strlen('$2').':\"$2\";'", $badData);
var_dump(@unserialize($data)); // Output: bool(false)

// or

$data = preg_replace_callback(
    '/s:(\d+):"(.*?)";/',
    function($m){
        return 's:' . strlen($m[2]) . ':"' . $m[2] . '";';
    },
    $badData
);
var_dump(@unserialize($data)); // Output: bool(false)

다음 정규식을 사용하여 끊어진 직렬화 문자열을 수정할 수 있습니다.

$data = preg_replace_callback(
    '/(?<=^|\{|;)s:(\d+):\"(.*?)\";(?=[asbdiO]\:\d|N;|\}|$)/s',
    function($m){
        return 's:' . strlen($m[2]) . ':"' . $m[2] . '";';
    },
    $badData
);

var_dump(@unserialize($data));

산출

array(2) {
  [0] =>
  string(17) "as:45:"d";
Is \n"
  [1] =>
  string(19) "as:45:"d";
Is \r\n"
}

또는

array(2) {
  [0] =>
  string(16) "as:45:"d";
Is \n"
  [1] =>
  string(18) "as:45:"d";
Is \r\n"
}

1
@mickmackusa 감사합니다. 멀티 바이트 인코딩 문제를 수정했습니다.
Даниил Путилин jul.

2

공식 문서는 그것이 거짓과 세트 E_NOTICE를 반환해야 말한다

하지만 오류가 발생 했으므로 오류보고는 E_NOTICE에 의해 트리거되도록 설정됩니다.

여기에 의해 반환 된 거짓을 감지 할 수있는 수정 사항이 있습니다. unserialize

$old_err=error_reporting(); 
error_reporting($old_err & ~E_NOTICE);
$object = unserialize($serialized_data);
error_reporting($old_err);

base64 인코딩 / 디코딩 사용을 고려할 수 있습니다.

$string=base64_encode(serialize($obj));
unserialize(base64_decode($string));

base64_encode나를 위해 트릭을했다. 제 경우 serialize에는 명령 줄을 통해 d 데이터를 전달 하고 있는데 이상한 문자로 인해 제대로 작동하지 않는 것처럼 보였습니다.
quickshiftin

base64_encode()OP가 묻는 질문에 대한 해결책이 아닙니다. OP의 질문 / 문제는 직렬화 된 문자열의 "최종 배열 요소"에서 부적절한 하위 문자열 대체를 수행 할 가능성이 높음) 직렬화 된 문자열에 잘못된 바이트 수가 있다는 사실을 구체적으로 다루고 있습니다. 질문과 직접적으로 관련된 답변 만 게시하십시오.
mickmackusa

2

이 질문의 손상은 직렬화 된 문자열 끝에있는 단일 하위 문자열로 분리되어 image파일 이름 을 느리게 업데이트하려는 사람이 수동으로 대체했을 수 있습니다 . 이 사실은 OP의 게시 된 데이터를 사용하여 아래에있는 내 데모 링크 명백 할 것이다 - 짧은에, C:fakepath100.jpg길이가 없습니다 19, 그것은되어야한다 17.

직렬화 된 문자열 손상은 잘못된 바이트 / 문자 수 번호로 제한되므로 다음은 올바른 바이트 수 값으로 손상된 문자열을 업데이트하는 좋은 작업을 수행합니다.

다음 정규식 기반 교체는 바이트 수를 수정하는 데만 효과적이며 그 이상은 아닙니다.

많은 이전 게시물이 다른 사람의 정규식 패턴을 복사하여 붙여 넣은 것처럼 보입니다. 대체에 사용되지 않을 경우 잠재적으로 손상된 바이트 수를 캡처 할 이유가 없습니다. 또한 s패턴 수정자를 추가하는 것은 문자열 값에 줄 바꿈 / 줄 반환이 포함 된 경우 합당한 포함입니다.

* 직렬화로 멀티 바이트 문자의 처리를 인식 하지 못하는 경우 문자 수가 아닌 바이트 수가 저장되므로 사용자 정의 콜백에서 사용해서는 안됩니다.mb_strlen() 내 출력을 참조하십시오.

코드 : ( OP 데이터가 포함 된 데모 ) ( 임의 샘플 데이터가 포함 된 데모 ) ( 조건이 교체 된 데모 )

$corrupted = <<<STRING
a:4:{i:0;s:3:"three";i:1;s:5:"five";i:2;s:2:"newline1
newline2";i:3;s:6:"garçon";}
STRING;

$repaired = preg_replace_callback(
        '/s:\d+:"(.*?)";/s',
        //  ^^^- matched/consumed but not captured because not used in replacement
        function ($m) {
            return "s:" . strlen($m[1]) . ":\"{$m[1]}\";";
        },
        $corrupted
    );

echo $corrupted , "\n" , $repaired;
echo "\n---\n";
var_export(unserialize($repaired));

산출:

a:4:{i:0;s:3:"three";i:1;s:5:"five";i:2;s:2:"newline1
Newline2";i:3;s:6:"garçon";}
a:4:{i:0;s:5:"three";i:1;s:4:"five";i:2;s:17:"newline1
Newline2";i:3;s:7:"garçon";}
---
array (
  0 => 'three',
  1 => 'five',
  2 => 'newline1
Newline2',
  3 => 'garçon',
)

토끼 구멍 아래로 한쪽 다리 ... 위의 내용은 문자열 값에 큰 따옴표가 있어도 잘 작동하지만 문자열 값에 ";다른 몽키 스부 스트링이 포함되어 있으면 조금 더 나아가 "lookarounds"를 구현해야합니다. 나의 새로운 패턴

선행 s이 다음 과 같은지 확인합니다 .

  • 전체 입력 문자열의 시작 또는
  • 앞에 ;

다음 사항을 확인합니다 ";.

  • 전체 입력 문자열의 끝 또는
  • 뒤에 }또는
  • 문자열이나 정수 선언 다음에 s:i:

나는 각각의 모든 가능성을 테스트하지 않았습니다. 사실, 직렬화 된 데이터로 작업하지 않기 때문에 직렬화 된 문자열의 모든 가능성에 대해 상대적으로 익숙하지 않습니다. 최신 응용 프로그램에서는 항상 json입니다. 추가 가능한 선행 또는 후행 문자가있는 경우 주석을 남겨 주시면 둘러보기를 확장하겠습니다.

확장 된 스 니펫 : ( 데모 )

$corrupted_byte_counts = <<<STRING
a:12:{i:0;s:3:"three";i:1;s:5:"five";i:2;s:2:"newline1
newline2";i:3;s:6:"garçon";i:4;s:111:"double " quote \"escaped";i:5;s:1:"a,comma";i:6;s:9:"a:colon";i:7;s:0:"single 'quote";i:8;s:999:"semi;colon";s:5:"assoc";s:3:"yes";i:9;s:1:"monkey";wrenching doublequote-semicolon";s:3:"s:";s:9:"val s: val";}
STRING;

$repaired = preg_replace_callback(
        '/(?<=^|;)s:\d+:"(.*?)";(?=$|}|[si]:)/s',
        //^^^^^^^^--------------^^^^^^^^^^^^^-- some additional validation
        function ($m) {
            return 's:' . strlen($m[1]) . ":\"{$m[1]}\";";
        },
        $corrupted_byte_counts
    );

echo "corrupted serialized array:\n$corrupted_byte_counts";
echo "\n---\n";
echo "repaired serialized array:\n$repaired";
echo "\n---\n";
print_r(unserialize($repaired));

산출:

corrupted serialized array:
a:12:{i:0;s:3:"three";i:1;s:5:"five";i:2;s:2:"newline1
newline2";i:3;s:6:"garçon";i:4;s:111:"double " quote \"escaped";i:5;s:1:"a,comma";i:6;s:9:"a:colon";i:7;s:0:"single 'quote";i:8;s:999:"semi;colon";s:5:"assoc";s:3:"yes";i:9;s:1:"monkey";wrenching doublequote-semicolon";s:3:"s:";s:9:"val s: val";}
---
repaired serialized array:
a:12:{i:0;s:5:"three";i:1;s:4:"five";i:2;s:17:"newline1
newline2";i:3;s:7:"garçon";i:4;s:24:"double " quote \"escaped";i:5;s:7:"a,comma";i:6;s:7:"a:colon";i:7;s:13:"single 'quote";i:8;s:10:"semi;colon";s:5:"assoc";s:3:"yes";i:9;s:39:"monkey";wrenching doublequote-semicolon";s:2:"s:";s:10:"val s: val";}
---
Array
(
    [0] => three
    [1] => five
    [2] => newline1
newline2
    [3] => garçon
    [4] => double " quote \"escaped
    [5] => a,comma
    [6] => a:colon
    [7] => single 'quote
    [8] => semi;colon
    [assoc] => yes
    [9] => monkey";wrenching doublequote-semicolon
    [s:] => val s: val
)

1

데이터 정렬 유형을로 변경해야 utf8_unicode_ci하며 문제가 해결됩니다.


OP의 샘플 데이터에서 데이터 정렬을 변경하여 수정 될 것이라고 생각하는 특정 문자는 무엇입니까 utf8_unicode_ci? 나는 이것에 대한 나의 의심이있다.
mickmackusa

이것은 또한 실제로 나를 위해 일했습니다 (r00tAcc3ss의 답변 제외) 이유를 명확히하는 누군가의 단어? 배경으로 API 호출의 데이터를 ResourceSpace 애플리케이션으로 가져 와서 배열에 저장하고 직렬화 한 다음 저장합니다. 직렬화 된 데이터가 저장되는 데 문제가 있었기 때문에 수동으로 UTF-8로 인코딩해야했고, DB에서 데이터 정렬 및 문자 집합을 가지고 놀았고, 마지막으로 utf8_general_ci 데이터 정렬이 남아있었습니다. utf8_unicode_ci로 변경했을 때 작동했습니다. .
Roberto Becerra

1

제 경우 BLOB에는 MySQL DB 필드에 직렬화 된 데이터를 저장하고 있었는데 , 이는 전체 값을 포함 할만큼 크지 않고 잘 렸습니다. 이러한 문자열은 분명히 직렬화 해제 될 수 없습니다.
일단 그 필드를 MEDIUMBLOB문제 로 변환하면 사라졌습니다. 또한 테이블 옵션 ROW_FORMATDYNAMIC또는 로 전환해야 할 수도 있습니다 COMPRESSED.


Me TEXTto- 비록 내 것이 필드 였고 65kb에서 잘 렸습니다.
Antony

이 질문은 잘림이 없습니다. OP의 질문 / 문제는 직렬화 된 문자열의 "최종 배열 요소"에서 부적절한 하위 문자열 대체를 수행 할 가능성이 높음) 직렬화 된 문자열에 잘못된 바이트 수가 있다는 사실을 구체적으로 다루고 있습니다. 질문과 직접적으로 관련된 답변 만 게시하십시오.
mickmackusa

1

성공하지 못한 채이 페이지에서 몇 가지를 시도한 후 페이지 소스를 살펴보고 직렬화 된 문자열의 모든 따옴표가 html-entities로 대체되었음을 언급했습니다. 이러한 엔티티를 디코딩하면 많은 골칫거리를 피할 수 있습니다.

$myVar = html_entity_decode($myVar);

이 질문은 직렬화 된 문자열에서 html로 인코딩 된 엔티티로 인해 어려움을 겪지 않습니다. OP의 질문 / 문제는 직렬화 된 문자열의 "최종 배열 요소"에서 부적절한 하위 문자열 대체를 수행 할 가능성이 높음) 직렬화 된 문자열에 잘못된 바이트 수가 있다는 사실을 구체적으로 다루고 있습니다. 질문과 직접적으로 관련된 답변 만 게시하십시오.
mickmackusa

@mickmackusa이 질문은 거의 7 년 전이고 내 대답은 ~ 1,5입니다. 그럼에도 불구하고 당신이 너무 많이 참여하게되어 기쁩니다!
David

나는 젊고 오래된 SO 페이지를 좋아합니다. 좋은 답변과별로 좋지 않은 답변의 차이를 모르는 연구원을 찾고 있습니다. 안타깝게도이 페이지는 주제에서 벗어난 조언으로 가득 차 있습니다.
mickmackusa

큰! ;-)이 qualitiy 제어 및 투표는 이미,하지만 난 당신을 중지 할 이유도 없어
데이비드

아뇨,보세요. 비추천해야 할 찬성 응답이 있습니다. 너무 많은 사람들이 구별 할 수 없습니다. 이 페이지에서 투표 집계는 품질 / 적절성을 절대적으로 나타내지 않습니다. 내 반대표가 집계에 영향을주지 않기 때문에 시간을 낭비하지 않을 것입니다. 내가 할 수있는 최선은 무엇이 좋은 / 나쁜 / 못인지 설명하는 댓글을 남기는 것입니다.
mickmackusa

1

다음은 손상된 직렬화 된 문자열을 수정하기위한 온라인 도구 입니다.

나는이 주로 인해 검색에 발생하고, DB 및 (직렬화 데이터에서 수행 교체 할 것을 추가 할 특별히key length ) (가)와 그는 "부패"를 일으키는 교체에 따라 업데이트되지 않습니다.

그럼에도 불구하고 위의 도구는 다음 로직을 사용하여 직렬화 데이터 ( Copied From Here ) 를 수정합니다 .

function error_correction_serialise($string){
    // at first, check if "fixing" is really needed at all. After that, security checkup.
    if ( unserialize($string) !== true &&  preg_match('/^[aOs]:/', $string) ) {
         $string = preg_replace_callback( '/s\:(\d+)\:\"(.*?)\";/s',    function($matches){return 's:'.strlen($matches[2]).':"'.$matches[2].'";'; },   $string );
    }
    return $string;
} 

0

이 문제의 또 다른 이유는 "페이로드"세션 테이블의 열 유형일 수 있습니다. 세션에 대한 방대한 데이터가 있다면 텍스트 열로는 충분하지 않습니다. MEDIUMTEXT 또는 LONGTEXT가 필요합니다.


이 질문은 잘림이 없습니다. OP의 질문 / 문제는 직렬화 된 문자열의 "최종 배열 요소"에서 부적절한 하위 문자열 대체를 수행 할 가능성이 높음) 직렬화 된 문자열에 잘못된 바이트 수가 있다는 사실을 구체적으로 다루고 있습니다. 질문과 직접적으로 관련된 답변 만 게시하십시오.
mickmackusa
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.