DOMNode의 innerHTML을 얻는 방법?


96

PHP DOM 구현에서 주어진 DOMNode의 innerHTML을 얻기 위해 어떤 함수를 사용합니까? 누군가 신뢰할 수있는 솔루션을 제공 할 수 있습니까?

물론 outerHTML도 마찬가지입니다.

답변:


152

이 업데이트 된 변종을 PHP Manual User Note # 89718비교하십시오 .

<?php 
function DOMinnerHTML(DOMNode $element) 
{ 
    $innerHTML = ""; 
    $children  = $element->childNodes;

    foreach ($children as $child) 
    { 
        $innerHTML .= $element->ownerDocument->saveHTML($child);
    }

    return $innerHTML; 
} 
?> 

예:

<?php 
$dom= new DOMDocument(); 
$dom->preserveWhiteSpace = false;
$dom->formatOutput       = true;
$dom->load($html_string); 

$domTables = $dom->getElementsByTagName("table"); 

// Iterate over DOMNodeList (Implements Traversable)
foreach ($domTables as $table) 
{ 
    echo DOMinnerHTML($table); 
} 
?> 

감사. 잘 작동합니다. $ dom-> preserveWhiteSpace = false이면 안됩니다. 문서를로드하기 전입니까?
Dawid Ohia


추가 정보 : PHP 5.3.6부터 임시 DOMDocument. 또 하나는 교체 할 수 있습니다 trim으로 ltrim행 구분와 같은 공백의 비트를 유지하기 위해 (또는 완전히 제거).
hakre

이와 같은 함수를 DomDocument 클래스에 추가해야합니다.
Nate

3
에서 반환을 전달할 때 DOMElement대신 a를 기대하도록 함수 선언을 변경해야했습니다 . 다른 사람을 넘어 뜨릴 경우를 대비하여. DOMNodeDOMDocument::getElementById()
miken32 2014 년

25

다음은 함수형 프로그래밍 스타일 의 버전 입니다.

function innerHTML($node) {
    return implode(array_map([$node->ownerDocument,"saveHTML"], 
                             iterator_to_array($node->childNodes)));
}

13

html요소의 를 반환하려면 C14N ()을 사용할 수 있습니다 .

$dom = new DOMDocument();
$dom->loadHtml($html);
$x = new DOMXpath($dom);
foreach($x->query('//table') as $table){
    echo $table->C14N();
}

2
C14N은 HTML을 유효한 XML로 변환하려고 시도합니다. 예를 들어 <br>은 <br> </br>이됩니다.
ajaybc

html, head 및 body 태그를 출력하는 saveHTML을 사용하지 않고 요소의 HTML을 덤프하는 더러운 방법입니다.
CONvid19

9

Haim Evgi의 답변의 단순화 된 버전 :

<?php

function innerHTML(\DOMElement $element)
{
    $doc = $element->ownerDocument;

    $html = '';

    foreach ($element->childNodes as $node) {
        $html .= $doc->saveHTML($node);
    }

    return $html;
}

사용 예 :

<?php

$doc = new \DOMDocument();
$doc->loadHTML("<body><div id='foo'><p>This is <b>an <i>example</i></b> paragraph<br>\n\ncontaining newlines.</p><p>This is another paragraph.</p></div></body>");

print innerHTML($doc->getElementById('foo'));

/*
<p>This is <b>an <i>example</i></b> paragraph<br>

containing newlines.</p>
<p>This is another paragraph.</p>
*/

preserveWhiteSpace또는 을 설정할 필요가 없습니다 formatOutput.


4

trincot의 멋진 버전과 함께 array_map그리고 implode이번에는 array_reduce:

return array_reduce(
   iterator_to_array($node->childNodes),
   function ($carry, \DOMNode $child) {
        return $carry.$child->ownerDocument->saveHTML($child);
   }
);

아직도 이해가 안되는데, 왜 reduce()배열과 반복자를 똑같이 받아들이는 방법이 없는지 .


3
function setnodevalue($doc, $node, $newvalue){
  while($node->childNodes->length> 0){
    $node->removeChild($node->firstChild);
  }
  $fragment= $doc->createDocumentFragment();
  $fragment->preserveWhiteSpace= false;
  if(!empty($newvalue)){
    $fragment->appendXML(trim($newvalue));
    $nod= $doc->importNode($fragment, true);
    $node->appendChild($nod);
  }
}

2

다음 은 php.net에서 Drupella가 작성한 이 주석 을 기반으로 한 또 다른 접근 방식으로 제 프로젝트에 잘 맞았습니다. 하위 노드를 명시 적으로 반복하는 대신 innerHTML()새를 만들고 DOMDocument가져 와서 대상 노드에 추가하여을 정의합니다 .

InnerHTML

이 도우미 함수를 정의 해 보겠습니다.

function innerHTML( \DOMNode $n, $include_target_tag = true ) {
  $doc = new \DOMDocument();
  $doc->appendChild( $doc->importNode( $n, true ) );
  $html = trim( $doc->saveHTML() );
  if ( $include_target_tag ) {
      return $html;
  }
  return preg_replace( '@^<' . $n->nodeName .'[^>]*>|</'. $n->nodeName .'>$@', '', $html );
}

두 번째 입력 인수를 통해 외부 대상 태그를 포함 / 제외 할 수 있습니다.

사용 예

여기서 우리는 "first"id 속성에 의해 주어진 대상 태그에 대한 내부 HTML을 추출합니다.

$html = '<div id="first"><h1>Hello</h1></div><div id="second"><p>World!</p></div>';
$doc  = new \DOMDocument();
$doc->loadHTML( $html );
$node = $doc->getElementById( 'first' );

if ( $node instanceof \DOMNode ) {

    echo innerHTML( $node, true );
    // Output: <div id="first"><h1>Hello</h1></div>    

    echo innerHTML( $node, false );
    // Output: <h1>Hello</h1>
}

라이브 예 :

http://sandbox.onlinephpfunctions.com/code/2714ea116aad9957c3c437d46134a1688e9133b8


1

이전 쿼리이지만이를 수행하는 기본 제공 방법이 있습니다. 대상 노드를 DomDocument->saveHtml().

전체 예 :

$html = '<div><p>ciao questa è una <b>prova</b>.</p></div>';
$dom = new DomDocument($html);
@$dom->loadHTML($html);
$xpath = new DOMXPath($dom);
$node = $xpath->query('.//div/*'); // with * you get inner html without surrounding div tag; without * you get inner html with surrounding div tag
$innerHtml = $dom->saveHtml($node);
var_dump($innerHtml);

산출: <p>ciao questa è una <b>prova</b>.</p>


경고 : DOMDocument :: saveHTML ()은 매개 변수 1이 DOMNode 일 것으로 예상합니다. 객체는 주어진
Ivan Gusev
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.