【问题标题】:How to convert XML into array in PHP?如何在 PHP 中将 XML 转换为数组?
【发布时间】:2011-09-28 13:27:31
【问题描述】:

我想将下面的 XML 转换为 PHP 数组。关于如何做到这一点的任何建议?

<aaaa Version="1.0">
   <bbb>
     <cccc>
       <dddd Id="id:pass" />
       <eeee name="hearaman" age="24" />
     </cccc>
   </bbb>
</aaaa>

【问题讨论】:

标签: php xml


【解决方案1】:

简单!

$xml = simplexml_load_string($xmlstring, "SimpleXMLElement", LIBXML_NOCDATA);
$json = json_encode($xml);
$array = json_decode($json,TRUE);

【讨论】:

  • 您可能会在 CDATA 部分遇到麻烦(始终返回 null)。作为解决方案,请尝试 $xml = simplexml_load_string( $xmlstring , null , LIBXML_NOCDATA ); $json = json_encode($xml); $array = json_decode($json,TRUE); (见stackoverflow.com/a/2970701/413531) //e 该死的.. 有没有办法在评论中添加新行?
  • 我们做同样的事情,但使用 simplexml_load_file 并且它工作正常。谢谢
  • 第二个参数(TRUE)是干什么用的?
  • @MansourFahad 在json_decode 中,您可以使用可选的第二个参数TRUE(通常默认为FALSE)将JSON 输入转换为关联数组。
  • @Ismael Miguel 代码太多?仅仅因为您将所有这些功能放在一行中并不意味着您使用的代码更少。它可能看起来更紧凑,但以牺牲可读性为代价。
【解决方案2】:

另一个选项是 SimpleXML 扩展(我相信它是大多数 php 安装的标准配置。)

http://php.net/manual/en/book.simplexml.php

你的例子的语法看起来像这样

$xml = new SimpleXMLElement($xmlString);
echo $xml->bbb->cccc->dddd['Id'];
echo $xml->bbb->cccc->eeee['name'];
// or...........
foreach ($xml->bbb->cccc as $element) {
  foreach($element as $key => $val) {
   echo "{$key}: {$val}";
  }
}

【讨论】:

  • 公平地说,这并不能完全回答如何获取数组的问题。
  • SimpleXML 在解析这个 xml 时很糟糕:amazon.in/rss/bestsellers/shoes?tag=dealslama-21 即使 print_r 也不会告诉对象实际上包含。
  • 使用 var_dump,你会看到 xml 结构作为对象内部的键。
  • 我在某些元素中有一些[CDATA[TEXT]],但它们没有对此进行解析。它将其解析为SimpleXMLElement Object。有什么解决方法吗?
  • 这没有回答问题
【解决方案3】:

将 XML 字符串 ($buffer) 转换为简化数组,忽略属性并将具有相同名称的子元素分组:

function XML2Array(SimpleXMLElement $parent)
{
    $array = array();

    foreach ($parent as $name => $element) {
        ($node = & $array[$name])
            && (1 === count($node) ? $node = array($node) : 1)
            && $node = & $node[];

        $node = $element->count() ? XML2Array($element) : trim($element);
    }

    return $array;
}

$xml   = simplexml_load_string($buffer);
$array = XML2Array($xml);
$array = array($xml->getName() => $array);

结果:

Array
(
    [aaaa] => Array
        (
            [bbb] => Array
                (
                    [cccc] => Array
                        (
                            [dddd] => 
                            [eeee] => 
                        )

                )

        )

)

如果您还想拥有这些属性,可以通过 SimpleXMLElement 的 JSON 编码/解码获得它们。这通常是最简单快捷的解决方案:

$xml   = simplexml_load_string($buffer);
$array = json_decode(json_encode((array) $xml), true);
$array = array($xml->getName() => $array);

结果:

Array
(
    [aaaa] => Array
        (
            [@attributes] => Array
                (
                    [Version] => 1.0
                )

            [bbb] => Array
                (
                    [cccc] => Array
                        (
                            [dddd] => Array
                                (
                                    [@attributes] => Array
                                        (
                                            [Id] => id:pass
                                        )

                                )

                            [eeee] => Array
                                (
                                    [@attributes] => Array
                                        (
                                            [name] => hearaman
                                            [age] => 24
                                        )

                                )

                        )

                )

        )

)

请注意,所有这些方法都只能在 XML 文档的命名空间中工作。

【讨论】:

  • 在 PHP 7 中我必须添加这个:&amp;&amp; (is_countable($node) &amp;&amp; 1 === count($node) ? $node = array($node) : 1),但是我在下一行出现错误:[] operator not supported for strings
  • @andreshg112:我无法重现(工作稳定的 PHP 5.3.0 - 7.4.0),行为自古以来就没有改变,请与数百个不同的 PHP 版本进行比较:3v4l.org/l4nQN
  • 可能是因为我的 KML 文件(它是一个 XML)。我不能分享它。我已经导入了它,但我必须以另一种方式进行。
  • 您可能关心 XML 命名空间。该示例仅适用于没有名称空间的部分(或默认名称,我有时会混合使用)。
【解决方案4】:
$array = json_decode(json_encode((array)simplexml_load_string($xml)),true);

【讨论】:

  • 如果你转换成数组,你不需要json_encodejson_decode
  • @Ismael 理论上,转换为数组就足够了。在实践中,我们也需要转换所有叶节点,它们也是对象。一个幼稚的演员将叶子作为 SimpleXML 对象。 json_encode 递归转换节省了大量的跑腿工作。
  • 如果您的 $array 变量中没有文本值,可能是因为 CDATA。要解决它,请使用以下命令加载您的 XML:new SimpleXMLElement($xml, LIBXML_NOCDATA)
  • ps。 $xml = str_replace(array(''),'',$xml);
  • 这样不行。该代码甚至不会转换像 &lt;?xml version="1.0" encoding="UTF-8"?&gt;&lt;note a="b"&gt;&lt;body c="d"&gt;Hello!&lt;/body&gt;&lt;/note&gt; 这样的简单 XML。运行代码,您会看到 c 属性丢失了!如果您不想要任何不好的惊喜github.com/gaarf/XML-string-to-PHP-array/blob/master/…,请在此处查看完整代码,或在下面查看我的答案stackoverflow.com/a/30234924/828366
【解决方案5】:

当遇到只有一个文本节点的子元素时,在接受的答案 drop 属性中使用的方法。例如:

$xml = '<container><element attribute="123">abcd</element></container>';
print_r(json_decode(json_encode(simplexml_load_string($xml, "SimpleXMLElement", LIBXML_NOCDATA)),1));

Array
(
    [element] => abcd
)

我的解决方案(我希望我能在此给予表扬,因为我确信我是根据某些东西改编的):

function XMLtoArray($xml) {
    $previous_value = libxml_use_internal_errors(true);
    $dom = new DOMDocument('1.0', 'UTF-8');
    $dom->preserveWhiteSpace = false; 
    $dom->loadXml($xml);
    libxml_use_internal_errors($previous_value);
    if (libxml_get_errors()) {
        return [];
    }
    return DOMtoArray($dom);
}

function DOMtoArray($root) {
    $result = array();

    if ($root->hasAttributes()) {
        $attrs = $root->attributes;
        foreach ($attrs as $attr) {
            $result['@attributes'][$attr->name] = $attr->value;
        }
    }

    if ($root->hasChildNodes()) {
        $children = $root->childNodes;
        if ($children->length == 1) {
            $child = $children->item(0);
            if (in_array($child->nodeType,[XML_TEXT_NODE,XML_CDATA_SECTION_NODE])) {
                $result['_value'] = $child->nodeValue;
                return count($result) == 1
                    ? $result['_value']
                    : $result;
            }

        }
        $groups = array();
        foreach ($children as $child) {
            if (!isset($result[$child->nodeName])) {
                $result[$child->nodeName] = DOMtoArray($child);
            } else {
                if (!isset($groups[$child->nodeName])) {
                    $result[$child->nodeName] = array($result[$child->nodeName]);
                    $groups[$child->nodeName] = 1;
                }
                $result[$child->nodeName][] = DOMtoArray($child);
            }
        }
    }
    return $result;
}

$xml = '
    <aaaa Version="1.0">
       <bbb>
         <cccc>
           <dddd id="123" />
           <eeee name="john" age="24" />
           <ffff type="employee">Supervisor</ffff>
         </cccc>
       </bbb>
    </aaaa>
';
print_r(XMLtoArray($xml));

Array
(
    [aaaa] => Array
        (
            [@attributes] => Array
                (
                    [Version] => 1.0
                )

            [bbb] => Array
                (
                    [cccc] => Array
                        (
                            [dddd] => Array
                                (
                                    [@attributes] => Array
                                        (
                                            [id] => 123
                                        )

                                )

                            [eeee] => Array
                                (
                                    [@attributes] => Array
                                        (
                                            [name] => john
                                            [age] => 24
                                        )

                                )

                            [ffff] => Array
                                (
                                    [@attributes] => Array
                                        (
                                            [type] => employee
                                        )

                                    [_value] => Supervisor
                                )

                        )

                )

        )

)

【讨论】:

  • 这是我发现的唯一处理节点属性和数组的答案。也很容易理解。
  • 太棒了。你为我节省了至少 18 年的调试时间!
  • 这个答案也没有考虑到包含文本和 XML 子节点的节点。我现在已经花了几个小时寻找。我开始相信没有任何 XML 解决方案可以正确解析所有 XML 并保留所有内容!
【解决方案6】:

https://github.com/gaarf/XML-string-to-PHP-array/blob/master/xmlstr_to_array.php

<?php
/**
  * convert xml string to php array - useful to get a serializable value
  *
  * @param string $xmlstr
  * @return array
  *
  * @author Adrien aka Gaarf & contributors
  * @see http://gaarf.info/2009/08/13/xml-string-to-php-array/
*/
function xmlstr_to_array($xmlstr) {
  $doc = new DOMDocument();
  $doc->loadXML($xmlstr);
  $root = $doc->documentElement;
  $output = domnode_to_array($root);
  $output['@root'] = $root->tagName;
  return $output;
}
function domnode_to_array($node) {
  $output = array();
  switch ($node->nodeType) {
    case XML_CDATA_SECTION_NODE:
    case XML_TEXT_NODE:
      $output = trim($node->textContent);
    break;
    case XML_ELEMENT_NODE:
      for ($i=0, $m=$node->childNodes->length; $i<$m; $i++) {
        $child = $node->childNodes->item($i);
        $v = domnode_to_array($child);
        if(isset($child->tagName)) {
          $t = $child->tagName;
          if(!isset($output[$t])) {
            $output[$t] = array();
          }
          $output[$t][] = $v;
        }
        elseif($v || $v === '0') {
          $output = (string) $v;
        }
      }
      if($node->attributes->length && !is_array($output)) { //Has attributes but isn't an array
        $output = array('@content'=>$output); //Change output into an array.
      }
      if(is_array($output)) {
        if($node->attributes->length) {
          $a = array();
          foreach($node->attributes as $attrName => $attrNode) {
            $a[$attrName] = (string) $attrNode->value;
          }
          $output['@attributes'] = $a;
        }
        foreach ($output as $t => $v) {
          if(is_array($v) && count($v)==1 && $t!='@attributes') {
            $output[$t] = $v[0];
          }
        }
      }
    break;
  }
  return $output;
}

【讨论】:

    【解决方案7】:

    很惊讶没有人提到xml_parse_into_struct

    $simple = "<para><note>simple note</note></para>";
    $p = xml_parser_create();
    xml_parse_into_struct($p, $simple, $vals, $index);
    xml_parser_free($p);
    echo "Index array\n";
    print_r($index);
    echo "\nVals array\n";
    print_r($vals);
    

    【讨论】:

    • 有时我想知道创建 PHP XML 实现的开发人员在设计 xml_parse_into_struct 时的想法......
    【解决方案8】:

    XML 到数组

    更多详情请访问https://github.com/sapankumarmohanty/lamp/blob/master/Crate-XML-2-Array

    //XML转数组,SOAP XML转数组

    function xml2array($contents, $get_attributes = 1, $priority = 'tag')
        {
            if (!$contents) return array();
            if (!function_exists('xml_parser_create')) {
                // print "'xml_parser_create()' function not found!";
                return array();
            }
            // Get the XML parser of PHP - PHP must have this module for the parser to work
            $parser = xml_parser_create('');
            xml_parser_set_option($parser, XML_OPTION_TARGET_ENCODING, "UTF-8"); // http://minutillo.com/steve/weblog/2004/6/17/php-xml-and-character-encodings-a-tale-of-sadness-rage-and-data-loss
            xml_parser_set_option($parser, XML_OPTION_CASE_FOLDING, 0);
            xml_parser_set_option($parser, XML_OPTION_SKIP_WHITE, 1);
            xml_parse_into_struct($parser, trim($contents) , $xml_values);
            xml_parser_free($parser);
            if (!$xml_values) return; //Hmm...
            // Initializations
            $xml_array = array();
            $parents = array();
            $opened_tags = array();
            $arr = array();
            $current = & $xml_array; //Refference
            // Go through the tags.
            $repeated_tag_index = array(); //Multiple tags with same name will be turned into an array
            foreach($xml_values as $data) {
                unset($attributes, $value); //Remove existing values, or there will be trouble
                // This command will extract these variables into the foreach scope
                // tag(string), type(string), level(int), attributes(array).
                extract($data); //We could use the array by itself, but this cooler.
                $result = array();
                $attributes_data = array();
                if (isset($value)) {
                    if ($priority == 'tag') $result = $value;
                    else $result['value'] = $value; //Put the value in a assoc array if we are in the 'Attribute' mode
                }
                // Set the attributes too.
                if (isset($attributes) and $get_attributes) {
                    foreach($attributes as $attr => $val) {                                   
                                        if ( $attr == 'ResStatus' ) {
                                            $current[$attr][] = $val;
                                        }
                        if ($priority == 'tag') $attributes_data[$attr] = $val;
                        else $result['attr'][$attr] = $val; //Set all the attributes in a array called 'attr'
                    }
                }
                // See tag status and do the needed.
                            //echo"<br/> Type:".$type;
                if ($type == "open") { //The starting of the tag '<tag>'
                    $parent[$level - 1] = & $current;
                    if (!is_array($current) or (!in_array($tag, array_keys($current)))) { //Insert New tag
                        $current[$tag] = $result;
                        if ($attributes_data) $current[$tag . '_attr'] = $attributes_data;
                                            //print_r($current[$tag . '_attr']);
                        $repeated_tag_index[$tag . '_' . $level] = 1;
                        $current = & $current[$tag];
                    }
                    else { //There was another element with the same tag name
                        if (isset($current[$tag][0])) { //If there is a 0th element it is already an array
                            $current[$tag][$repeated_tag_index[$tag . '_' . $level]] = $result;
                            $repeated_tag_index[$tag . '_' . $level]++;
                        }
                        else { //This section will make the value an array if multiple tags with the same name appear together
                            $current[$tag] = array(
                                $current[$tag],
                                $result
                            ); //This will combine the existing item and the new item together to make an array
                            $repeated_tag_index[$tag . '_' . $level] = 2;
                            if (isset($current[$tag . '_attr'])) { //The attribute of the last(0th) tag must be moved as well
                                $current[$tag]['0_attr'] = $current[$tag . '_attr'];
                                unset($current[$tag . '_attr']);
                            }
                        }
                        $last_item_index = $repeated_tag_index[$tag . '_' . $level] - 1;
                        $current = & $current[$tag][$last_item_index];
                    }
                }
                elseif ($type == "complete") { //Tags that ends in 1 line '<tag />'
                    // See if the key is already taken.
                    if (!isset($current[$tag])) { //New Key
                        $current[$tag] = $result;
                        $repeated_tag_index[$tag . '_' . $level] = 1;
                        if ($priority == 'tag' and $attributes_data) $current[$tag . '_attr'] = $attributes_data;
                    }
                    else { //If taken, put all things inside a list(array)
                        if (isset($current[$tag][0]) and is_array($current[$tag])) { //If it is already an array...
                            // ...push the new element into that array.
                            $current[$tag][$repeated_tag_index[$tag . '_' . $level]] = $result;
                            if ($priority == 'tag' and $get_attributes and $attributes_data) {
                                $current[$tag][$repeated_tag_index[$tag . '_' . $level] . '_attr'] = $attributes_data;
                            }
                            $repeated_tag_index[$tag . '_' . $level]++;
                        }
                        else { //If it is not an array...
                            $current[$tag] = array(
                                $current[$tag],
                                $result
                            ); //...Make it an array using using the existing value and the new value
                            $repeated_tag_index[$tag . '_' . $level] = 1;
                            if ($priority == 'tag' and $get_attributes) {
                                if (isset($current[$tag . '_attr'])) { //The attribute of the last(0th) tag must be moved as well
                                    $current[$tag]['0_attr'] = $current[$tag . '_attr'];
                                    unset($current[$tag . '_attr']);
                                }
                                if ($attributes_data) {
                                    $current[$tag][$repeated_tag_index[$tag . '_' . $level] . '_attr'] = $attributes_data;
                                }
                            }
                            $repeated_tag_index[$tag . '_' . $level]++; //0 and 1 index is already taken
                        }
                    }
                }
                elseif ($type == 'close') { //End of tag '</tag>'
                    $current = & $parent[$level - 1];
                }
            }
            return ($xml_array);
        }
        
        // Let's call the this above function xml2array
        
        xml2array($xmlContent, $get_attributes = 3, $priority = 'tag'); // it will work 100% if not ping me @skype: sapan.mohannty
        
    //  Enjoy coding
    

    【讨论】:

    • 这个真的很有帮助。谢谢:)
    【解决方案9】:

    两行代码 (https://www.php.net/manual/en/book.simplexml.php#113485)

    $xml = new SimpleXMLElement("<your><xml><string>ok</string></xml></your>");
    $array = (array)$xml;
    

    【讨论】:

      【解决方案10】:

      我喜欢这个问题,一些答案对我有帮助,但我需要将 xml 转换为一个支配数组,所以我会发布我的解决方案,也许以后有人需要它:

      <?php
      $xml = json_decode(json_encode((array)simplexml_load_string($xml)),1);
      $finalItem = getChild($xml);
      var_dump($finalItem);
      
      function getChild($xml, $finalItem = []){
          foreach($xml as $key=>$value){
              if(!is_array($value)){
                  $finalItem[$key] = $value;
              }else{
                  $finalItem = getChild($value, $finalItem);
              }
          }
          return $finalItem;
      }
      ?>  
      

      【讨论】:

        猜你喜欢
        • 2017-05-12
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2011-12-25
        • 2015-09-03
        • 2016-10-03
        相关资源
        最近更新 更多