17370845950

新闻动态

< 返回列表当前位置：首页 > 新闻动态 > 技术教程

XML注入攻击怎么防范 XML外部实体（XXE）漏洞原理与防御方法

XXE漏洞本质是XML解析器执行恶意外部实体，防御核心是禁用外部实体并避免解析不可信XML。PHP需调用libxml_disable_entity_loader(TRUE)，Java应设置disallow-doctype-decl为true，Python lxml需设resolve_entities=False；优先改用JSON，必须用XML时须校验Content-Type和结构；升级libxml2≥2.9.1，禁用XSLT等非必要功能；辅以关键词过滤与解析失败日志监控。

XML外部实体（XXE）漏洞本质是解析器“太听话”——它照单全收并执行了用户提交的恶意外部实体引用。防范关键不在堵住所有XML，而在于让解析器**拒绝加载不可信的外部资源**。核心思路就一条：禁用外部实体，同时避免解析不受控的XML输入。

禁用DTD和外部实体加载

这是最直接有效的防御手段。不同语言有对应的安全配置，必须显式启用：

PHP：调用 libxml_disable_entity_loader(TRUE)（注意是TRUE），尤其在使用 simplexml_load_string 或 DOMDocument::loadXML 前；PHP 8.0+ 已默认禁用，但老项目仍需检查
Java：用 DocumentBuilderFactory 时设置 setFeature("http://apache.org/xml/features/disallow-doctype-decl", true)，彻底禁止DOCTYPE声明
Python（lxml）：创建解析器时传入 resolve_entities=False；若用 xml.etree.ElementTree，它本身不支持外部实体，相对安全

避免直接解析用户提交的XML

很多场景其实根本不需要XML格式交互。能换就换，不能换就严控：

优先改用JSON等更轻量、无实体机制的数据格式，从源头规避风险
若必须接收XML，先做白名单校验：检查Content-Type是否为application/xml或text/xml，再验证XML结构是否符合预期（如根节点名、字段范围）
绝不把原始POST体直接喂给解析器，例如 $dom->loadXML(file_get_contents('php://input')) 这类写法必须重构

升级组件与最小化功能启用

旧版本解析器默认开启危险特性，升级是最省心的加固方式：

确保 libxml2 版本 ≥ 2.9.1（PHP环境），该版本起默认禁用外部实体
查看 phpinfo() 或运行 php -i | grep libxml 确认实际版本
禁用不必要的XML功能，比如不用XSLT就别加载ext/xsl，减少攻击面

服务端过滤与日志监控（辅助手段）

作为纵深防御补充，不是主要依赖：

对输入内容做关键词过滤（如 SYSTEM、ENTITY、file://、http://），但易被编码绕过，仅作兜底
记录所有XML解析失败日志，特别关注含DOCTYPE或ENTITY关键字的请求，便于发现扫描行为
内网服务禁止响应外部实体请求（如禁用expect头、限制php://filter等伪协议）

基本上就这些。不复杂但容易忽略——真正出问题的，往往是那个没加libxml_disable_entity_loader(TRUE)的PHP脚本，或者那台还在跑libxml 2.7.8的老服务器。

赣ICP备2024031479号