什么是XXE漏洞？（原理+实战+防御）

张

张建站

2026/4/10 23:22:39

10分钟阅读

什么是XXE简单来说XXE漏洞是攻击者利用Web应用程序对XML数据的解析缺陷通过构造恶意的XML数据让服务器执行非预期的操作。这些操作可能包括读取服务器上的敏感文件如配置文件、密码文件。探测内网端口和服务。发起拒绝服务攻击DoS。前置知识XML与“实体”要理解XXE我们需要先了解两个概念XML和实体。. XML是什么XML可扩展标记语言是一种用来存储和传输数据的格式类似于JSON。比如一个正常的用户登录请求可能是这样的xml编辑?xml version1.0 encodingUTF-8? user usernameadmin/username password123456/password /user. 什么是“实体”在XML的设计规范DTD中允许定义“实体”。你可以把它理解为变量或占位符。比如我们可以定义一个内部实体xml编辑!DOCTYPE note [ !ENTITY company MySecureCorp ] note messageWelcome to company;/message /note当解析器读到 company; 时它会自动替换成 MySecureCorp。这本身是个很方便的功能。漏洞原理当“实体”指向了外部文件问题的关键在于XML不仅允许定义内部实体还允许定义外部实体。也就是说这个“变量”的值可以来自一个文件或者一个网址。如果服务器端的XML解析器没有禁用外部实体加载功能攻击者就可以构造如下恶意代码xml编辑?xml version1.0 encodingUTF-8? !DOCTYPE data [ !-- 定义一个外部实体名字叫 xxe指向本地文件 -- !ENTITY xxe SYSTEM file:///etc/passwd ] root !-- 引用这个实体 -- usernamexxe;/username /root发生了什么攻击者发送了这段XML。服务器解析器读到 !ENTITY xxe SYSTEM ...它很“听话”地去读取了服务器本地的 /etc/passwd 文件。解析器读到 usernamexxe;/username它把 xxe; 替换成了刚才读到的文件内容。最终服务器把包含敏感文件内容的响应返回给了攻击者。 XXE能造成什么危害重点XXE不仅仅是读个文件那么简单它的危害主要体现在以下几个方面读取敏感文件这是最常见的利用方式。攻击者可以读取 /etc/passwd、C:\Windows\win.ini、数据库配置文件、源代码等。探测内网SSRF攻击者可以将实体指向内网地址如 http://192.168.1.1:8080利用服务器作为跳板去扫描内网端口。拒绝服务攻击通过构造“实体爆炸”Billion Laughs Attack让解析器陷入无限递归耗尽服务器内存导致服务瘫痪。远程代码执行在某些特定环境下甚至可以控制服务器。实战常见的XXE Payload如果你在渗透测试中遇到了XML接口可以尝试以下几种Payload来检测漏洞1. 基础文件读取Linuxxml编辑?xml version1.0? !DOCTYPE foo [ !ENTITY xxe SYSTEM file:///etc/passwd] fooxxe;/foo2.基础文件读取Windowsxml编辑?xml version1.0? !DOCTYPE foo [ !ENTITY xxe SYSTEM file:///c:/windows/win.ini] fooxxe;/foo3. 探测内网端口SSRFxml编辑?xml version1.0? !DOCTYPE foo [ !ENTITY xxe SYSTEM http://127.0.0.1:8080] fooxxe;/foo️ 如何防御对于开发者来说防御XXE其实非常简单核心原则就是不要相信用户的输入并禁用不需要的功能。核心防御方案在代码中配置XML解析器禁用外部实体加载。Java (DOM解析器):java编辑DocumentBuilderFactory dbf DocumentBuilderFactory.newInstance(); dbf.setFeature(http://apache.org/xml/features/disallow-doctype-decl, true);PHP:php编辑libxml_disable_entity_loader(true);Python (lxml):python编辑parser etree.XMLParser(resolve_entitiesFalse) 总结XXE漏洞虽然听起来专业但本质上是利用了XML解析器的“过度信任”。作为安全从业者我们在测试时要多留意 Content-Type: application/xml 的请求作为开发者务必在初始化解析器时关闭外部实体功能从根源上堵住漏洞。

JSON Forms核心原理深度解析：如何实现JSON Schema到UI的智能转换

JSON Forms核心原理深度解析：如何实现JSON Schema到UI的智能转换【免费下载链接】jsonforms Customizable JSON Schema-based forms with React, Angular and Vue support out of the box. 项目地址: https://gitcode.com/gh_mirrors/js/jsonforms JSON For…...

2026/4/10 23:22:21 阅读更多 →

终极指南：3分钟免费获取Android Studio中文界面，开发效率提升50%

终极指南：3分钟免费获取Android Studio中文界面，开发效率提升50% 【免费下载链接】AndroidStudioChineseLanguagePack AndroidStudio中文插件(官方修改版本） 项目地址: https://gitcode.com/gh_mirrors/an/AndroidStudioChineseLanguagePac…...

2026/4/10 23:22:19 阅读更多 →

保姆级教程：用MQTT.fx 1.7.1连接华为云IoT，从创建产品到收发消息一条龙搞定

从零构建华为云IoT全链路：MQTT.fx实战指南与深度优化物联网开发正逐渐成为企业数字化转型的核心能力，而华为云IoT平台作为国内领先的物联网解决方案，为开发者提供了稳定可靠的设备连接与管理服务。本文将彻底解析如何通过MQTT.fx工具实现设备…...

2026/4/10 23:17:28 阅读更多 →

ESP32硬件PWM控制库PWMOutESP32实战指南

1. PWMOutESP32 库深度解析：面向嵌入式工程师的 ESP32 PWM 控制实践指南 1.1 库定位与工程价值 PWMOutESP32 是一个专为 ESP32 系列微控制器设计的轻量级 PWM 输出控制库，其核心目标是提供 Arduino 风格的 pwm.analogWrite(pin, value) 接口&#xff…...

2026/4/10 2:36:05 阅读更多 →

AVR长周期看门狗库：突破8秒限制实现毫秒级精准复位与睡眠唤醒

1. LongerWatchDog 库概述：突破AVR看门狗定时器的固有约束在嵌入式系统开发中，看门狗定时器（Watchdog Timer, WDT）是保障系统可靠性的关键机制。传统Arduino平台（尤其是基于ATmega328P、ATmega2560等AVR架构的板卡&…...

2026/4/9 14:50:52 阅读更多 →

LeetCode 92. Reverse Linked List II 题解

LeetCode 92. Reverse Linked List II 题解题目描述给你单链表的头指针 head 和两个整数 left 和 right ，其中 left < right 。请你反转从位置 left 到位置 right 的链表节点，返回反转后的链表。示例 1： 输入：head [1,2,…...

2026/4/9 8:37:26 阅读更多 →