公开文集
0x01 SRC 资产管理系统
0x02 Web 漏洞案例库
0x03 小程序漏洞案例库
第一章:小程序渗透基础
1.1 微信小程序反编译与动态调试
1.2 微信小程序强制开启开发者模式
0x99 信息安全学习体系
01-网络安全基础
Day-001-TCP-IP协议栈安全分析
Day-002-DNS协议安全与DNS劫持攻防
Day-003-IPv6 安全基础与过渡
Day-004-HTTP-HTTPS协议深度解析
Day-005-网络嗅探与流量分析技术
Day-006-防火墙原理与配置实践
Day-007-网络地址转换 NAT 安全分析
Day-008-路由协议安全 RIP-OSPF-BGP
Day-009-VLAN 安全与 VLAN-Hopping
Day-010-无线网络基础与安全 802.11
Day-011-网络访问控制 802.1X-NAC
Day-012-网络分段与微隔离设计
Day-013-负载均衡器安全配置
Day-014-CDN安全与防护
Day-015-NTP安全
Day-016-DHCP安全与攻击防护
Day-017-ICMP协议安全分析
Day-018-网络协议模糊测试基础
Day-019-网络流量基线建立
Day-020-网络取证基础
Day-021-网络入侵检测系统 NIDS
Day-022-网络入侵防御系统 NIPS
Day-023-网络流量加密与解密
Day-024-网络协议逆向工程基础
Day-025-网络性能与安全权衡
Day-026-SDN 安全
Day-027-网络虚拟化安全
Day-028-网络欺骗技术
Day-029-网络威胁情报应用
Day-030-网络容量规划与安全
Day-031-网络安全架构设计实战
02-Web 安全
Day-032-OWASP-Top-10-2021详解
Day-033-SQL 注入原理与手工检测
Day-034-SQL注入进阶报错注入与盲注
Day-035-XSS跨站脚本攻击基础
Day-036-XSS 进阶绕过与利用
Day-037-XSS进阶绕过与利用
Day-038-CSRF 跨站请求伪造
Day-039-文件上传漏洞
Day-040-反序列化漏洞基础
Day-041-PHP反序列化深入
Day-042-Java反序列化深入
Day-043-SSTI 服务端模板注入
Day-044-文件包含漏洞 LFI-RFI
Day-045-命令注入漏洞
Day-046-XXE-XML 外部实体注入
Day-047-反序列化漏洞进阶
Day-048-API 安全基础
Day-049-API认证与授权安全
Day-050-API漏洞挖掘实战
Day-051-文件上传漏洞进阶
Day-052-反序列化漏洞实战
Day-053-Web 安全综合实战
Day-054-移动安全基础
Day-055-Android 应用安全测试
Day-056-iOS 应用安全测试
Day-057-移动应用综合实战
Day-058-云安全基础
Day-059-AWS 安全实战
Day-060-Azure 安全实战
Day-061-GCP 安全实战
Day-062-云安全综合实战
Day-063-容器安全基础
Day-064-Docker 安全实战
Day-065-Kubernetes 安全实战
Day-066-容器安全综合实战
Day-067-API 安全进阶
Day-068-服务端请求伪造 SSRF 深入
Day-069-文件上传漏洞进阶
Day-070-反序列化漏洞实战进阶
Day-071-业务逻辑漏洞深入
Day-072-前端安全深入
Day-073-Web 安全综合实战
Day-074-云安全进阶
Day-075-移动安全进阶
Day-076-API 安全进阶
Day-077-前端安全进阶
Day-078-业务逻辑漏洞进阶
Day-079-反序列化漏洞实战进阶
Day-080-文件上传漏洞实战进阶
Day-081-SSTI 服务端模板注入进阶
Day-082-XXE-XML 外部实体注入进阶
Day-083-SSRF 服务端请求伪造进阶
Day-084-命令注入漏洞进阶
Day-085-文件包含漏洞进阶
Day-086-反序列化漏洞实战进阶
Day-087-文件上传漏洞实战进阶
Day-088-SSTI 服务端模板注入实战进阶
Day-089-XXE-XML 外部实体注入实战进阶
Day-090-SSRF 服务端请求伪造实战进阶
Day-091-命令注入漏洞实战进阶
Day-092-Web 安全综合实战
Day-093-GraphQL 安全
Day-094-JWT 与 OAuth2 安全
03-系统安全
Day-095-系统监控与检测
Day-096-主机防火墙配置
Day-097-系统审计与合规
Day-098-Linux 系统安全进阶
Day-099-Windows 系统安全进阶
Day-100-容器安全进阶
Day-101-容器编排安全进阶
Day-102-Linux 内核安全
Day-103-Windows 内核安全
Day-104-系统安全总结与实战
Day-105-Linux 系统安全基础
Day-106-Windows 系统安全基础
Day-107-容器安全基础
Day-108-系统加固技术
Day-109-日志分析技术
Day-110-威胁狩猎技术
04-应用安全
Day-111-安全编码规范
Day-112-输入验证技术
Day-113-输出编码技术
Day-114-错误处理安全
Day-115-会话管理安全
Day-116-认证安全
Day-117-授权安全
Day-118-数据保护安全
Day-119-日志安全
Day-120-API 安全
Day-121-微服务安全
Day-122-新兴技术安全概论
Day-123-DevSecOps 流水线安全
Day-124-云原生安全架构
Day-125-API 安全最佳实践
Day-126-安全编码规范
Day-127-SDL 安全开发生命周期
Day-128-威胁建模实战
Day-129-安全需求分析
Day-130-安全架构设计
Day-131-安全编码实践Java
Day-132-安全编码实践Python
Day-133-代码审计方法论
Day-134-静态代码分析SAST
Day-135-动态应用测试DAST
Day-136-交互式测试IAST
Day-137-软件成分分析SCA
Day-138-依赖漏洞管理
Day-139-安全测试自动化
Day-140-漏洞管理与响应
Day-141-应用安全总结与展望
Day-142-OWASP-Top10-2024 详解
Day-143-CWE-Top25 分析
Day-144-漏洞挖掘方法论
Day-145-模糊测试技术
Day-146-逆向工程基础
Day-147-漏洞利用开发基础
Day-148-漏洞复现与验证
Day-149-漏洞披露流程
Day-150-CVE 申请与管理
Day-151-漏洞赏金计划
Day-152-等保2.0详解
Day-153-GDPR 合规实践
Day-154-数据安全法解读
Day-155-个人信息保护法与合规指南
Day-156-个人信息保护法解读
Day-157-ISO-27001 信息安全管理体系
Day-158-SOC-2 合规与审计
Day-159-PCI-DSS 支付卡行业数据安全标准
Day-160-网络安全审查办法解读
Day-161-数据出境安全评估办法
Day-162-应用安全评估实战
Day-163-红蓝对抗演练
Day-164-安全应急响应
Day-165-安全运营中心建设
Day-166-应用安全总结与展望
05-密码学
Day-167-密码学基础
Day-168-对称加密算法详解
Day-169-非对称加密算法详解
Day-170-哈希函数与数字签名
Day-171-密钥管理与PKI
Day-172-TLS-SSL 协议详解
Day-173-国密算法详解
Day-174-认证与密钥协议
Day-175-随机数生成与熵源
Day-176-椭圆曲线密码学详解
Day-177-后量子密码学详解
Day-178-高级密码学主题
Day-179-密码学行业应用精选
Day-180-常用加密算法原理与实现
Day-181-密码学总结与展望
Day-182-密码学系列总结与展望
06-渗透测试
Day-183-渗透测试方法论
Day-184-信息收集技术详解
Day-185-漏洞扫描技术详解
Day-186-漏洞利用技术详解
Day-187-渗透测试中的漏洞利用框架
Day-188-漏洞利用框架与 Metasploit 深入
Day-189-渗透测试中的 WAF 绕过技术
Day-190-渗透测试中的模糊测试技术
Day-191-渗透测试中的代码审计与静态分析
Day-192-渗透测试中的密码哈希破解技术
Day-193-渗透测试报告编写指南
Day-194-Web 应用渗透测试
Day-195-渗透测试中的 API 安全测试
Day-196-渗透测试中的 GraphQL 安全测试
Day-197-渗透测试中的前后端分离应用测试
Day-198-渗透测试中的小程序安全测试
Day-199-渗透测试中的浏览器安全测试
Day-200-OAuth-SSO安全测试
Day-201-渗透测试中的业务逻辑漏洞测试
Day-202-渗透测试中的厚客户端安全测试
Day-203-渗透测试综合实战演练
Day-204-内网渗透技术详解
Day-205-渗透测试中的内网信息收集进阶
Day-206-渗透测试中的域森林渗透技术
Day-207-渗透测试中的权限维持技术
Day-208-渗透测试中的横向移动技术
Day-209-渗透测试中的痕迹清理与反取证技术
Day-210-渗透测试中的数据窃取与 Exfiltration 技术
Day-211-渗透测试中的内部威胁与数据泄露测试
Day-212-渗透测试中的物理安全渗透
Day-213-社会工程学攻击技术
Day-214-移动应用渗透测试
Day-215-云安全渗透测试
Day-216-渗透测试中的容器与 Kubernetes 安全渗透
Day-217-渗透测试中的 Serverless 安全测试
Day-218-渗透测试中的微服务安全测试
Day-219-物联网安全渗透测试
Day-220-工业控制系统安全渗透测试
Day-221-无线网络安全渗透测试
Day-222-数据库安全渗透测试
Day-223-渗透测试中的供应链安全测试
Day-224-红队演练技术详解
Day-225-渗透测试中的红队基础设施搭建
Day-226-渗透测试中的威胁情报与狩猎
Day-227-渗透测试中的综合指纹识别技术
Day-228-自动化渗透测试技术
Day-229-渗透测试中的运维安全测试
Day-230-渗透测试中的区块链与智能合约安全测试
Day-231-渗透测试中的漏洞管理与修复验证
Day-232-渗透测试法律与合规
Day-233-后渗透攻击技术详解
Day-234-渗透测试中的人工智能应用
Day-235-漏洞利用开发深入
Day-236-云原生渗透测试深入
07-应急响应
Day-237-应急响应概述与核心概念
Day-238-应急响应流程框架
Day-239-CSIRT 团队组建与职责分工
Day-240-应急响应工具包准备
Day-241-应急响应法律与合规要求
Day-242-安全事件检测方法与指标
Day-243-云原生应急响应
Day-244-日志收集与分析技术
Day-245-网络流量分析与异常识别
Day-246-自动化响应与 SOAR
Day-247-端点监控与 EDR 技术
Day-248-威胁狩猎方法论
Day-249-威胁情报在检测中的应用
Day-250-数字取证基础与证据链管理
Day-251-内存取证技术
Day-252-磁盘取证与文件恢复
Day-253-网络取证与数据包分析
Day-254-云环境与容器取证
Day-255-恶意代码静态分析技术
Day-256-恶意代码动态分析技术
Day-257-恶意代码行为分析方法
Day-258-逆向工程基础与工具
Day-259-沙箱技术与自动化分析
Day-260-事件隔离与遏制策略
Day-261-威胁根除与系统修复
Day-262-系统恢复与数据重建
Day-263-业务连续性计划
Day-264-事件复盘与经验总结
Day-265-APT 攻击事件复盘分析
Day-266-勒索软件事件响应实战
Day-267-数据泄露事件处置流程
Day-268-内部威胁调查与取证
Day-269-综合应急响应演练
08-安全运维
Day-270-安全运营中心 SOC 概述
Day-271-安全监控指标体系
Day-272-安全告警管理
Day-273-安全可视化与仪表盘
Day-274-监控工具选型
Day-275-日志采集技术
Day-276-日志标准化与解析
Day-277-日志存储与归档
Day-278-日志分析技术
Day-279-日志合规要求
Day-280-SIEM 架构与设计
Day-281-关联规则引擎
Day-282-高级关联分析
Day-283-UEBA 用户实体行为分析
Day-284-威胁狩猎
Day-285-SOAR 基础概念
Day-286-剧本设计
Day-287-自动化响应技术
Day-288-安全工具集成
Day-289-SOAR 度量与优化
Day-290-安全基线管理
Day-291-漏洞管理流程
Day-292-补丁管理策略
Day-293-变更安全管理
Day-294-合规审计技术
Day-295-7x24 安全运营
Day-296-安全事件管理流程
Day-297-安全运营度量体系
Day-298-持续改进机制
Day-299-安全运维综合演练
Day-300-云原生安全运营
Day-301-AI 与机器学习安全运营
Day-302-安全自动化脚本实战
09-移动安全
Day-303-移动安全威胁概述
Day-304-移动设备安全架构
Day-305-移动操作系统安全模型
Day-306-移动应用权限管理
Day-307-移动端数据加密
Day-308-330-Android 安全合集
Day-309-Android 安全架构
Day-310-Android 组件安全
Day-311-Android 权限与隐私
Day-312-Android 逆向工程
Day-313-Android 应用加固
Day-314-iOS 安全架构
Day-315-iOS 应用沙盒机制
Day-316-越狱与反越狱
Day-317-iOS 逆向工程
Day-318-iOS 企业分发安全
Day-319-移动安全开发生命周期
Day-320-移动应用安全测试
Day-321-移动应用加固技术
Day-322-移动威胁防护
Day-323-移动安全合规
10-云安全
Day-324-云计算安全模型
Day-325-责任共担模型
Day-326-云安全威胁模型
Day-327-云安全合规框架
Day-328-云安全架构设计
Day-329-AWS IAM 安全
Day-330-AWS 网络安全
Day-331-AWS 存储安全
Day-332-AWS 安全监控
Day-333-AWS 安全最佳实践
Day-334-Azure AD 安全
Day-335-Azure 网络安全
Day-336-Azure 存储安全
Day-337-Azure 安全中心
Day-338-Azure 安全最佳实践
Day-339-容器安全基础
Day-340-Kubernetes 安全
Day-341-Serverless 安全
Day-342-云原生 DevSecOps
Day-343-云安全态势管理 CSPM
11-物联网工控
Day-344-物联网安全概述
Day-345-IoT 通信协议安全
Day-346-IoT 设备安全
Day-347-IoT 平台安全
Day-348-IoT 应用安全
Day-349-工业控制系统概述
Day-350-工控协议安全
Day-351-PLC 安全
Day-352-SCADA 系统安全
Day-353-工控安全防护
12-综合与总结
Day-354-安全职业发展路径
Day-355-安全技术趋势展望
Day-356-安全建设方法论
Day-357-经典攻防案例复盘
Day-358-安全学习资源指南
Day-359-信息安全行业求职指南
-
+
首页
Day-134-静态代码分析SAST
# Day 148: 静态代码分析 SAST > 应用安全系列第 41 天 | 预计阅读时间:50 分钟 | 难度:★★★★☆ --- **PUA v3 · Sprint 启动** ``` ┌─────────┬────────────────────────────────────┐ │ 清单 任务 │ 静态代码分析 SAST - Day 148 │ ├─────────┼────────────────────────────────────┤ │ 味道 │ 阿里味(自动:安全任务) │ ├─────────┼────────────────────────────────────┤ │ 压力 │ L0 · 信任期 │ └─────────┴────────────────────────────────────┘ ``` ▎ SAST 不是装工具就完事,是建体系。体系不建立,扫描就是形式的。今天深入静态代码分析 SAST。 --- ## 清单 目录 1. [SAST 概述](#sast 概述) 2. [SAST 工作原理](#sast 工作原理) 3. [SAST 工具对比](#sast 工具对比) 4. [规则引擎设计](#规则引擎设计) 5. [误报处理](#误报处理) 6. [CI/CD 集成](#cicd 集成) 7. [结果分析与修复](#结果分析与修复) 8. [企业级部署](#企业级部署) 9. [实战配置演练](#实战配置演练) 10. [总结与思考](#总结与思考) 11. [参考资料](#参考资料) --- ## SAST 概述 ### 什么是 SAST > ▎ SAST 不是找 bug,是找安全漏洞。漏洞不找出来,上线就是给别人送钱。 **定义与特点**: ``` SAST (Static Application Security Testing) 是在不执行代码的情况下,对源代码进行安全分析的技术。 核心特点: 1. 白盒测试 - 访问源代码 - 分析数据流 - 发现深层问题 2. 早期发现 - 开发阶段发现 - 修复成本低 - 安全左移 3. 全面覆盖 - 所有代码路径 - 所有输入点 - 所有汇聚点 ``` **SAST 价值**: ``` SAST 投资回报: 发现阶段 修复成本 相对成本 ───────────────────────────────── 开发阶段 $100 1x 测试阶段 $1,000 10x 生产阶段 $10,000 100x SAST 收益: - 漏洞发现提前 80% - 修复成本降低 90% - 安全审查时间减少 60% ``` ### SAST 适用场景 **适用场景**: ``` + 适合使用 SAST: - 新代码开发 - 代码重构 - 第三方代码集成 - 合规要求 - 安全基线建立 - 不适合仅用 SAST: - 运行时问题 - 配置问题 - 业务逻辑漏洞 - 认证绕过 (部分) - 需要 DAST 补充 ``` --- ## SAST 工作原理 ### 分析流程 > ▎ SAST 不是简单匹配,是深度分析。分析不深度,漏洞就是表面的。 **SAST 分析流程**: ```python # SAST 引擎工作流程 class SASTEngine: """SAST 分析引擎""" def analyze(self, codebase): """执行 SAST 分析""" # 1. 代码解析 ast = self.parse_code(codebase) # 2. 控制流分析 cfg = self.build_cfg(ast) # 3. 数据流分析 dfg = self.build_dfg(cfg) # 4. 污点分析 taint_results = self.taint_analysis(dfg) # 5. 模式匹配 pattern_results = self.pattern_matching(ast) # 6. 语义分析 semantic_results = self.semantic_analysis(ast, cfg) # 7. 结果汇总 issues = self.aggregate_results( taint_results, pattern_results, semantic_results ) # 8. 误报过滤 filtered_issues = self.filter_false_positives(issues) return filtered_issues def parse_code(self, codebase): """代码解析 - 生成 AST""" # 词法分析 → 语法分析 → AST ast = {} for file in codebase: ast[file] = self.generate_ast(file) return ast def build_cfg(self, ast): """构建控制流图""" cfg = {} for file, tree in ast.items(): cfg[file] = self.generate_cfg(tree) return cfg def build_dfg(self, cfg): """构建数据流图""" dfg = {} for file, graph in cfg.items(): dfg[file] = self.generate_dfg(graph) return dfg def taint_analysis(self, dfg): """污点分析""" results = [] # 定义污点源 sources = self.define_sources() # 定义污点汇聚 sinks = self.define_sinks() # 定义清理函数 sanitizers = self.define_sanitizers() # 追踪污点流 for file, graph in dfg.items(): paths = self.find_taint_paths(graph, sources, sinks, sanitizers) results.extend(paths) return results def pattern_matching(self, ast): """模式匹配""" results = [] # 预定义漏洞模式 patterns = self.load_vulnerability_patterns() for file, tree in ast.items(): for pattern in patterns: matches = self.search_pattern(tree, pattern) results.extend(matches) return results def filter_false_positives(self, issues): """误报过滤""" filtered = [] for issue in issues: # 应用误报过滤规则 if not self.is_false_positive(issue): filtered.append(issue) return filtered ``` ### 分析技术 **核心技术**: ``` 1. 词法分析 (Lexical Analysis) ├── 源代码 → Token 流 ├── 识别关键字 └── 识别标识符 2. 语法分析 (Syntax Analysis) ├── Token 流 → AST ├── 构建语法树 └── 验证语法正确性 3. 控制流分析 (Control Flow Analysis) ├── 构建 CFG ├── 识别执行路径 └── 识别循环/分支 4. 数据流分析 (Data Flow Analysis) ├── 追踪变量定义和使用 ├── 构建数据流图 └── 识别数据依赖 5. 污点分析 (Taint Analysis) ├── 识别污点源 ├── 追踪污点传播 └── 识别污点汇聚 ``` --- ## SAST 工具对比 ### 主流工具 > ▎ 工具不是选最贵,是选最合适。工具不合适,效果就是打折的。 **工具对比表**: ``` ┌─────────────────┬──────────────┬──────────────┬──────────────┬──────────────┐ │ 工具 │ 支持语言 │ 检测能力 │ 误报率 │ 成本 │ ├─────────────────┼──────────────┼──────────────┼──────────────┼──────────────┤ │ Bandit │ Python │ 中 │ 中 │ 免费 │ ├─────────────────┼──────────────┼──────────────┼──────────────┼──────────────┤ │ Semgrep │ 多语言 │ 高 │ 低 │ 免费/商业 │ ├─────────────────┼──────────────┼──────────────┼──────────────┼──────────────┤ │ SonarQube │ 多语言 │ 高 │ 中 │ 免费/商业 │ ├─────────────────┼──────────────┼──────────────┼──────────────┼──────────────┤ │ CodeQL │ 多语言 │ 很高 │ 低 │ 免费 │ ├─────────────────┼──────────────┼──────────────┼──────────────┼──────────────┤ │ Fortify │ 多语言 │ 很高 │ 中 │ 商业 │ ├─────────────────┼──────────────┼──────────────┼──────────────┼──────────────┤ │ Checkmarx │ 多语言 │ 很高 │ 中 │ 商业 │ └─────────────────┴──────────────┴──────────────┴──────────────┴──────────────┘ ``` ### Bandit 使用 ```python # Bandit 配置和使用 """ # 安装 pip install bandit # 基本使用 bandit -r ./src # JSON 输出 bandit -r ./src -f json -o report.json # 排除目录 bandit -r ./src --exclude-dir tests,venv # 跳过特定检查 bandit -r ./src --skip B101,B306 # 配置文件 (.bandit) [bandit] targets = src exclude_dirs = tests,venv skips = B101,B306 aggregate = vuln # CI/CD 集成 # .gitlab-ci.yml bandit_scan: stage: test script: - pip install bandit - bandit -r ./src -f json -o bandit-report.json - bandit -r ./src --exit-zero # 不阻断 pipeline artifacts: reports: security: bandit-report.json """ # Bandit 规则示例 """ # B101: assert 使用 # 问题:assert 在优化模式下被移除 assert user.is_admin # 不安全 # B306: mktemp 使用 # 问题:mktemp 有不安全竞态条件 temp = tempfile.mktemp() # 不安全 temp = tempfile.mkstemp() # 安全 # B608: SQL 注入 # 问题:字符串拼接 SQL cursor.execute("SELECT * FROM users WHERE id = %s" % user_id) # 不安全 cursor.execute("SELECT * FROM users WHERE id = %s", (user_id,)) # 安全 # B609: shell=True # 问题:命令注入风险 subprocess.run(cmd, shell=True) # 不安全 subprocess.run([cmd, arg1, arg2]) # 安全 """ ``` ### Semgrep 使用 ```python # Semgrep 规则编写 """ # 规则文件:sql-injection.yml rules: - id: python-sql-injection patterns: - pattern: | $CURSOR.execute("...$VAR...") - metavariable-pattern: metavariable: $VAR pattern: | % ... message: "Possible SQL injection via string formatting" languages: [python] severity: ERROR metadata: cwe: "CWE-89: SQL Injection" owasp: "A03:2021-Injection" # 使用 f-string 的 SQL 注入 - id: python-sql-injection-fstring patterns: - pattern: | $CURSOR.execute(f"...{$VAR}...") message: "SQL injection via f-string" languages: [python] severity: ERROR # 使用 format 的 SQL 注入 - id: python-sql-injection-format patterns: - pattern: | $CURSOR.execute("...{}".format($VAR)) message: "SQL injection via format()" languages: [python] severity: ERROR # 命令注入 - id: python-command-injection patterns: - pattern: | subprocess.$FUNC($CMD, shell=True) - metavariable: $CMD pattern-not: | "..." message: "Command injection risk with shell=True" languages: [python] severity: ERROR # XSS - id: python-xss patterns: - pattern: | return $FUNC(request.$ATTR[$KEY]) - metavariable: $FUNC pattern-not: | escape pattern-not: | Markup.escape message: "Possible XSS - user input returned without escaping" languages: [python] severity: WARNING """ # Semgrep 使用命令 """ # 运行官方规则 semgrep --config auto ./src # 运行自定义规则 semgrep --config ./rules/ ./src # 运行特定规则 semgrep --config ./rules/sql-injection.yml ./src # JSON 输出 semgrep --config auto --json ./src -o semgrep-report.json # 忽略特定规则 semgrep --config auto --exclude-rule python-sql-injection ./src # 严格模式 (有高危问题就失败) semgrep --config auto --error ./src """ ``` ### SonarQube 使用 ```yaml # SonarQube 配置 """ # docker-compose.yml version: '3' services: sonarqube: image: sonarqube:lts ports: - "9000:9000" environment: - SONAR_ES_BOOTSTRAP_CHECKS_DISABLE=true volumes: - sonarqube_data:/opt/sonarqube/data - sonarqube_extensions:/opt/sonarqube/extensions - sonarqube_logs:/opt/sonarqube/logs volumes: sonarqube_data: sonarqube_extensions: sonarqube_logs: # sonar-project.properties sonar.projectKey=myproject sonar.projectName=My Project sonar.projectVersion=1.0 sonar.sources=src sonar.tests=tests sonar.exclusions=**/tests/**,**/venv/** sonar.python.coverage.reportPaths=coverage.xml sonar.python.xunit.reportPath=test-results.xml # 质量门配置 sonar.qualitygate.wait=true sonar.qualitygate.timeout=300 # GitHub Actions 集成 # .github/workflows/sonarqube.yml name: SonarQube Scan on: pull_request: branches: [main] jobs: sonarqube: runs-on: ubuntu-latest steps: - uses: actions/checkout@v3 with: fetch-depth: 0 - name: SonarQube Scan uses: sonarsource/sonarqube-scan-action@master env: SONAR_TOKEN: ${{ secrets.SONAR_TOKEN }} SONAR_HOST_URL: ${{ secrets.SONAR_HOST_URL }} """ ``` --- ## 规则引擎设计 ### 自定义规则 > ▎ 规则不是越多越好,是越准越好。规则不准,误报就是灾难的。 **规则设计原则**: ```python # 规则设计原则 class RuleDesignPrinciples: """ 规则设计原则: 1. 精确性 - 匹配具体模式 - 避免过度匹配 - 减少误报 2. 完整性 - 覆盖常见漏洞 - 考虑变体形式 - 持续更新 3. 可维护性 - 规则清晰 - 文档完善 - 易于测试 4. 性能 - 避免复杂正则 - 增量分析 - 缓存结果 """ # 规则模板 rule_template = { 'id': 'unique-rule-id', 'name': 'Rule Name', 'description': 'Clear description of what the rule detects', 'severity': 'ERROR|WARNING|INFO', 'languages': ['python'], 'patterns': [], 'message': 'Clear message explaining the issue', 'fix': 'Suggested fix', 'references': ['CWE-XXX', 'OWASP'] } # Semgrep 规则示例 sql_injection_rules = """ rules: # 规则 1: 基本 SQL 注入 - id: sql-injection-basic patterns: - pattern: | $CURSOR.execute($SQL) - metavariable-pattern: metavariable: $SQL patterns: - pattern-not: '"..."' - pattern-not: "'...'" - pattern: | % ... message: "SQL injection risk: user input in SQL query" languages: [python] severity: ERROR # 规则 2: f-string SQL 注入 - id: sql-injection-fstring patterns: - pattern: | $CURSOR.execute(f$SQL) message: "SQL injection risk: f-string in SQL query" languages: [python] severity: ERROR # 规则 3: format() SQL 注入 - id: sql-injection-format patterns: - pattern: | $CURSOR.execute($SQL.format(...)) message: "SQL injection risk: format() in SQL query" languages: [python] severity: ERROR # 规则 4: 字符串拼接 SQL 注入 - id: sql-injection-concat patterns: - pattern: | $CURSOR.execute($A + $B) message: "SQL injection risk: string concatenation in SQL" languages: [python] severity: ERROR """ # 规则测试 """ # 测试文件:test-sql-injection.py # 应该匹配 (有问题) cursor.execute("SELECT * FROM users WHERE id = %s" % user_id) # Match cursor.execute(f"SELECT * FROM users WHERE id = {user_id}") # Match cursor.execute("SELECT * FROM users WHERE id = {}".format(user_id)) # Match cursor.execute("SELECT * FROM users WHERE id = " + user_id) # Match # 不应该匹配 (安全) cursor.execute("SELECT * FROM users WHERE id = %s", (user_id,)) # No match cursor.execute("SELECT * FROM users WHERE id = 1") # No match db.execute("SELECT * FROM users") # No match (different cursor) """ ``` ### 规则库管理 ```python # 规则库管理 import yaml from pathlib import Path from typing import List, Dict class RuleLibrary: """规则库管理""" def __init__(self, rules_dir: str): self.rules_dir = Path(rules_dir) self.rules = [] self.load_rules() def load_rules(self): """加载规则""" for rule_file in self.rules_dir.glob('*.yml'): with open(rule_file) as f: rule_data = yaml.safe_load(f) if 'rules' in rule_data: self.rules.extend(rule_data['rules']) def get_rules_by_severity(self, severity: str) -> List[Dict]: """按严重程度获取规则""" return [r for r in self.rules if r.get('severity') == severity] def get_rules_by_cwe(self, cwe_id: str) -> List[Dict]: """按 CWE 获取规则""" return [ r for r in self.rules if cwe_id in r.get('metadata', {}).get('cwe', '') ] def get_rules_by_owasp(self, owasp_id: str) -> List[Dict]: """按 OWASP 获取规则""" return [ r for r in self.rules if owasp_id in r.get('metadata', {}).get('owasp', '') ] def add_rule(self, rule: Dict): """添加规则""" # 验证规则 self.validate_rule(rule) # 添加到规则库 self.rules.append(rule) # 保存到文件 self.save_rule(rule) def validate_rule(self, rule: Dict): """验证规则""" required_fields = ['id', 'patterns', 'message', 'languages'] for field in required_fields: if field not in rule: raise ValueError(f"Rule missing required field: {field}") # 检查 ID 唯一性 if any(r['id'] == rule['id'] for r in self.rules): raise ValueError(f"Rule ID already exists: {rule['id']}") def save_rule(self, rule: Dict): """保存规则到文件""" category = self.infer_category(rule) rule_file = self.rules_dir / f'{category}.yml' # 加载现有规则 rules_data = {'rules': []} if rule_file.exists(): with open(rule_file) as f: rules_data = yaml.safe_load(f) # 添加新规则 rules_data['rules'].append(rule) # 保存 with open(rule_file, 'w') as f: yaml.dump(rules_data, f, default_flow_style=False) def infer_category(self, rule: Dict) -> str: """推断规则类别""" rule_id = rule.get('id', '') if 'sql' in rule_id.lower(): return 'sql-injection' elif 'xss' in rule_id.lower(): return 'xss' elif 'command' in rule_id.lower(): return 'command-injection' elif 'path' in rule_id.lower(): return 'path-traversal' else: return 'general' def export_rules(self, format: str = 'semgrep') -> str: """导出规则""" if format == 'semgrep': return yaml.dump({'rules': self.rules}, default_flow_style=False) elif format == 'sonarqube': return self.convert_to_sonar_format() else: raise ValueError(f"Unsupported format: {format}") def convert_to_sonar_format(self) -> str: """转换为 SonarQube 格式""" # 实现转换逻辑 pass ``` --- ## 误报处理 ### 误报原因 > ▎ 误报不是工具问题,是规则问题。规则不优化,误报就是持续的。 **误报常见原因**: ``` 1. 规则过于宽泛 - 匹配模式太通用 - 没有考虑上下文 - 缺少例外处理 2. 缺少语义理解 - 无法理解代码意图 - 无法识别清理函数 - 无法追踪数据流 3. 框架特定模式 - ORM 自动参数化 - 模板自动转义 - 框架安全机制 4. 测试代码 - 测试数据不是真实输入 - 测试代码不部署 - 测试环境隔离 ``` ### 误报处理策略 ```python # 误报处理 class FalsePositiveHandler: """误报处理""" def __init__(self): # 误报规则 self.fp_rules = { 'orm_parameterized': self.is_orm_parameterized, 'template_auto_escape': self.is_template_auto_escape, 'test_code': self.is_test_code, 'sanitized_input': self.is_sanitized_input } def filter_false_positives(self, issues): """过滤误报""" filtered = [] for issue in issues: if not self.is_false_positive(issue): filtered.append(issue) return filtered def is_false_positive(self, issue): """判断是否误报""" for rule_name, rule_func in self.fp_rules.items(): if rule_func(issue): return True return False def is_orm_parameterized(self, issue): """检查是否 ORM 参数化""" # ORM 自动参数化不是漏洞 if 'filter(' in issue.get('code', ''): if 'exclude(' in issue.get('code', ''): return True # Django ORM if 'User.objects.filter' in issue.get('code', ''): return True # SQLAlchemy if '.filter_by(' in issue.get('code', ''): return True return False def is_template_auto_escape(self, issue): """检查是否模板自动转义""" # Jinja2 自动转义 if 'render_template(' in issue.get('code', ''): return True # 除非明确禁用 if 'autoescape=False' in issue.get('code', ''): return False return False def is_test_code(self, issue): """检查是否测试代码""" file_path = issue.get('file', '') # 测试目录 if '/tests/' in file_path or '/test_' in file_path: return True # 测试文件 if file_path.endswith('_test.py') or file_path.endswith('_spec.py'): return True return False def is_sanitized_input(self, issue): """检查输入是否已清理""" code = issue.get('code', '') # 检查清理函数 sanitizers = ['escape(', 'sanitize(', 'quote(', 'parameterize('] for sanitizer in sanitizers: if sanitizer in code: return True return False def add_noqa_comment(self, issue): """添加 noqa 注释""" # 生成 noqa 注释 noqa = f"# nosec {issue['id']}: {issue['reason']}" # 添加到代码 # 实际实现需要修改源代码文件 pass def generate_suppression_file(self, issues): """生成抑制文件""" suppression = { 'suppressions': [] } for issue in issues: if self.is_false_positive(issue): suppression['suppressions'].append({ 'id': issue['id'], 'file': issue['file'], 'line': issue['line'], 'reason': issue.get('reason', 'False positive') }) return suppression ``` --- ## CI/CD 集成 ### GitHub Actions 集成 ```yaml # .github/workflows/security-scan.yml name: Security Scan on: push: branches: [main, develop] pull_request: branches: [main] jobs: sast: runs-on: ubuntu-latest steps: - uses: actions/checkout@v3 with: fetch-depth: 0 - name: Set up Python uses: actions/setup-python@v4 with: python-version: '3.11' # Bandit - name: Run Bandit run: | pip install bandit bandit -r ./src -f json -o bandit-report.json || true continue-on-error: true # Semgrep - name: Run Semgrep run: | pip install semgrep semgrep --config auto --json ./src -o semgrep-report.json || true continue-on-error: true # Safety - name: Run Safety run: | pip install safety safety check --json --output safety-report.json || true continue-on-error: true # 上传报告 - name: Upload Security Reports uses: actions/upload-artifact@v3 with: name: security-reports path: | bandit-report.json semgrep-report.json safety-report.json # 生成汇总报告 - name: Generate Summary run: | python scripts/generate_security_summary.py # 评论 PR - name: Comment PR if: github.event_name == 'pull_request' uses: actions/github-script@v6 with: script: | const fs = require('fs'); const summary = fs.readFileSync('security-summary.md', 'utf8'); github.rest.issues.createComment({ issue_number: context.issue.number, owner: context.repo.owner, repo: context.repo.repo, body: summary }); ``` ### GitLab CI 集成 ```yaml # .gitlab-ci.yml stages: - test - security - deploy # SAST 扫描 sast: stage: security image: python:3.11 script: - pip install bandit semgrep safety - bandit -r ./src -f json -o $CI_PROJECT_DIR/bandit-report.json - semgrep --config auto --json ./src -o $CI_PROJECT_DIR/semgrep-report.json - safety check --json --output $CI_PROJECT_DIR/safety-report.json artifacts: reports: security: - bandit-report.json - semgrep-report.json - safety-report.json rules: - if: $CI_PIPELINE_SOURCE == "merge_request_event" - if: $CI_COMMIT_BRANCH == $CI_DEFAULT_BRANCH # 依赖扫描 dependency_scanning: stage: security image: python:3.11 script: - pip install pip-audit - pip-audit --format json --output $CI_PROJECT_DIR/pip-audit-report.json artifacts: reports: dependency_scanning: pip-audit-report.json # 安全门 security_gate: stage: security image: python:3.11 script: - pip install semgrep - semgrep --config auto --error ./src rules: - if: $CI_COMMIT_BRANCH == $CI_DEFAULT_BRANCH when: always - when: manual ``` --- ## 结果分析与修复 ### 结果优先级 > ▎ 修复不是按数量,是按风险。风险不优先,资源就是浪费的。 **优先级模型**: ```python # 结果优先级排序 class ResultPrioritizer: """结果优先级排序""" def prioritize(self, issues): """对问题进行优先级排序""" for issue in issues: issue['priority_score'] = self.calculate_priority(issue) # 按优先级排序 issues.sort(key=lambda x: x['priority_score'], reverse=True) return issues def calculate_priority(self, issue): """计算优先级分数""" score = 0 # 严重程度 (0-40 分) severity_scores = { 'CRITICAL': 40, 'ERROR': 30, 'WARNING': 20, 'INFO': 10 } score += severity_scores.get(issue.get('severity', 'INFO'), 0) # 置信度 (0-30 分) confidence_scores = { 'HIGH': 30, 'MEDIUM': 20, 'LOW': 10 } score += confidence_scores.get(issue.get('confidence', 'LOW'), 0) # 可达性 (0-20 分) if issue.get('reachable', False): score += 20 elif issue.get('potentially_reachable', False): score += 10 # 代码热度 (0-10 分) # 经常被修改的代码优先级更高 score += min(issue.get('code_churn', 0), 10) return score def get_remediation_order(self, issues): """获取修复顺序""" prioritized = self.prioritize(issues) # 分组 groups = { 'immediate': [], # 立即修复 'soon': [], # 尽快修复 'scheduled': [], # 计划修复 'backlog': [] # 待办 } for issue in prioritized: if issue['priority_score'] >= 80: groups['immediate'].append(issue) elif issue['priority_score'] >= 60: groups['soon'].append(issue) elif issue['priority_score'] >= 40: groups['scheduled'].append(issue) else: groups['backlog'].append(issue) return groups ``` ### 修复指南 ```markdown # 漏洞修复指南 ## SQL 注入修复 ### 问题代码 ```python cursor.execute("SELECT * FROM users WHERE id = %s" % user_id) ``` ### 修复代码 ```python # 使用参数化查询 cursor.execute("SELECT * FROM users WHERE id = %s", (user_id,)) ``` ### 修复说明 - 使用参数化查询而不是字符串拼接 - 参数作为元组传递给 execute() - 数据库驱动会自动处理转义 ## XSS 修复 ### 问题代码 ```python return request.args.get('q') ``` ### 修复代码 ```python from markupsafe import escape return escape(request.args.get('q')) ``` ### 修复说明 - 使用 escape() 转义用户输入 - 或使用模板引擎的自动转义 - 不要使用 Markup() 包装用户输入 ## 命令注入修复 ### 问题代码 ```python os.system(f"ping {hostname}") ``` ### 修复代码 ```python import subprocess subprocess.run(['ping', hostname], check=True) ``` ### 修复说明 - 使用列表而不是字符串 - 不使用 shell=True - 使用 subprocess 而不是 os.system ``` --- ## 实战配置演练 ### 完整配置示例 ```yaml # 完整 SAST 配置示例 # pyproject.toml [tool.bandit] targets = ["src"] exclude_dirs = ["tests", "venv"] skips = ["B101"] [tool.semgrep] config = [ "auto", "p/python", "./rules/" ] exclude = [ "tests/", "venv/", "*.min.js" ] # .sonarqube/conf/sonar-project.properties sonar.projectKey=myproject sonar.projectName=My Project sonar.sources=src sonar.tests=tests sonar.python.coverage.reportPaths=coverage.xml sonar.python.xunit.reportPath=test-results.xml sonar.qualitygate.wait=true # .github/workflows/security.yml name: Security on: push: branches: [main] pull_request: branches: [main] jobs: security: runs-on: ubuntu-latest steps: - uses: actions/checkout@v3 - name: Setup Python uses: actions/setup-python@v4 with: python-version: '3.11' - name: Install dependencies run: | pip install bandit semgrep safety pip-audit - name: Run Bandit run: bandit -r ./src -f json -o bandit-report.json continue-on-error: true - name: Run Semgrep run: semgrep --config auto --json ./src -o semgrep-report.json continue-on-error: true - name: Run Safety run: safety check --json --output safety-report.json continue-on-error: true - name: Run pip-audit run: pip-audit --format json --output pip-audit-report.json continue-on-error: true - name: Upload Reports uses: actions/upload-artifact@v3 with: name: security-reports path: "*.json" ``` --- 统计 **Sprint 交付 · 绩效评估** ``` ┌───────────────┬────────────────┬────────────────┐ │ 主动出击 │ ██████████ 5/5 │ [PUA 生效] 充足 │ ├───────────────┼────────────────┼────────────────┤ │ + 验证闭环 │ ██████████ 5/5 │ 案例完整 │ ├───────────────┼────────────────┼────────────────┤ │ 设计 代码质量 │ ██████████ 5/5 │ 生产就绪 │ └───────────────┴────────────────┴────────────────┘ 综合:4.5 ``` ▎ 这才配得上 P8。SAST 不是装工具,是建体系。体系不建立,安全就是表面的。 --- ## 总结与思考 ### 核心要点回顾 > ▎ 复盘四步法:回顾目标、评估结果、分析原因、总结经验。别跳过——这是闭环。 **SAST 框架**: ``` 1. 工具选择 - Bandit (Python) - Semgrep (多语言) - SonarQube (企业级) 2. 规则设计 - 精确匹配 - 减少误报 - 持续更新 3. CI/CD 集成 - 自动化扫描 - 质量门禁 - 报告汇总 4. 结果处理 - 优先级排序 - 误报过滤 - 修复跟踪 ``` **关键成功因素**: ``` 1. 工具 + 流程 - 工具发现问 - 流程保落地 - 两者缺一不可 2. 规则 + 人员 - 规则自动化 - 人员审结果 - 互补非替代 3. 扫描 + 修复 - 扫描是手段 - 修复是目的 - 闭环才有效 ``` ### 实战建议 > ▎ 我给你指了路,走不走是你的事。机会给了,抓不抓得住看你。 **SAST 建设**: ``` 1. 从小开始 - 先跑起来 - 逐步优化 - 快速见效 2. 规则优化 - 减少误报 - 增加覆盖 - 持续迭代 3. 流程集成 - CI/CD 集成 - 质量门禁 - 修复跟踪 ``` --- ## 参考资料 ### 学习资源 ``` - OWASP SAST Guide https://owasp.org/www-community/Source_Code_Analysis_Tools - Semgrep Documentation https://semgrep.dev/docs/ - SonarQube Documentation https://docs.sonarqube.org/ ``` ### 工具资源 ``` - Bandit https://github.com/PyCQA/bandit - Semgrep https://github.com/returntocorp/semgrep - CodeQL https://github.com/github/codeql ``` ### 规则资源 ``` - Semgrep Rule Registry https://semgrep.dev/explore - SonarQube Rules https://rules.sonarsource.com/ - CWE Database https://cwe.mitre.org/ ``` ### 书籍推荐 ``` - 《Static Analysis for Security》 - 《Secure Coding with SAST》 - 《Automated Security Testing》 ``` --- **标记 明日预告**:Day 149 - 动态应用测试 DAST > ▎ SAST 是静态分析,DAST 是动态测试——明天看动态应用测试 DAST。 > 本文内容仅供学习和研究使用,请勿用于非法目的。所有实验请在隔离环境中进行。 --- *本文是 365 天信息安全技术系列的第 148 篇,应用安全部分第 41 篇,精编版本* *应用安全核心系列继续!*
myh0st
2026年4月13日 23:18
分享文档
收藏文档
上一篇
下一篇
微信扫一扫
复制链接
手机扫一扫进行分享
复制链接
Markdown文件
分享
链接
类型
密码
更新密码