公开文集
0x01 SRC 资产管理系统
0x02 Web 漏洞案例库
0x03 小程序漏洞案例库
第一章:小程序渗透基础
1.1 微信小程序反编译与动态调试
1.2 微信小程序强制开启开发者模式
0x99 信息安全学习体系
01-网络安全基础
Day-001-TCP-IP协议栈安全分析
Day-002-DNS协议安全与DNS劫持攻防
Day-003-IPv6 安全基础与过渡
Day-004-HTTP-HTTPS协议深度解析
Day-005-网络嗅探与流量分析技术
Day-006-防火墙原理与配置实践
Day-007-网络地址转换 NAT 安全分析
Day-008-路由协议安全 RIP-OSPF-BGP
Day-009-VLAN 安全与 VLAN-Hopping
Day-010-无线网络基础与安全 802.11
Day-011-网络访问控制 802.1X-NAC
Day-012-网络分段与微隔离设计
Day-013-负载均衡器安全配置
Day-014-CDN安全与防护
Day-015-NTP安全
Day-016-DHCP安全与攻击防护
Day-017-ICMP协议安全分析
Day-018-网络协议模糊测试基础
Day-019-网络流量基线建立
Day-020-网络取证基础
Day-021-网络入侵检测系统 NIDS
Day-022-网络入侵防御系统 NIPS
Day-023-网络流量加密与解密
Day-024-网络协议逆向工程基础
Day-025-网络性能与安全权衡
Day-026-SDN 安全
Day-027-网络虚拟化安全
Day-028-网络欺骗技术
Day-029-网络威胁情报应用
Day-030-网络容量规划与安全
Day-031-网络安全架构设计实战
02-Web 安全
Day-032-OWASP-Top-10-2021详解
Day-033-SQL 注入原理与手工检测
Day-034-SQL注入进阶报错注入与盲注
Day-035-XSS跨站脚本攻击基础
Day-036-XSS 进阶绕过与利用
Day-037-XSS进阶绕过与利用
Day-038-CSRF 跨站请求伪造
Day-039-文件上传漏洞
Day-040-反序列化漏洞基础
Day-041-PHP反序列化深入
Day-042-Java反序列化深入
Day-043-SSTI 服务端模板注入
Day-044-文件包含漏洞 LFI-RFI
Day-045-命令注入漏洞
Day-046-XXE-XML 外部实体注入
Day-047-反序列化漏洞进阶
Day-048-API 安全基础
Day-049-API认证与授权安全
Day-050-API漏洞挖掘实战
Day-051-文件上传漏洞进阶
Day-052-反序列化漏洞实战
Day-053-Web 安全综合实战
Day-054-移动安全基础
Day-055-Android 应用安全测试
Day-056-iOS 应用安全测试
Day-057-移动应用综合实战
Day-058-云安全基础
Day-059-AWS 安全实战
Day-060-Azure 安全实战
Day-061-GCP 安全实战
Day-062-云安全综合实战
Day-063-容器安全基础
Day-064-Docker 安全实战
Day-065-Kubernetes 安全实战
Day-066-容器安全综合实战
Day-067-API 安全进阶
Day-068-服务端请求伪造 SSRF 深入
Day-069-文件上传漏洞进阶
Day-070-反序列化漏洞实战进阶
Day-071-业务逻辑漏洞深入
Day-072-前端安全深入
Day-073-Web 安全综合实战
Day-074-云安全进阶
Day-075-移动安全进阶
Day-076-API 安全进阶
Day-077-前端安全进阶
Day-078-业务逻辑漏洞进阶
Day-079-反序列化漏洞实战进阶
Day-080-文件上传漏洞实战进阶
Day-081-SSTI 服务端模板注入进阶
Day-082-XXE-XML 外部实体注入进阶
Day-083-SSRF 服务端请求伪造进阶
Day-084-命令注入漏洞进阶
Day-085-文件包含漏洞进阶
Day-086-反序列化漏洞实战进阶
Day-087-文件上传漏洞实战进阶
Day-088-SSTI 服务端模板注入实战进阶
Day-089-XXE-XML 外部实体注入实战进阶
Day-090-SSRF 服务端请求伪造实战进阶
Day-091-命令注入漏洞实战进阶
Day-092-Web 安全综合实战
Day-093-GraphQL 安全
Day-094-JWT 与 OAuth2 安全
03-系统安全
Day-095-系统监控与检测
Day-096-主机防火墙配置
Day-097-系统审计与合规
Day-098-Linux 系统安全进阶
Day-099-Windows 系统安全进阶
Day-100-容器安全进阶
Day-101-容器编排安全进阶
Day-102-Linux 内核安全
Day-103-Windows 内核安全
Day-104-系统安全总结与实战
Day-105-Linux 系统安全基础
Day-106-Windows 系统安全基础
Day-107-容器安全基础
Day-108-系统加固技术
Day-109-日志分析技术
Day-110-威胁狩猎技术
04-应用安全
Day-111-安全编码规范
Day-112-输入验证技术
Day-113-输出编码技术
Day-114-错误处理安全
Day-115-会话管理安全
Day-116-认证安全
Day-117-授权安全
Day-118-数据保护安全
Day-119-日志安全
Day-120-API 安全
Day-121-微服务安全
Day-122-新兴技术安全概论
Day-123-DevSecOps 流水线安全
Day-124-云原生安全架构
Day-125-API 安全最佳实践
Day-126-安全编码规范
Day-127-SDL 安全开发生命周期
Day-128-威胁建模实战
Day-129-安全需求分析
Day-130-安全架构设计
Day-131-安全编码实践Java
Day-132-安全编码实践Python
Day-133-代码审计方法论
Day-134-静态代码分析SAST
Day-135-动态应用测试DAST
Day-136-交互式测试IAST
Day-137-软件成分分析SCA
Day-138-依赖漏洞管理
Day-139-安全测试自动化
Day-140-漏洞管理与响应
Day-141-应用安全总结与展望
Day-142-OWASP-Top10-2024 详解
Day-143-CWE-Top25 分析
Day-144-漏洞挖掘方法论
Day-145-模糊测试技术
Day-146-逆向工程基础
Day-147-漏洞利用开发基础
Day-148-漏洞复现与验证
Day-149-漏洞披露流程
Day-150-CVE 申请与管理
Day-151-漏洞赏金计划
Day-152-等保2.0详解
Day-153-GDPR 合规实践
Day-154-数据安全法解读
Day-155-个人信息保护法与合规指南
Day-156-个人信息保护法解读
Day-157-ISO-27001 信息安全管理体系
Day-158-SOC-2 合规与审计
Day-159-PCI-DSS 支付卡行业数据安全标准
Day-160-网络安全审查办法解读
Day-161-数据出境安全评估办法
Day-162-应用安全评估实战
Day-163-红蓝对抗演练
Day-164-安全应急响应
Day-165-安全运营中心建设
Day-166-应用安全总结与展望
05-密码学
Day-167-密码学基础
Day-168-对称加密算法详解
Day-169-非对称加密算法详解
Day-170-哈希函数与数字签名
Day-171-密钥管理与PKI
Day-172-TLS-SSL 协议详解
Day-173-国密算法详解
Day-174-认证与密钥协议
Day-175-随机数生成与熵源
Day-176-椭圆曲线密码学详解
Day-177-后量子密码学详解
Day-178-高级密码学主题
Day-179-密码学行业应用精选
Day-180-常用加密算法原理与实现
Day-181-密码学总结与展望
Day-182-密码学系列总结与展望
06-渗透测试
Day-183-渗透测试方法论
Day-184-信息收集技术详解
Day-185-漏洞扫描技术详解
Day-186-漏洞利用技术详解
Day-187-渗透测试中的漏洞利用框架
Day-188-漏洞利用框架与 Metasploit 深入
Day-189-渗透测试中的 WAF 绕过技术
Day-190-渗透测试中的模糊测试技术
Day-191-渗透测试中的代码审计与静态分析
Day-192-渗透测试中的密码哈希破解技术
Day-193-渗透测试报告编写指南
Day-194-Web 应用渗透测试
Day-195-渗透测试中的 API 安全测试
Day-196-渗透测试中的 GraphQL 安全测试
Day-197-渗透测试中的前后端分离应用测试
Day-198-渗透测试中的小程序安全测试
Day-199-渗透测试中的浏览器安全测试
Day-200-OAuth-SSO安全测试
Day-201-渗透测试中的业务逻辑漏洞测试
Day-202-渗透测试中的厚客户端安全测试
Day-203-渗透测试综合实战演练
Day-204-内网渗透技术详解
Day-205-渗透测试中的内网信息收集进阶
Day-206-渗透测试中的域森林渗透技术
Day-207-渗透测试中的权限维持技术
Day-208-渗透测试中的横向移动技术
Day-209-渗透测试中的痕迹清理与反取证技术
Day-210-渗透测试中的数据窃取与 Exfiltration 技术
Day-211-渗透测试中的内部威胁与数据泄露测试
Day-212-渗透测试中的物理安全渗透
Day-213-社会工程学攻击技术
Day-214-移动应用渗透测试
Day-215-云安全渗透测试
Day-216-渗透测试中的容器与 Kubernetes 安全渗透
Day-217-渗透测试中的 Serverless 安全测试
Day-218-渗透测试中的微服务安全测试
Day-219-物联网安全渗透测试
Day-220-工业控制系统安全渗透测试
Day-221-无线网络安全渗透测试
Day-222-数据库安全渗透测试
Day-223-渗透测试中的供应链安全测试
Day-224-红队演练技术详解
Day-225-渗透测试中的红队基础设施搭建
Day-226-渗透测试中的威胁情报与狩猎
Day-227-渗透测试中的综合指纹识别技术
Day-228-自动化渗透测试技术
Day-229-渗透测试中的运维安全测试
Day-230-渗透测试中的区块链与智能合约安全测试
Day-231-渗透测试中的漏洞管理与修复验证
Day-232-渗透测试法律与合规
Day-233-后渗透攻击技术详解
Day-234-渗透测试中的人工智能应用
Day-235-漏洞利用开发深入
Day-236-云原生渗透测试深入
07-应急响应
Day-237-应急响应概述与核心概念
Day-238-应急响应流程框架
Day-239-CSIRT 团队组建与职责分工
Day-240-应急响应工具包准备
Day-241-应急响应法律与合规要求
Day-242-安全事件检测方法与指标
Day-243-云原生应急响应
Day-244-日志收集与分析技术
Day-245-网络流量分析与异常识别
Day-246-自动化响应与 SOAR
Day-247-端点监控与 EDR 技术
Day-248-威胁狩猎方法论
Day-249-威胁情报在检测中的应用
Day-250-数字取证基础与证据链管理
Day-251-内存取证技术
Day-252-磁盘取证与文件恢复
Day-253-网络取证与数据包分析
Day-254-云环境与容器取证
Day-255-恶意代码静态分析技术
Day-256-恶意代码动态分析技术
Day-257-恶意代码行为分析方法
Day-258-逆向工程基础与工具
Day-259-沙箱技术与自动化分析
Day-260-事件隔离与遏制策略
Day-261-威胁根除与系统修复
Day-262-系统恢复与数据重建
Day-263-业务连续性计划
Day-264-事件复盘与经验总结
Day-265-APT 攻击事件复盘分析
Day-266-勒索软件事件响应实战
Day-267-数据泄露事件处置流程
Day-268-内部威胁调查与取证
Day-269-综合应急响应演练
08-安全运维
Day-270-安全运营中心 SOC 概述
Day-271-安全监控指标体系
Day-272-安全告警管理
Day-273-安全可视化与仪表盘
Day-274-监控工具选型
Day-275-日志采集技术
Day-276-日志标准化与解析
Day-277-日志存储与归档
Day-278-日志分析技术
Day-279-日志合规要求
Day-280-SIEM 架构与设计
Day-281-关联规则引擎
Day-282-高级关联分析
Day-283-UEBA 用户实体行为分析
Day-284-威胁狩猎
Day-285-SOAR 基础概念
Day-286-剧本设计
Day-287-自动化响应技术
Day-288-安全工具集成
Day-289-SOAR 度量与优化
Day-290-安全基线管理
Day-291-漏洞管理流程
Day-292-补丁管理策略
Day-293-变更安全管理
Day-294-合规审计技术
Day-295-7x24 安全运营
Day-296-安全事件管理流程
Day-297-安全运营度量体系
Day-298-持续改进机制
Day-299-安全运维综合演练
Day-300-云原生安全运营
Day-301-AI 与机器学习安全运营
Day-302-安全自动化脚本实战
09-移动安全
Day-303-移动安全威胁概述
Day-304-移动设备安全架构
Day-305-移动操作系统安全模型
Day-306-移动应用权限管理
Day-307-移动端数据加密
Day-308-330-Android 安全合集
Day-309-Android 安全架构
Day-310-Android 组件安全
Day-311-Android 权限与隐私
Day-312-Android 逆向工程
Day-313-Android 应用加固
Day-314-iOS 安全架构
Day-315-iOS 应用沙盒机制
Day-316-越狱与反越狱
Day-317-iOS 逆向工程
Day-318-iOS 企业分发安全
Day-319-移动安全开发生命周期
Day-320-移动应用安全测试
Day-321-移动应用加固技术
Day-322-移动威胁防护
Day-323-移动安全合规
10-云安全
Day-324-云计算安全模型
Day-325-责任共担模型
Day-326-云安全威胁模型
Day-327-云安全合规框架
Day-328-云安全架构设计
Day-329-AWS IAM 安全
Day-330-AWS 网络安全
Day-331-AWS 存储安全
Day-332-AWS 安全监控
Day-333-AWS 安全最佳实践
Day-334-Azure AD 安全
Day-335-Azure 网络安全
Day-336-Azure 存储安全
Day-337-Azure 安全中心
Day-338-Azure 安全最佳实践
Day-339-容器安全基础
Day-340-Kubernetes 安全
Day-341-Serverless 安全
Day-342-云原生 DevSecOps
Day-343-云安全态势管理 CSPM
11-物联网工控
Day-344-物联网安全概述
Day-345-IoT 通信协议安全
Day-346-IoT 设备安全
Day-347-IoT 平台安全
Day-348-IoT 应用安全
Day-349-工业控制系统概述
Day-350-工控协议安全
Day-351-PLC 安全
Day-352-SCADA 系统安全
Day-353-工控安全防护
12-综合与总结
Day-354-安全职业发展路径
Day-355-安全技术趋势展望
Day-356-安全建设方法论
Day-357-经典攻防案例复盘
Day-358-安全学习资源指南
Day-359-信息安全行业求职指南
-
+
首页
Day-275-日志采集技术
# Day 296: 日志采集技术 - Syslog/Agent/API/文件采集 > 安全运维系列第 6 天 | 预计阅读时间:25 分钟 | 难度:★★★☆☆ --- ## 清单 目录 1. [日志采集概述](#日志采集概述) 2. [Syslog 协议采集](#syslog-协议采集) 3. [Agent 代理采集](#agent-代理采集) 4. [API 接口采集](#api-接口采集) 5. [文件采集](#文件采集) 6. [数据库日志采集](#数据库日志采集) 7. [云环境日志采集](#云环境日志采集) 8. [采集架构设计](#采集架构设计) 9. [总结与思考](#总结与思考) 10. [参考资料](#参考资料) --- ## 日志采集概述 ### 日志采集的重要性 日志采集是安全运营的基础,没有完整准确的日志采集,后续的分析、检测、响应都无从谈起。 **采集目标**: - **完整性**:采集所有相关日志,无遗漏 - **及时性**:日志产生后尽快采集(目标:< 5 分钟) - **准确性**:日志内容完整,无丢失或篡改 - **标准化**:统一日志格式,便于分析 ### 日志源分类 **网络设备**: - 防火墙(Palo Alto、Fortinet、Cisco ASA) - 路由器/交换机(Cisco、Huawei、H3C) - 负载均衡(F5、Citrix) - WAF(Imperva、F5 ASM) **安全设备**: - IDS/IPS(Snort、Suricata) - 终端防护(EDR) - 邮件安全 - Web 代理 **服务器**: - Windows 事件日志 - Linux Syslog - 应用日志(Web 服务器、数据库) **云服务**: - AWS CloudTrail、VPC Flow Logs - Azure Activity Log、NSG Flow Logs - GCP Cloud Audit Logs **应用系统**: - 业务应用日志 - 身份认证系统(AD、LDAP) - 数据库审计日志 ### 采集方法对比 | 方法 | 优点 | 缺点 | 适用场景 | |------|------|------|----------| | Syslog | 标准化、广泛支持 | 可能丢失、无加密 | 网络设备、Linux | | Agent | 可靠、功能强 | 需安装、占用资源 | 服务器、终端 | | API | 实时、结构化 | 依赖 API 稳定性 | 云服务、SaaS | | 文件采集 | 简单、无需配置 | 轮询延迟、解析复杂 | 应用日志 | | 数据库 | 结构化、完整 | 性能影响、配置复杂 | 数据库审计 | --- ## Syslog 协议采集 ### Syslog 协议基础 **协议标准**: - RFC 3164:BSD Syslog(传统格式) - RFC 5424:Structured Syslog(结构化格式) - RFC 6587:Syslog over TCP **消息格式(RFC 3164)**: ``` <PRI>TIMESTAMP HOSTNAME TAG: MSG 示例: <13>Apr 12 14:30:01 server01 sshd[12345]: Accepted password for user from 192.168.1.100 ``` **消息格式(RFC 5424)**: ``` <PRI>VERSION TIMESTAMP HOSTNAME APP-NAME PROCID MSGID STRUCTURED-DATA MSG 示例: <13>1 2026-04-12T14:30:01.123Z server01 sshd 12345 - [meta sequenceId="1"] Accepted password ``` **优先级计算**: ``` PRI = Facility × 8 + Severity Facility(设施): 0 - kernel messages 1 - user-level messages 2 - mail system 3 - system daemons ... 16-23 - local use Severity(严重性): 0 - Emergency 1 - Alert 2 - Critical 3 - Error 4 - Warning 5 - Notice 6 - Informational 7 - Debug ``` ### Syslog 传输方式 **UDP Syslog**: - 端口:514 - 优点:简单、低开销 - 缺点:不可靠、可能丢失、无加密 - 适用:内网、非关键日志 **TCP Syslog**: - 端口:514 或 601 - 优点:可靠、有确认机制 - 缺点:开销稍大 - 适用:关键日志、跨网络 **TLS Syslog**: - 端口:6514 - 优点:加密、安全 - 缺点:需要证书管理、开销大 - 适用:跨公网、敏感日志 ### Syslog 服务器 **开源方案**: - **rsyslog**:Linux 默认,高性能 - **syslog-ng**:功能丰富,灵活配置 - **syslog**:BSD 原始实现 **商业方案**: - Splunk Universal Forwarder(接收 Syslog) - QRadar Syslog Collector - ArcSight Connector ### rsyslog 配置示例 **基础配置**: ```bash # /etc/rsyslog.conf # 加载 TCP 模块 module(load="imtcp") input(type="imtcp" port="514") # 加载 UDP 模块 module(load="imudp") input(type="imudp" port="514") # 按设施转发 auth,authpriv.* /var/log/auth.log mail.* /var/log/mail.log daemon.* /var/log/daemon.log # 按主机名转发 :hostname, isequal, "firewall01" /var/log/firewall.log # 转发到远程 SIEM *.* @@siem.example.com:514 ``` **高级配置(结构化日志)**: ```bash # 解析结构化 Syslog template(name="StructuredFormat" type="list") { constant(value="{") constant(value="\"timestamp\":\"") property(name="timestamp" dateFormat="rfc3339") constant(value="\",\"host\":\"") property(name="hostname") constant(value="\",\"app\":\"") property(name="programname") constant(value="\",\"msg\":\"") property(name="msg" controlcharacters="on") constant(value="\"}") constant(value="\n") } # 使用模板输出 *.* @@siem.example.com:514;StructuredFormat ``` --- ## Agent 代理采集 ### Agent 类型 **通用日志 Agent**: - Splunk Universal Forwarder - Elastic Beats(Filebeat、Winlogbeat) - Fluentd/Fluent Bit - NXLog **安全专用 Agent**: - EDR Agent(CrowdStrike、Defender) - 主机入侵检测 Agent - 文件完整性监控 Agent ### Splunk Universal Forwarder **特点**: - 轻量级(~50MB 内存) - 只转发,不索引 - 支持数据压缩和加密 - 集中管理 **安装配置**: ```bash # 安装 wget -O splunkforwarder.tgz "https://download.splunk.com/products/universalforwarder/releases/9.0.0/linux/splunkforwarder-9.0.0-Linux-x86_64.tgz" tar -xzf splunkforwarder.tgz -C /opt cd /opt/splunkforwarder/bin # 初始化 ./splunk start --accept-license ./splunk add forward-server siem.example.com:9997 ./splunk enable deploy-server # 监控日志 ./splunk add monitor /var/log/auth.log -index main -sourcetype auth:ssh ./splunk add monitor /var/log/secure -index main -sourcetype auth:secure ``` ### Elastic Beats **Beats 家族**: | Beat | 用途 | 采集内容 | |------|------|----------| | Filebeat | 文件日志 | 应用日志、系统日志 | | Winlogbeat | Windows 事件 | Windows Event Logs | | Auditbeat | 审计框架 | Linux Audit、文件完整性 | | Metricbeat | 指标数据 | 系统指标、服务指标 | | Packetbeat | 网络数据 | 网络流量、协议分析 | | Heartbeat | 可用性监控 | 服务可用性、响应时间 | **Filebeat 配置示例**: ```yaml # filebeat.yml filebeat.inputs: - type: log enabled: true paths: - /var/log/auth.log - /var/log/secure fields: log_type: auth fields_under_root: true - type: log enabled: true paths: - /var/log/nginx/access.log - /var/log/nginx/error.log fields: log_type: nginx fields_under_root: true parsers: - ndjson: target: json overwrite_keys: true output.elasticsearch: hosts: ["elasticsearch:9200"] index: "filebeat-%{+yyyy.MM.dd}" # 或输出到 Logstash output.logstash: hosts: ["logstash:5044"] ``` ### Winlogbeat 配置 **Windows 事件采集**: ```yaml # winlogbeat.yml winlogbeat.event_logs: - name: Application ignore_older: 72h level: critical,error,warning - name: System ignore_older: 72h - name: Security ignore_older: 72h event_id: 4624,4625,4634,4647,4648,4656,4657,4660,4661,4662,4663,4670,4672,4673,4674,4688,4689,4697,4698,4699,4700,4701,4702,4703,4704,4705,4719,4720,4722,4723,4724,4725,4726,4731,4732,4733,4734,4735,4738,4740,4741,4742,4743,4744,4745,4746,4767,4768,4769,4770,4771,4774,4775,4776,4778,4779,4781,4782,4793,4798,4800,4801,4802,4803,4902,4904,4905,4906,4907,4908,4909,4910,4911,4912,4913,4928,4929,4930,4931,4932,4933,4934,4935,4946,4947,4948,4950,4951,4952,4953,4954,4955,4956,4957,4958,4964,5038,5058,5059,5060,5061,5062,5120,5121,5122,5123,5124,5125,5126,5127,5136,5137,5138,5139,5140,5141,5142,5143,5144,5145,5148,5150,5151,5152,5153,5154,5155,5156,5157,5158,5159,5168,5169,5170,5171,5172,5173,5174,5175,5176,5177,5178,5179,5180,5181,5182,5183,5184,5185,5186,5187,5188,5189,5190,5191,5192,5193,5194,5195,5196,5197,5198,5199,5200,5201,5202,5203,5204,5205,5206,5207,5208,5209,5210,5211,5212 - name: Windows PowerShell event_id: 400,403,600,800 - name: Microsoft-Windows-PowerShell/Operational event_id: 4103,4104,4105,4106 output.logstash: hosts: ["logstash:5044"] ``` --- ## API 接口采集 ### 云服务 API 采集 **AWS CloudTrail**: ```python # 使用 boto3 采集 CloudTrail 日志 import boto3 import json client = boto3.client('cloudtrail') # 查询事件 response = client.lookup_events( LookupAttributes=[ {'AttributeKey': 'EventName', 'AttributeValue': 'ConsoleLogin'}, ], StartTime=datetime.now() - timedelta(hours=1), EndTime=datetime.now(), MaxResults=50 ) for event in response['Events']: cloud_trail_event = json.loads(event['CloudTrailEvent']) # 发送到 SIEM send_to_siem(cloud_trail_event) ``` **AWS VPC Flow Logs**: ``` # Flow Logs 格式 version account-id interface-id srcaddr dstaddr srcport dstport protocol packets bytes start end action log-status 示例: 2 123456789010 eni-12345678 192.168.1.100 10.0.0.50 54321 443 6 10 1500 1649772600 1649772660 ACCEPT OK ``` **Azure Activity Log**: ```python # 使用 Azure SDK 采集 from azure.monitor.query import LogsQueryClient client = LogsQueryClient(credential) # 查询 Azure Activity Log response = client.query_workspace( workspace_id=workspace_id, query="AzureActivity | where TimeGenerated > ago(1h)", timespan=timedelta(hours=1) ) ``` ### SaaS 应用 API 采集 **Office 365 Management API**: ```python # 获取 O365 审计日志 import requests # 1. 获取访问令牌 token = get_oauth_token() # 2. 订阅内容 headers = {'Authorization': f'Bearer {token}'} response = requests.post( 'https://manage.office.com/api/v1.0/tenant_id/activity/feed/subscriptions/start?contentType=Audit.AzureActiveDirectory', headers=headers ) # 3. 获取内容列表 response = requests.get( 'https://manage.office.com/api/v1.0/tenant_id/activity/feed/subscriptions/content?contentType=Audit.AzureActiveDirectory&startTime=2026-04-12T00:00:00&endTime=2026-04-12T23:59:59', headers=headers ) # 4. 下载具体内容 for content_uri in response.json(): logs = requests.get(content_uri['contentUri']).json() send_to_siem(logs) ``` **GitHub Audit Log**: ```python # GitHub Enterprise Audit Log API import requests headers = { 'Authorization': 'Bearer GITHUB_TOKEN', 'Accept': 'application/json' } response = requests.get( 'https://api.github.com/orgs/ORG_NAME/audit-log', headers=headers, params={'phrase': 'action:git.push OR action:repo.create', 'per_page': 100} ) audit_logs = response.json() ``` --- ## 文件采集 ### 文件采集方法 **轮询方式**: - 定期检查文件变化 - 读取新增内容 - 记录读取位置(offset) **inotify 方式(Linux)**: - 监听文件变化事件 - 实时触发读取 - 低延迟 ### Filebeat 文件采集配置 ```yaml filebeat.inputs: - type: log enabled: true paths: - /var/log/*.log - /var/log/nginx/*.log - /var/log/apache2/*.log # 多行日志处理(Java 堆栈) multiline.pattern: '^[[:space:]]' multiline.negate: false multiline.match: after multiline.max_lines: 500 # JSON 日志解析 processors: - decode_json_fields: fields: ["message"] target: json overwrite_keys: true # 字段添加 fields: environment: production datacenter: dc1 fields_under_root: true # 忽略旧文件 ignore_older: 24h # 扫描频率 scan_frequency: 10s # 最大采集字节数 max_bytes: 10485760 ``` ### 常见应用日志格式 **Nginx Access Log**: ``` $remote_addr - $remote_user [$time_local] "$request" $status $body_bytes_sent "$http_referer" "$http_user_agent" 示例: 192.168.1.100 - - [12/Apr/2026:14:30:00 +0800] "GET /api/users HTTP/1.1" 200 1234 "-" "Mozilla/5.0" ``` **Apache Access Log**: ``` %h %l %u %t "%r" %>s %b "%{Referer}i" "%{User-Agent}i" 示例: 192.168.1.100 - admin [12/Apr/2026:14:30:00 +0800] "POST /login HTTP/1.1" 302 512 "https://example.com" "Mozilla/5.0" ``` **Tomcat Access Log**: ``` pattern="%h %l %u %t "%r" %s %b "%{Referer}i" "%{User-Agent}i"" ``` --- ## 数据库日志采集 ### MySQL 日志采集 **通用日志**: ```sql -- 启用通用查询日志 SET GLOBAL general_log = 'ON'; SET GLOBAL general_log_file = '/var/log/mysql/mysql.log'; -- 启用慢查询日志 SET GLOBAL slow_query_log = 'ON'; SET GLOBAL slow_query_log_file = '/var/log/mysql/slow.log'; SET GLOBAL long_query_time = 2; ``` **审计日志(MySQL Enterprise)**: ```sql -- 安装审计插件 INSTALL PLUGIN audit_log SONAME 'audit_log.so'; -- 配置审计 SET GLOBAL audit_log_policy = ALL; SET GLOBAL audit_log_format = JSON; ``` ### PostgreSQL 日志采集 **日志配置**: ```postgresql # postgresql.conf log_destination = 'stderr' logging_collector = on log_directory = '/var/log/postgresql' log_filename = 'postgresql-%Y-%m-%d_%H%M%S.log' # 记录内容 log_connections = on log_disconnections = on log_duration = on log_statement = 'all' log_line_prefix = '%t [%p]: [%l-1] user=%u,db=%d,app=%a,client=%h ' ``` ### Oracle 审计日志 **统一审计**: ```sql -- 创建审计策略 CREATE AUDIT POLICY security_audit_policy ACTIONS ALL ON HR.EMPLOYEES, ACTIONS LOGON, LOGOFF, ACTIONS CREATE USER, ALTER USER, DROP USER; -- 启用策略 AUDIT POLICY security_audit_policy; ``` --- ## 云环境日志采集 ### AWS 日志采集架构 ``` ┌─────────────────────────────────────────────────────────────┐ │ AWS 环境 │ │ │ │ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │ │ │ CloudTrail │ │ VPC Flow │ │ GuardDuty │ │ │ │ Logs │ │ Logs │ │ Findings │ │ │ └──────┬──────┘ └──────┬──────┘ └──────┬──────┘ │ │ │ │ │ │ │ └────────────────┼────────────────┘ │ │ │ │ │ ┌──────▼──────┐ │ │ │ S3 Bucket │ │ │ │ (Logs) │ │ │ └──────┬──────┘ │ │ │ │ └──────────────────────────┼──────────────────────────────────┘ │ ┌──────▼──────┐ │ Kinesis │ │ Firehose │ └──────┬──────┘ │ ┌──────▼──────┐ │ SIEM │ │ (外部) │ └─────────────┘ ``` ### Azure 日志采集 **Azure Monitor Logs**: ``` Azure 资源 → Azure Monitor → Log Analytics Workspace → SIEM 集成 ``` **诊断设置**: ```json { "properties": { "storageAccountId": "/subscriptions/.../storageAccounts/logstorage", "serviceBusRuleId": "", "workspaceId": "/subscriptions/.../providers/microsoft.operationalinsights/workspaces/loganalytics", "logs": [ { "category": "AuditEvent", "enabled": true }, { "category": "SecurityEvent", "enabled": true } ] } } ``` --- ## 采集架构设计 ### 架构模式 **集中式采集**: - 所有日志直接发送到中央 SIEM - 简单,适合小规模 - 单点故障风险 **分层采集**: ``` 日志源 → 采集代理 → 日志聚合器 → SIEM ``` - 适合大规模部署 - 降低 SIEM 负载 - 提高可靠性 **区域采集**: ``` 区域 1: 日志源 → 区域采集器 ┐ 区域 2: 日志源 → 区域采集器 ├→ 中央 SIEM 区域 3: 日志源 → 区域采集器 ┘ ``` - 适合多地域 - 降低网络延迟 - 数据本地化 ### 可靠性设计 **缓冲机制**: - 采集代理本地缓冲 - 网络中断时暂存 - 恢复后补发 **重试机制**: - 发送失败自动重试 - 指数退避 - 最大重试次数 **监控告警**: - 采集延迟监控 - 日志量异常告警 - 采集器状态监控 --- ## 总结与思考 ### 核心要点回顾 1. **采集方法**:Syslog、Agent、API、文件采集各有适用场景 2. **Syslog**:网络设备标准,注意 UDP 可靠性问题 3. **Agent**:可靠功能强,Splunk UF 和 Elastic Beats 是主流 4. **API**:云服务和 SaaS 应用的主要采集方式 5. **文件采集**:应用日志常用,注意多行和 JSON 处理 6. **数据库**:审计日志对安全分析至关重要 7. **云环境**:利用云原生日志服务,设计合理架构 ### 深入思考 **采集的挑战** - 日志量爆炸式增长 - 格式多样化 - 实时性要求高 - 成本和存储压力 **最佳实践** - 优先采集安全相关日志 - 标准化日志格式 - 实施采集监控 - 定期审查采集覆盖 --- ## 参考资料 ### 学习资源 - **RFC 5424**: The Syslog Protocol - **NIST SP 800-92**: Guide to Computer Security Log Management - **CIS Benchmarks**: 日志配置基准 ### 工具资源 - **rsyslog**: https://www.rsyslog.com - **Elastic Beats**: https://www.elastic.co/beats - **Splunk UF**: https://www.splunk.com/en_us/download/universal-forwarder.html - **Fluentd**: https://www.fluentd.org ### 书籍推荐 - 《Logging with ELK Stack》 - 《Splunk Operational Intelligence Cookbook》 - 《Practical Log Analysis》 --- *Day 296 完成 | 日志采集技术详解 | 字数:约 14,000 字*
myh0st
2026年4月13日 23:21
分享文档
收藏文档
上一篇
下一篇
微信扫一扫
复制链接
手机扫一扫进行分享
复制链接
Markdown文件
分享
链接
类型
密码
更新密码