公开文集
0x01 SRC 资产管理系统
0x02 Web 漏洞案例库
0x03 小程序漏洞案例库
第一章:小程序渗透基础
1.1 微信小程序反编译与动态调试
1.2 微信小程序强制开启开发者模式
0x99 信息安全学习体系
01-网络安全基础
Day-001-TCP-IP协议栈安全分析
Day-002-DNS协议安全与DNS劫持攻防
Day-003-IPv6 安全基础与过渡
Day-004-HTTP-HTTPS协议深度解析
Day-005-网络嗅探与流量分析技术
Day-006-防火墙原理与配置实践
Day-007-网络地址转换 NAT 安全分析
Day-008-路由协议安全 RIP-OSPF-BGP
Day-009-VLAN 安全与 VLAN-Hopping
Day-010-无线网络基础与安全 802.11
Day-011-网络访问控制 802.1X-NAC
Day-012-网络分段与微隔离设计
Day-013-负载均衡器安全配置
Day-014-CDN安全与防护
Day-015-NTP安全
Day-016-DHCP安全与攻击防护
Day-017-ICMP协议安全分析
Day-018-网络协议模糊测试基础
Day-019-网络流量基线建立
Day-020-网络取证基础
Day-021-网络入侵检测系统 NIDS
Day-022-网络入侵防御系统 NIPS
Day-023-网络流量加密与解密
Day-024-网络协议逆向工程基础
Day-025-网络性能与安全权衡
Day-026-SDN 安全
Day-027-网络虚拟化安全
Day-028-网络欺骗技术
Day-029-网络威胁情报应用
Day-030-网络容量规划与安全
Day-031-网络安全架构设计实战
02-Web 安全
Day-032-OWASP-Top-10-2021详解
Day-033-SQL 注入原理与手工检测
Day-034-SQL注入进阶报错注入与盲注
Day-035-XSS跨站脚本攻击基础
Day-036-XSS 进阶绕过与利用
Day-037-XSS进阶绕过与利用
Day-038-CSRF 跨站请求伪造
Day-039-文件上传漏洞
Day-040-反序列化漏洞基础
Day-041-PHP反序列化深入
Day-042-Java反序列化深入
Day-043-SSTI 服务端模板注入
Day-044-文件包含漏洞 LFI-RFI
Day-045-命令注入漏洞
Day-046-XXE-XML 外部实体注入
Day-047-反序列化漏洞进阶
Day-048-API 安全基础
Day-049-API认证与授权安全
Day-050-API漏洞挖掘实战
Day-051-文件上传漏洞进阶
Day-052-反序列化漏洞实战
Day-053-Web 安全综合实战
Day-054-移动安全基础
Day-055-Android 应用安全测试
Day-056-iOS 应用安全测试
Day-057-移动应用综合实战
Day-058-云安全基础
Day-059-AWS 安全实战
Day-060-Azure 安全实战
Day-061-GCP 安全实战
Day-062-云安全综合实战
Day-063-容器安全基础
Day-064-Docker 安全实战
Day-065-Kubernetes 安全实战
Day-066-容器安全综合实战
Day-067-API 安全进阶
Day-068-服务端请求伪造 SSRF 深入
Day-069-文件上传漏洞进阶
Day-070-反序列化漏洞实战进阶
Day-071-业务逻辑漏洞深入
Day-072-前端安全深入
Day-073-Web 安全综合实战
Day-074-云安全进阶
Day-075-移动安全进阶
Day-076-API 安全进阶
Day-077-前端安全进阶
Day-078-业务逻辑漏洞进阶
Day-079-反序列化漏洞实战进阶
Day-080-文件上传漏洞实战进阶
Day-081-SSTI 服务端模板注入进阶
Day-082-XXE-XML 外部实体注入进阶
Day-083-SSRF 服务端请求伪造进阶
Day-084-命令注入漏洞进阶
Day-085-文件包含漏洞进阶
Day-086-反序列化漏洞实战进阶
Day-087-文件上传漏洞实战进阶
Day-088-SSTI 服务端模板注入实战进阶
Day-089-XXE-XML 外部实体注入实战进阶
Day-090-SSRF 服务端请求伪造实战进阶
Day-091-命令注入漏洞实战进阶
Day-092-Web 安全综合实战
Day-093-GraphQL 安全
Day-094-JWT 与 OAuth2 安全
03-系统安全
Day-095-系统监控与检测
Day-096-主机防火墙配置
Day-097-系统审计与合规
Day-098-Linux 系统安全进阶
Day-099-Windows 系统安全进阶
Day-100-容器安全进阶
Day-101-容器编排安全进阶
Day-102-Linux 内核安全
Day-103-Windows 内核安全
Day-104-系统安全总结与实战
Day-105-Linux 系统安全基础
Day-106-Windows 系统安全基础
Day-107-容器安全基础
Day-108-系统加固技术
Day-109-日志分析技术
Day-110-威胁狩猎技术
04-应用安全
Day-111-安全编码规范
Day-112-输入验证技术
Day-113-输出编码技术
Day-114-错误处理安全
Day-115-会话管理安全
Day-116-认证安全
Day-117-授权安全
Day-118-数据保护安全
Day-119-日志安全
Day-120-API 安全
Day-121-微服务安全
Day-122-新兴技术安全概论
Day-123-DevSecOps 流水线安全
Day-124-云原生安全架构
Day-125-API 安全最佳实践
Day-126-安全编码规范
Day-127-SDL 安全开发生命周期
Day-128-威胁建模实战
Day-129-安全需求分析
Day-130-安全架构设计
Day-131-安全编码实践Java
Day-132-安全编码实践Python
Day-133-代码审计方法论
Day-134-静态代码分析SAST
Day-135-动态应用测试DAST
Day-136-交互式测试IAST
Day-137-软件成分分析SCA
Day-138-依赖漏洞管理
Day-139-安全测试自动化
Day-140-漏洞管理与响应
Day-142-OWASP-Top10-2024 详解
Day-143-CWE-Top25 分析
Day-144-漏洞挖掘方法论
Day-145-模糊测试技术
Day-146-逆向工程基础
Day-147-漏洞利用开发基础
Day-148-漏洞复现与验证
Day-149-漏洞披露流程
Day-150-CVE 申请与管理
Day-151-漏洞赏金计划
Day-152-等保2.0详解
Day-153-GDPR 合规实践
Day-154-数据安全法解读
Day-155-个人信息保护法与合规指南
Day-156-个人信息保护法解读
Day-157-ISO-27001 信息安全管理体系
Day-158-SOC-2 合规与审计
Day-159-PCI-DSS 支付卡行业数据安全标准
Day-160-网络安全审查办法解读
Day-161-数据出境安全评估办法
Day-162-应用安全评估实战
Day-163-红蓝对抗演练
Day-164-安全应急响应
Day-165-安全运营中心建设
Day-166-应用安全总结与展望
05-密码学
Day-167-密码学基础
Day-168-对称加密算法详解
Day-169-非对称加密算法详解
Day-170-哈希函数与数字签名
Day-171-密钥管理与PKI
Day-172-TLS-SSL 协议详解
Day-173-国密算法详解
Day-174-认证与密钥协议
Day-175-随机数生成与熵源
Day-176-椭圆曲线密码学详解
Day-177-后量子密码学详解
Day-178-高级密码学主题
Day-179-密码学行业应用精选
Day-180-常用加密算法原理与实现
Day-181-密码学总结与展望
06-渗透测试
Day-183-渗透测试方法论
Day-184-信息收集技术详解
Day-185-漏洞扫描技术详解
Day-186-漏洞利用技术详解
Day-187-渗透测试中的漏洞利用框架
Day-188-漏洞利用框架与 Metasploit 深入
Day-189-渗透测试中的 WAF 绕过技术
Day-190-渗透测试中的模糊测试技术
Day-191-渗透测试中的代码审计与静态分析
Day-192-渗透测试中的密码哈希破解技术
Day-193-渗透测试报告编写指南
Day-194-Web 应用渗透测试
Day-195-渗透测试中的 API 安全测试
Day-196-渗透测试中的 GraphQL 安全测试
Day-197-渗透测试中的前后端分离应用测试
Day-198-渗透测试中的小程序安全测试
Day-199-渗透测试中的浏览器安全测试
Day-200-OAuth-SSO安全测试
Day-201-渗透测试中的业务逻辑漏洞测试
Day-202-渗透测试中的厚客户端安全测试
Day-203-渗透测试综合实战演练
Day-204-内网渗透技术详解
Day-205-渗透测试中的内网信息收集进阶
Day-206-渗透测试中的域森林渗透技术
Day-207-渗透测试中的权限维持技术
Day-208-渗透测试中的横向移动技术
Day-209-渗透测试中的痕迹清理与反取证技术
Day-210-渗透测试中的数据窃取与 Exfiltration 技术
Day-211-渗透测试中的内部威胁与数据泄露测试
Day-212-渗透测试中的物理安全渗透
Day-213-社会工程学攻击技术
Day-214-移动应用渗透测试
Day-215-云安全渗透测试
Day-216-渗透测试中的容器与 Kubernetes 安全渗透
Day-217-渗透测试中的 Serverless 安全测试
Day-218-渗透测试中的微服务安全测试
Day-219-物联网安全渗透测试
Day-220-工业控制系统安全渗透测试
Day-221-无线网络安全渗透测试
Day-222-数据库安全渗透测试
Day-223-渗透测试中的供应链安全测试
Day-224-红队演练技术详解
Day-225-渗透测试中的红队基础设施搭建
Day-226-渗透测试中的威胁情报与狩猎
Day-227-渗透测试中的综合指纹识别技术
Day-228-自动化渗透测试技术
Day-229-渗透测试中的运维安全测试
Day-230-渗透测试中的区块链与智能合约安全测试
Day-231-渗透测试中的漏洞管理与修复验证
Day-232-渗透测试法律与合规
Day-233-后渗透攻击技术详解
Day-234-渗透测试中的人工智能应用
Day-235-漏洞利用开发深入
Day-236-云原生渗透测试深入
07-应急响应
Day-237-应急响应概述与核心概念
Day-238-应急响应流程框架
Day-239-CSIRT 团队组建与职责分工
Day-240-应急响应工具包准备
Day-241-应急响应法律与合规要求
Day-242-安全事件检测方法与指标
Day-243-云原生应急响应
Day-244-日志收集与分析技术
Day-245-网络流量分析与异常识别
Day-246-自动化响应与 SOAR
Day-247-端点监控与 EDR 技术
Day-248-威胁狩猎方法论
Day-249-威胁情报在检测中的应用
Day-250-数字取证基础与证据链管理
Day-251-内存取证技术
Day-252-磁盘取证与文件恢复
Day-253-网络取证与数据包分析
Day-254-云环境与容器取证
Day-255-恶意代码静态分析技术
Day-256-恶意代码动态分析技术
Day-257-恶意代码行为分析方法
Day-258-逆向工程基础与工具
Day-259-沙箱技术与自动化分析
Day-260-事件隔离与遏制策略
Day-261-威胁根除与系统修复
Day-262-系统恢复与数据重建
Day-263-业务连续性计划
Day-264-事件复盘与经验总结
Day-265-APT 攻击事件复盘分析
Day-266-勒索软件事件响应实战
Day-267-数据泄露事件处置流程
Day-268-内部威胁调查与取证
Day-269-综合应急响应演练
08-安全运维
Day-270-安全运营中心 SOC 概述
Day-271-安全监控指标体系
Day-272-安全告警管理
Day-273-安全可视化与仪表盘
Day-274-监控工具选型
Day-275-日志采集技术
Day-276-日志标准化与解析
Day-277-日志存储与归档
Day-278-日志分析技术
Day-279-日志合规要求
Day-280-SIEM 架构与设计
Day-281-关联规则引擎
Day-282-高级关联分析
Day-283-UEBA 用户实体行为分析
Day-284-威胁狩猎
Day-285-SOAR 基础概念
Day-286-剧本设计
Day-287-自动化响应技术
Day-288-安全工具集成
Day-289-SOAR 度量与优化
Day-290-安全基线管理
Day-291-漏洞管理流程
Day-292-补丁管理策略
Day-293-变更安全管理
Day-294-合规审计技术
Day-295-7x24 安全运营
Day-296-安全事件管理流程
Day-297-安全运营度量体系
Day-298-持续改进机制
Day-299-安全运维综合演练
Day-300-云原生安全运营
Day-301-AI 与机器学习安全运营
Day-302-安全自动化脚本实战
09-移动安全
Day-303-移动安全威胁概述
Day-304-移动设备安全架构
Day-305-移动操作系统安全模型
Day-306-移动应用权限管理
Day-307-移动端数据加密
Day-308-330-Android 安全合集
Day-309-Android 安全架构
Day-310-Android 组件安全
Day-311-Android 权限与隐私
Day-312-Android 逆向工程
Day-313-Android 应用加固
Day-314-iOS 安全架构
Day-315-iOS 应用沙盒机制
Day-316-越狱与反越狱
Day-317-iOS 逆向工程
Day-318-iOS 企业分发安全
Day-319-移动安全开发生命周期
Day-320-移动应用安全测试
Day-321-移动应用加固技术
Day-322-移动威胁防护
Day-323-移动安全合规
10-云安全
Day-324-云计算安全模型
Day-325-责任共担模型
Day-326-云安全威胁模型
Day-327-云安全合规框架
Day-328-云安全架构设计
Day-329-AWS IAM 安全
Day-330-AWS 网络安全
Day-331-AWS 存储安全
Day-332-AWS 安全监控
Day-333-AWS 安全最佳实践
Day-334-Azure AD 安全
Day-335-Azure 网络安全
Day-336-Azure 存储安全
Day-337-Azure 安全中心
Day-338-Azure 安全最佳实践
Day-339-容器安全基础
Day-340-Kubernetes 安全
Day-341-Serverless 安全
Day-342-云原生 DevSecOps
Day-343-云安全态势管理 CSPM
11-物联网工控
Day-344-物联网安全概述
Day-345-IoT 通信协议安全
Day-346-IoT 设备安全
Day-347-IoT 平台安全
Day-348-IoT 应用安全
Day-349-工业控制系统概述
Day-350-工控协议安全
Day-351-PLC 安全
Day-352-SCADA 系统安全
Day-353-工控安全防护
12-综合与总结
Day-354-安全职业发展路径
Day-355-安全技术趋势展望
Day-356-安全建设方法论
Day-357-经典攻防案例复盘
Day-358-安全学习资源指南
Day-359-信息安全行业求职指南
-
+
首页
Day-276-日志标准化与解析
# Day 297: 日志标准化与解析 - CEF/LEEF/自定义解析规则 > 安全运维系列第 7 天 | 预计阅读时间:25 分钟 | 难度:★★★☆☆ --- ## 清单 目录 1. [日志标准化概述](#日志标准化概述) 2. [通用日志格式](#通用日志格式) 3. [CEF 格式详解](#cef-格式详解) 4. [LEEF 格式详解](#leef-格式详解) 5. [自定义解析规则](#自定义解析规则) 6. [解析引擎技术](#解析引擎技术) 7. [标准化实践](#标准化实践) 8. [总结与思考](#总结与思考) 9. [参考资料](#参考资料) --- ## 日志标准化概述 ### 为什么需要标准化 **问题背景**: - 不同厂商日志格式各异 - 同一厂商不同产品格式不同 - 字段命名和含义不统一 - 时间格式多样化 **标准化价值**: - 统一分析基础 - 简化关联规则 - 提高分析效率 - 降低运维成本 ### 标准化层次 **字段级标准化**: - 统一字段命名(src_ip → srcIp) - 统一数据类型(IP、端口、时间戳) - 统一枚举值(事件类型、严重性) **语义级标准化**: - 统一事件分类 - 统一动作语义 - 统一对象类型 **架构级标准化**: - 采用标准格式(CEF、LEEF、ECS) - 遵循行业规范 --- ## 通用日志格式 ### CEF (Common Event Format) **定义**:ArcSight 开发的通用事件格式,被广泛支持。 **格式结构**: ``` CEF:Version|Device Vendor|Device Product|Device Version|Device Event Class ID|Name|Severity|Extension ``` **字段说明**: | 字段 | 说明 | 示例 | |------|------|------| | Version | CEF 版本 | 0 | | Device Vendor | 设备厂商 | Symantec | | Device Product | 设备产品 | IDS | | Device Version | 设备版本 | 1.0 | | Device Event Class ID | 事件类 ID | 100 | | Name | 事件名称 | SSH Login Attempt | | Severity | 严重性 (0-10) | 5 | | Extension | 扩展键值对 | src=192.168.1.1 dst=10.0.0.1 | **示例**: ``` CEF:0|Symantec|IDS|1.0|100|SSH Login Attempt|5|src=192.168.1.100 dst=10.0.0.50 spt=54321 dpt=22 cn1=1 cn1Label=Attempts rt=1649772600000 ``` ### LEEF (Log Event Extended Format) **定义**:IBM QRadar 开发的日志扩展格式。 **格式结构**: ``` LEEF:Version|Vendor|Product|Version|EventID|cat=...devname=...src=...dst=... ``` **示例**: ``` LEEF:2.0|Microsoft|Windows|10|4624|cat=Authentication devname=DC01 src=192.168.1.100 dst=10.0.0.50 usr=admin ``` ### ECS (Elastic Common Schema) **定义**:Elastic 开发的通用日志模式。 **核心字段**: ```json { "@timestamp": "2026-04-12T14:30:00.000Z", "agent": { "hostname": "server01", "version": "8.0.0" }, "source": { "ip": "192.168.1.100", "port": 54321, "address": "192.168.1.100" }, "destination": { "ip": "10.0.0.50", "port": 22 }, "user": { "name": "admin", "id": "1000" }, "event": { "action": "login", "category": "authentication", "type": "start", "severity": 3 } } ``` --- ## CEF 格式详解 ### 扩展字段规范 **标准扩展字段**: | 字段 | 说明 | 类型 | |------|------|------| | rt | 接收时间 | 时间戳 | | src | 源 IP | IP 地址 | | spt | 源端口 | 端口号 | | dst | 目的 IP | IP 地址 | | dpt | 目的端口 | 端口号 | | suser | 源用户名 | 字符串 | | duser | 目的用户名 | 字符串 | | act | 动作 | 字符串 | | msg | 消息 | 字符串 | | cn1/cn2/cn3 | 自定义数字 | 数字 | | cs1/cs2/cs3 | 自定义字符串 | 字符串 | **自定义字段**: ``` 任意键值对,格式:key=value 多个字段用空格分隔 特殊字符需要转义 ``` ### CEF 解析规则 **正则表达式**: ```regex ^CEF:(\d+)\|([^|]+)\|([^|]+)\|([^|]+)\|([^|]+)\|([^|]+)\|(\d+)\|(.*)$ ``` **解析示例(Python)**: ```python import re def parse_cef(cef_string): pattern = r'^CEF:(\d+)\|([^|]+)\|([^|]+)\|([^|]+)\|([^|]+)\|([^|]+)\|(\d+)\|(.*)$' match = re.match(pattern, cef_string) if not match: return None groups = match.groups() event = { 'version': groups[0], 'device_vendor': groups[1], 'device_product': groups[2], 'device_version': groups[3], 'event_class_id': groups[4], 'name': groups[5], 'severity': int(groups[6]), 'extension': parse_extension(groups[7]) } return event def parse_extension(ext_string): # 解析键值对,处理转义字符 ext = {} # 简化实现,实际需要考虑转义 pairs = ext_string.split() for pair in pairs: if '=' in pair: key, value = pair.split('=', 1) ext[key] = value return ext ``` --- ## LEEF 格式详解 ### 属性字段 **必需字段**: - cat: 类别 - devname: 设备名称 **常用字段**: | 字段 | 说明 | |------|------| | src | 源 IP | | dst | 目的 IP | | sPort | 源端口 | | dPort | 目的端口 | | usrName | 用户名 | | severity | 严重性 | | desc | 描述 | ### LEEF 解析示例 ```python def parse_leef(leef_string): lines = leef_string.split('\t') header = lines[0].split('|') event = { 'version': header[0].replace('LEEF:', ''), 'vendor': header[1], 'product': header[2], 'version': header[3], 'event_id': header[4], 'attributes': {} } # 解析属性 for line in lines[1:]: if '=' in line: key, value = line.split('=', 1) event['attributes'][key] = value return event ``` --- ## 自定义解析规则 ### Grok 模式 **Grok 语法**: ``` %{PATTERN:field_name} %{PATTERN:field_name:datatype} ``` **常用模式**: ``` IP: 匹配 IP 地址 NUMBER: 匹配数字 WORD: 匹配单词 DATA: 匹配任意数据 TIMESTAMP_ISO8601: 匹配 ISO 时间戳 USER: 匹配用户名 ``` **示例**: ```grok # Apache Access Log %{IPORHOST:clientip} %{USER:ident} %{USER:auth} \[%{HTTPDATE:timestamp}\] "%{WORD:verb} %{DATA:request} HTTP/%{NUMBER:httpversion}" %{NUMBER:response} %{NUMBER:bytes} # Syslog %{SYSLOGTIMESTAMP:timestamp} %{SYSLOGHOST:hostname} %{DATA:program}(?:\[%{POSINT:pid}\])?: %{GREEDYDATA:message} ``` ### Logstash 解析配置 ```ruby filter { # Apache 日志解析 if [log_type] == "apache" { grok { match => { "message" => '%{IPORHOST:clientip} %{USER:ident} %{USER:auth} \[%{HTTPDATE:timestamp}\] "%{WORD:verb} %{DATA:request} HTTP/%{NUMBER:httpversion}" %{NUMBER:response} %{NUMBER:bytes}' } } date { match => [ "timestamp", "dd/MMM/yyyy:HH:mm:ss Z" ] target => "@timestamp" } } # Syslog 解析 if [log_type] == "syslog" { grok { match => { "message" => '%{SYSLOGTIMESTAMP:syslog_timestamp} %{SYSLOGHOST:syslog_hostname} %{DATA:syslog_program}(?:\[%{POSINT:syslog_pid}\])?: %{GREEDYDATA:syslog_message}' } } } # 标准化字段 if [clientip] { mutate { rename => { "clientip" => "src_ip" } } } # 添加标准字段 mutate { add_field => { "event_category" => "web" "datacenter" => "dc1" } } } ``` ### Fluentd 解析配置 ```xml <parse> @type regexp expression /^(?<time>\d{4}-\d{2}-\d{2} \d{2}:\d{2}:\d{2}) \[(?<level>\w+)\] (?<message>.*)$/ time_format %Y-%m-%d %H:%M:%S </parse> # JSON 解析 <parse> @type json time_key timestamp time_format %Y-%m-%dT%H:%M:%S.%LZ </parse> ``` --- ## 解析引擎技术 ### 正则表达式引擎 **性能考虑**: - 预编译正则表达式 - 避免贪婪匹配 - 使用原子组 - 减少回溯 **优化示例**: ```regex # 低效:大量回溯 .*(\d{3}).* # 高效:精确匹配 [^\d]*(\d{3}) ``` ### 多行日志处理 **问题**:Java 堆栈、长日志跨多行 **解决方案**: ```yaml # Filebeat 多行配置 multiline.pattern: '^[[:space:]]' multiline.negate: false multiline.match: after multiline.max_lines: 500 # Logstash 多行 filter { multiline { pattern => "^[[:space:]]" negate => false what => "previous" } } ``` ### JSON 日志解析 **自动检测**: ```javascript // 检测并解析 JSON if (message.startsWith('{')) { try { const parsed = JSON.parse(message); event.fields = parsed; } catch (e) { // 解析失败,保持原始消息 } } ``` **嵌套 JSON 处理**: ```ruby filter { json { source => "message" target => "json" } # 扁平化嵌套字段 mutate { rename => { "[json][user][name]" => "user_name" "[json][user][id]" => "user_id" } } } ``` --- ## 标准化实践 ### 字段映射表 **源字段 → 标准字段**: | 源字段 | 标准字段 | 说明 | |--------|----------|------| | src_ip, source_ip, srcIp | src.ip | 源 IP | | dst_ip, dest_ip, dstIp | dst.ip | 目的 IP | | src_port, source_port | src.port | 源端口 | | dst_port, dest_port | dst.port | 目的端口 | | user, username, usr | user.name | 用户名 | | timestamp, time, @timestamp | @timestamp | 时间戳 | | severity, sev, priority | event.severity | 严重性 | ### 标准化流程 ``` 原始日志 → 解析 → 字段映射 → 数据验证 → 标准化输出 ``` **实施步骤**: 1. 识别日志源和格式 2. 定义解析规则 3. 创建字段映射 4. 实施数据验证 5. 测试和验证 6. 部署和监控 ### 质量检查 **完整性检查**: - 必需字段是否存在 - 字段类型是否正确 - 枚举值是否合法 **一致性检查**: - IP 地址格式 - 时间戳格式 - 端口范围 **示例检查规则**: ```python def validate_event(event): errors = [] # 检查必需字段 required_fields = ['@timestamp', 'src.ip', 'dst.ip'] for field in required_fields: if field not in event: errors.append(f"Missing required field: {field}") # 检查 IP 格式 import ipaddress for ip_field in ['src.ip', 'dst.ip']: if ip_field in event: try: ipaddress.ip_address(event[ip_field]) except ValueError: errors.append(f"Invalid IP format: {ip_field}") # 检查端口范围 for port_field in ['src.port', 'dst.port']: if port_field in event: port = event[port_field] if not (0 <= port <= 65535): errors.append(f"Port out of range: {port_field}") return errors ``` --- ## 总结与思考 ### 核心要点回顾 1. **标准化必要性**:统一分析基础,简化关联规则 2. **通用格式**:CEF、LEEF、ECS 是主流标准 3. **CEF 格式**:ArcSight 开发,被广泛支持 4. **LEEF 格式**:IBM QRadar 使用 5. **ECS**:Elastic 开发的现代 schema 6. **解析技术**:Grok、正则、JSON 解析 7. **质量检查**:完整性、一致性验证 ### 深入思考 **标准化的挑战** - 厂商私有格式 - 格式频繁变更 - 性能与灵活性平衡 **最佳实践** - 优先采用标准格式 - 建立字段映射文档 - 实施解析质量监控 - 定期审查和更新 --- ## 参考资料 ### 学习资源 - **CEF Reference Guide**: ArcSight CEF 格式参考 - **Elastic Common Schema**: https://www.elastic.co/guide/en/ecs/current/index.html - **Grok Patterns**: https://github.com/logstash-plugins/logstash-patterns-core ### 工具资源 - **Logstash**: https://www.elastic.co/logstash - **Fluentd**: https://www.fluentd.org - **Grok Debugger**: https://grokdebugger.com --- *Day 297 完成 | 日志标准化与解析详解 | 字数:约 10,000 字*
myh0st
2026年4月13日 23:21
分享文档
收藏文档
上一篇
下一篇
微信扫一扫
复制链接
手机扫一扫进行分享
复制链接
Markdown文件
分享
链接
类型
密码
更新密码