2026-03-26 组会:实验矩阵设计
1. 实验目标
本文实验围绕四个核心问题展开:
- RQ1 可注入性:客户端侧 XON/XOFF 控制是否能够稳定诱导 HS 到 Guard 的特征流量。
- RQ2 可识别性:攻击者在 Guard 侧是否能够准确识别目标水印。
- RQ3 并发可区分性:在多个客户端同时访问同一 HS 时,攻击者是否仍能定位目标连接。
- RQ4 防御有效性:现有或设计中的防御机制能否识别、削弱或抹平该水印。
2. 总体实验划分
| 模块 | 名称 | 目标 |
|---|---|---|
| A | 水印注入能力验证 | 证明客户端可以稳定调制 HS 到 Guard 的发送速率 |
| B | 短时流量识别实验 | 证明在小文件和短窗口下仍可识别水印 |
| C | 长时流量识别实验 | 证明在大文件和长下载下加入水印不会被HS识别 |
| D | 并发访问识别实验 | 证明在多客户端同时访问同一 HS 时仍能定位目标连接 |
| E | 参数敏感性实验 | 研究周期、幅度、XOFF 时长等参数对识别性能的影响 |
| F | 边界与最小可检测条件实验 | 找出最弱水印、最短观测时间和最大并发容忍度 |
| G | 消融实验 | 验证各设计组件的必要性 |
| H | 防御机制识别与抑制实验 | 测试防御侧能否检测或削弱该水印 |
| I | 开销与实用性实验 | 评估吞吐损失、时延增加和可部署性 |
3. 统一实验变量
3.1 文件大小
| 场景 | 文件大小 |
|---|---|
| 短时 | 500KB, 1MB, 5MB, 10MB, 20MB |
| 长时 | 50MB, 100MB, 500MB, 1000MB |
3.2 水印模式
| 模式编号 | 名称 | 描述 |
|---|---|---|
| M0 | Baseline | 不注入水印,正常下载 |
| M1 | XOFF-XON 脉冲 | 先阻塞再恢复,形成脉冲特征 |
| M2 | 低速 XON | 通过压低 advisory rate 形成低速特征 |
| M3 | 方波 33% | 周期性高低速切换,幅度 33% |
| M4 | 方波 50% | 周期性高低速切换,幅度 50% |
| M5 | 方波 75% | 周期性高低速切换,幅度 75% |
| M6 | 梯度递增 | 速率按时间分段上升 |
| M7 | 伪随机序列 | 按预定义二进制序列切换速率 |
3.3 并发规模
| 并发客户端数 |
|---|
| 1, 2, 4, 8, 16 |
3.4 观测窗口
| 窗口长度 |
|---|
| 5s, 10s, 20s, 30s, 60s, full |
4. 核心评价指标
| 类别 | 指标 |
|---|---|
| 调制能力 | 平均吞吐率、峰值、谷值、高低速差、模板相关系数、调制成功率 |
| 二分类识别 | Accuracy, Precision, Recall, F1, FPR, FNR, AUC |
| 多分类识别 | Accuracy, Macro-F1, 混淆矩阵 |
| 并发识别 | 命中率, 误报率 |
| 时效性 | 最小观测时长、平均检测时延 |
| 开销 | 吞吐率损失、下载完成时间增加比例 |
| 鲁棒性 | 跨轮次方差、跨参数稳定性、最大可承受并发 |
5. 主实验矩阵
A. 水印注入能力验证
| 实验编号 | 实验名称 | 自变量 | 因变量 | 目的 |
|---|---|---|---|---|
| A1 | 不同模式的吞吐时间序列验证 | 文件大小, 水印模式 | 吞吐率曲线, 高低速差, 周期稳定性 | 验证不同模式是否能在 Guard 侧形成预期流量结构 |
| A2 | 多轮重复下的平均波形实验 | 水印模式, 重复轮次 | 平均波形, 方差 | 验证模式是否具有重复性 |
| A3 | 调制成功率实验 | 文件大小, 水印模式 | 调制成功率 | 定量评估注入成功概率 |
| A4 | 模板相关性实验 | 水印模式 | Pearson 相关系数, DTW 距离 | 量化目标模板与实测流量的一致程度 |
B. 短时流量识别实验
| 实验编号 | 实验名称 | 自变量 | 因变量 | 目的 |
|---|---|---|---|---|
| B1 | 不同小文件大小下的识别实验 | 文件大小, 水印模式 | Accuracy, Precision, Recall, F1 | 验证短时下载中是否可识别水印 |
| B2 | 不同观测窗口下的早期检测实验 | 观测窗口, 水印模式 | F1, 检测时延 | 找到完成可靠检测所需的最短时间 |
C. 长时流量识别实验
| 实验编号 | 实验名称 | 自变量 | 因变量 | 目的 |
|---|---|---|---|---|
| C1 | 不同大文件大小下的识别实验 | 文件大小, 水印模式 | Accuracy, Macro-F1 | 验证长时下载中识别性能 |
| C2 | 不同观测长度下的识别实验 | 观测窗口 | Accuracy, F1 | 分析长时观测对识别性能的提升 |
| C3 | 长时稳定性实验 | 时间段, 水印模式 | 高低速差, 后半段 F1 | 验证模式是否随时间漂移或衰减 |
| C4 | 多模式多分类识别实验 | 水印模式 | Accuracy, Macro-F1, 混淆矩阵 | 验证不同模式之间是否可区分 |
D. 目标 HS 定位实验
| 实验编号 | 实验名称 | 自变量 | 因变量 | 目的 |
|---|---|---|---|---|
| D1 | 单目标 HS 多背景定位实验 | 候选流数量, 背景类型 | MRR, FPR | 在多个 Guard 侧候选流量中定位目标 HS |
| D2 | 高并发背景下的目标 HS 排序实验 | 候选流数量, 背景类型 | Mean Rank | 分析背景流量增加时目标 HS 排名如何退化 |
6. 增强实验矩阵
E. 参数敏感性实验
| 实验编号 | 实验名称 | 自变量 | 因变量 | 目的 |
|---|---|---|---|---|
| E1 | 周期长度敏感性实验 | 周期 0.5s, 1s, 2s, 5s, 10s | F1, 检测时延 | 分析周期长度对识别性能的影响 |
| E2 | 调制幅度敏感性实验 | 高低速差 30%, 50%, 70% | F1, AUC | 找到最合适的幅度区间 |
| E3 | XOFF 持续时间敏感性实验 | 1s, 2s | F1, 吞吐损失 | 分析阻塞时长对识别性与开销的影响 |
| E4 | advisory rate 强度实验 | 80, 100, 150, 200, 300 KB/s | F1, 平均吞吐率 | 分析速率建议强度的影响 |
F. 边界实验
| 实验编号 | 实验名称 | 自变量 | 因变量 | 目的 |
|---|---|---|---|---|
| F1 | 最小可检测幅度实验 | 幅度逐渐减小 | 达到目标 F1 所需最小幅度 | 找到最弱可识别水印 |
| F2 | 最小观测时长实验 | 观测窗口逐渐增加 | 达到目标 Accuracy 所需最短时间 | 评估最短检测时间 |
| F3 | 最大可承受并发实验 | 并发数逐渐增加 | Top-1, F1 | 找到识别明显失效的并发边界 |
G. 消融实验
| 实验编号 | 实验名称 | 对比项 | 因变量 | 目的 |
|---|---|---|---|---|
| G1 | 去掉 XOFF 的消融实验 | 仅 XON vs XOFF+XON | F1, Top-1 | 验证 XOFF 是否带来额外区分度 |
| G2 | 去掉周期结构的消融实验 | 恒定低速 vs 周期模式 | Accuracy, F1 | 验证时间结构是否关键 |
| G3 | 去掉预处理的消融实验 | 有预处理 vs 无预处理 | Accuracy, F1 | 验证预处理对检测性能的贡献 |
