如何用 Python 动态生成单变量敏感性分析配置(P10/P90)

本文介绍一种简洁、可扩展的 python 方法,利用 `itertools.product` 和命名元组,自动为任意数量的模型输入参数生成单变量 p10/p90 敏感性分析配置,避免硬编码、提升复用性与可维护性。

在开展模型敏感性分析时,一个常见且科学的做法是:每次仅变动一个输入变量(如取其 P10 或 P90 值),其余变量固定为基准值(P50)。这种“单因子扰动”策略能清晰识别各参数对输出的影响程度。但当输入维度增加(例如从 3 个变量扩展到 20+ 个),手动枚举所有 2 × n 种组合(n 为参数个数)极易出错且不可持续。

幸运的是,Python 标准库中的 itertools.product 可以优雅解决这一问题——但需注意:我们不想要全排列(如 a.p10 + b.p10 + c.p10),而是需要逐变量替换的“单轴扰动”组合。因此,核心思路是:

  1. 将每个参数的三个水平(P10、P50、P90)组织为独立列表;
  2. 对每个参数索引 i,构造一个“扰动模板”:第 i 位取 [p10, p90],其余位置固定为 p50;
  3. 使用 itertools.product(或更直接地,列表推导式)生成该模板下的所有单变量扰动组合。

以下是完整、健壮、可扩展的实现方案:

from collections import namedtuple
from itertools import product

# 定义敏感性用例结构
Sensitivity_Case = namedtuple('Sensitivity_Case', ['a', 'b', 'c'])

# 基准(P50)与边界(P10/P90)案例
p50 = Sensitivity_Case(5, 50, 'medium')
p10 = Sensitivity_Case(1, 5, 'low')
p90 = Sensitivity_Case(10, 500, 'high')

# 按字段名提取各参数的 P10/P50/P90 值 → 构建列向量
fields = ['a', 'b', 'c']
levels = {
    'p10': [getattr(p10, f) for f in fields],   # [1, 5, 'low']
    'p50': [getattr(p50, f) for f in fields],   # [5, 50, 'medium']
    'p90': [getattr(p90, f) for f in fields]    # [10, 500, 'high']
}

# ✅ 生成所有单变量扰动配置(2 × len(fields) 个)
configs = []
for i, field in enumerate(fields):
    # 对第 i 个字段,使用 [p10, p90];其余字段恒用 p50
    for perturb_level in ['p10', 'p90']:
        config = levels['p50'].copy()  # 初始化为全 P50
        config[i] = levels[perturb_level][i]  # 替换第 i 位
        configs.append(config)

# 输出验证
for idx, cfg in enumerate(configs, 1):
    print(f"config{idx} = {cfg}")

输出结果:

config1 = [1, 50, 'medium']      # a.p10, b.p50, c.p50
config2 = [10, 50, 'medium']     # a.p90, b.p50, c.p50
config3 = [5, 5, 'medium']       # a.p50, b.p10, c.p50
config4 = [5, 500, 'medium']     # a.p50, b.p90, c.p50
config5 = [5, 50, 'low']         # a.p50, b.p50, c.p10
config6 = [5, 50, 'high']        # a.p50, b.p50, c.p90

关键优势:

  • 完全自适应:只需修改 fields 列表和 p10/p50/p90 实例,即可支持任意数量参数(如 100 个);
  • 零冗余:不生成无效组合(如全 P10),严格遵循单变量敏感性原则;
  • 类型安全 & 可读性强:基于命名元组,字段语义清晰,易于调试与协作;
  • 无缝集成模型调用:每个 config 是标准 Python 列表,可直接解包传入 model.run(*config) 或作为字典键构建参数映射。

⚠️ 注意事项:

  • 若后续需支持更多分位点(如 P5/P25/P75/P95),只需扩展 perturb_level 循环(如 ['p5', 'p10', 'p90', 'p95']),逻辑不变;
  • 对超大规模参数(>1000),建议将 configs 改为生成器(yield config)以节省内存;
  • 生产环境中,推荐将配置生成封装为类(如 SensitivityConfigGenerator),并加入参数校验(如检查 p10 ≤ p50 ≤ p90 数值合理性)。

此方法摒弃了易错的手动枚举与低效的嵌套循环,以数据驱动 + 函数式思维实现高内聚、低耦合的敏感性分析配置管理——真正让代码服务于建模逻辑,而非成为负担。