科研进展 | 论文入选COLT 2026 | 我院张智恒CAUSAL实验室最新成果登学习理论顶会

发布时间：2026-05-08 浏览次数：11

近日，上海财经大学统计与数据科学学院张智恒老师团队的合作成果“Wasserstein Policy Learning for Distributional Outcomes”被COLT 2026接收。

COLT（Conference on Learning Theory）是机器学习理论方向公认录取难度最高的国际顶级会议之一，聚焦计算机科学、统计学与应用数学的交叉理论研究。在机器学习理论界具有重要学术影响力。该会议以评审标准严格、理论创新要求高著称，本次会议共收录 191/647 篇论文，其入选论文通常代表学习理论方向最前沿的国际研究进展。该论文由 Zhiheng Zhang（上海财经大学）与Yiyan Huang（大湾区大学）、Cheuk Hang Leung（香港城市大学）、Qi Wu（香港城市大学）共同完成，作者按字母序排列。

实验室简介

张智恒老师负责的CAUSAL Lab (https://zhzhang01.github.io) 致力于发展兼具理论基础与现实应用价值的因果推断方法，并推动其与现代学习算法和决策系统融合。除本次 COLT 2026 论文外，实验室团队近期有8 篇论文被 ICML 2026 接收，其中我院本科生梁婉婷、研究生王子妍、研究生杜玉玺均以独立一作身份中稿。相关研究涵盖因果策略学习、高效实验设计、社交网络干预、最优传输以及多模态大模型评测等方向，其中合作论文“Treatment Responder Classification with Abstention”被评为 Spotlight（前2.2%）。

这些成果体现出，近年来上海财经大学统计与数据科学学院持续推动统计学与人工智能的深度交叉融合，积极支持青年教师和学生面向国际学术前沿开展原创性研究，并取得初步成效。本次 COLT 论文接收以及近期多项 ICML 成果，反映了学院在统计理论、机器学习理论与人工智能方法研究方向上的持续积累，也标志着学院相关团队在高水平交叉研究中取得了新的进展。

研究背景

传统因果推断与策略学习通常将结果变量视为标量，例如平均收入、平均分数或平均疗效。但在许多现实场景中，决策者关心的不仅是平均值，而是结果的整体分布。例如，在医疗场景中，需要关注全天血糖波动与极端风险；在经济政策中，需要关注财富分布、不平等程度及尾部风险。

该论文关注这样一个问题：当个体潜在结果本身是一个概率分布时，如何学习最优个性化决策规则？研究将离线策略的学习与评估推广到分布型结果的情形，并采用Wasserstein barycenter（Wasserstein 重心）描述某一策略诱导出的“平均分布”。直观地说，如果把概率分布看作一堆可移动的“质量”，普通平均仅是简单叠加曲线；而 Wasserstein barycenter 关注质量从一个位置移动到另一个位置的方式，因此更适合描述分布型结果的平均形态。

核心技术与贡献

技术上，论文利用一维 Wasserstein 空间与分位函数空间之间的等距结构，将复杂的分布优化问题转化为对policy-indexed mean quantile curves的估计问题。进一步地，作者构造了IPW和cross-fitted Doubly Robust（DR）两类估计器，并通过单调重排确保估计结果仍为合法分位函数。

论文的主要理论贡献是建立了分布型结果下 policy learning 的有限样本 regret 上界。研究证明，在适当条件下，其 regret 主导项由样本量与策略类的Natarajan dimension决定。该速率与传统标量结果下的策略学习保持同阶。同时，论文还给出了匹配的极小极大下界，证明该速率在样本量和策略类复杂度的依赖上是最优的。

这一结果表明，虽然分布型结果本身是无限维对象，但通过 Wasserstein 几何和分位函数表示，可以在不牺牲统计效率的前提下，将传统策略学习推广到更丰富、更贴近现实的结果形式。简言之，结果从“一个数”走向“一个分布”，并不必然增加统计复杂度。