检测到您当前使用浏览器版本过于老旧,会导致无法正常浏览网站;请您使用电脑里的其他浏览器如:360、QQ、搜狗浏览器的极速模式浏览,或者使用谷歌、火狐等浏览器。

下载Firefox

统计与大数据研究院刘阳老师团队荣获美团科研合作“优秀探索奖”

2025-11-06

在美团科研合作部组织的2024–2025年度科研合作课题评优中,中国人民大学统计与大数据研究院刘阳老师带领的研究团队,凭借在履约场景A/B试验方法方面的创新性理论与实践突破,获得合作方高度评价,成功荣获“优秀探索奖”。

在美团履约平台,A/B试验是评估新旧调度算法性能表现的关键手段。相较于传统A/B试验,该场景的复杂性尤为突出,主要体现在三方面:

(1)样本规模受限与统计功效不足:受区域地理划分与在线试验窗口长度限制,实际试验可用样本量有限,导致效应估计方差较大,难以满足检验功效需求;

(2)协变量分布不均导致随机化效果不佳:不同区域业务相关特征存在显著异质性,且整体样本量有限,完全随机化易导致试验组与对照组协变量分布差异明显,影响处理效应估计;

(3)显著的溢出效应(spillover effect):调度算法具有区域间联动性,邻近区域的处理水平可能影响目标区域的响应变量,使因果推断依赖的稳定单位处理值假设(SUTVA)不再成立。


为应对上述挑战,研究团队创新性提出随机化试验设计与统计分析方案:

(1)一体化区域组拆分与协变量自适应随机化设计:基于马氏距离(Mahalanobis distance)构建多维协变量平衡度量,团队开发了一套结合区域划分、随机化分配与协变量平衡的整体设计流程。通过数据驱动算法确定最优区域数量,采用自适应随机化分配实现组间协变量平衡,显著提升小样本场景下的随机化分配效果;

(2)面向溢出效应的统计分析框架:团队基于业务特点构建具备溢出干扰的分析模型,通过协变量调整进一步提升估计精度,并构造用于处理效应统计推断的统计量。

目前,上述方法已在实际业务中完成A/B试验部署并通过上线验证。结果显示:在新试验设计下,处理效应估计方差下降超过50%,协变量平衡性显著增强,试验周期大幅缩短,结果与基线方案高度一致,充分验证了所提方法的正确性与有效性。该方法已被美团履约平台技术部采纳并进入上线应用阶段,成为美团在复杂业务环境下开展可信A/B试验的重要统计分析工具。


研究团队成员名单

22 级博士生:傅睿辰

23 级博士生:廖智勇

22 级硕士生:牟槿、徐子诚

23 级硕士生: 易昆、邓昊昱、郭鑫


项目负责人简介

刘阳,中国人民大学统计与大数据研究院助理教授,博士生导师。2014年本科毕业于中国人民大学,2022年博士毕业于乔治华盛顿大学,研究兴趣包括复杂场景下自适应试验设计与分析、临床试验、业界A/B试验等等。研究成果发表于AOS、JASA、JOE、JMLR以及AISTAT等国际一流学术刊物与会议。

美团科研合作部推送链接:https://mp.weixin.qq.com/s/UoUYaNAbJGxQu1kt0oNkYg