检测到您当前使用浏览器版本过于老旧,会导致无法正常浏览网站;请您使用电脑里的其他浏览器如:360、QQ、搜狗浏览器的极速模式浏览,或者使用谷歌、火狐等浏览器。

下载Firefox

清华大学彭镜夫、吴宇楠助理教授,曲阜师范大学王明秋教授到院开展学术讲座

2025-11-21

2025年11月12日下午,清华大学丘成桐数学中心彭镜夫、吴宇楠助理教授,曲阜师范大学王明秋教授受邀访问中国人民大学。彭镜夫开展了主题为“On damage of interpolation to adversarial robustness”的讲座,主要探讨深度神经网络中的“插值训练”与“对抗鲁棒性”;吴宇楠开展了主题为“Optimizing policy decisions in interconnected populations: A spatially-dependent framework for dynamic decision-making”的讲座,主要探讨空间网络数据中的动态决策方法;王明秋开展了主题为“Robust Random Perturbation Subsampling Based on Minimum Distance Kernel Estimation for Big Data Linear Regression”的讲座,主要探讨海量数据下的随机扰动子抽样新方法。本次讲座由统计与大数据研究院杨松山预聘副教授主持。

79aa6d392a5302ce20aed83b5ee753dd.jpg

彭镜夫首先指出线性模型与基于再生核希尔伯特空间方法中广泛存在的风险曲线双下降现象,以及最小范数插值估计量的良性过拟合。其次,从非参数回归视角系统揭示“插值训练”与“对抗鲁棒性”之间的内在冲突,尽管深度神经网络常通过完美拟合训练数据实现优异泛化性能,但是研究表明,高度插值将显著削弱模型抵御对抗攻击的能力。彭镜夫的研究构建了一个覆盖赫尔德函数类的统一分析框架,并推导了最小最大化的下界形式,以及对抗风险的上界形式。根据插值程度的高低,彭镜夫给出了下界与上界的收敛速率,并发现高插值机制下出现的“小样本诅咒”现象——即增加样本反而可能损害模型鲁棒性。理论分析进一步指出,在高度插值约束下,任何估计器均无法达到无约束情形下的最小最大对抗收敛速率,从而从算法无关视角解释了为何追求零训练误差的深度神经网络在对抗环境中必然次优。实验部分通过在合成数据与Auto MPG数据集上对比局部多项式、近邻插值与最小范数神经网络等多种方法,验证了理论推断的普适性。该研究为理解深度学习鲁棒性提供了新的理论范式,也为构建安全可靠的机器学习系统指明了改进方向。

c6f5be7d9f5b76a4dba79b804d757810.jpg

吴宇楠将互联群体引入动态决策过程的研究中,突破传统政策评估中“个体间互不干扰”的理论局限,首次建立了融合空间依赖性的动态治疗方案理论框架。该研究针对疫情防控、区域经济干预等存在显著空间溢出效应的现实场景,以美国各州新冠期间学校关闭政策为实证案例,构建了包含空间自回归与Durbin项的多阶段决策模型,通过空间权重矩阵量化区域间交互影响,揭示政策在“公共卫生——经济活力”之间的动态权衡机制。理论方面,吴宇楠提出两阶段最优决策的闭式解,证明其估计量具有一致性与渐近正态性,并创新性地采用乘数自助法构建参数置信区间,克服传统方法在复杂依赖结构下的推断难题。在48个美国州的真实数据验证中,该框架将政策匹配率提升约12%,且复合目标函数值显著优于忽略空间效应的传统方法。该研究为精准公共卫生、区域经济治理等场景提供了兼具理论严谨性与实践可操作性的决策支持工具,开创了空间依赖环境下政策优化的新范式。

6dacb6931699a0f5bf811be04d768d47.jpg

王明秋针对海量数据下传统稳健估计方法计算成本高昂的瓶颈,创新性地将最小距离核估计与随机扰动机制相结合,提出了兼具计算效率与推断稳健性的子抽样新范式。该研究突破现有子抽样方法对异常值与高杠杆点敏感的限制,通过设计乘积权重与加性权重两种扰动策略,在无需计算全样本抽样概率的前提下,成功将最小距离核估计的鲁棒性融入大数据分析场景。理论层面,王明秋严格证明了两种加权估计量的一致性与渐近正态性,并揭示加性权重算法具有更优的统计效率。在多重仿真场景与实证分析中,该方法在保持对数据异常场景强鲁棒性的同时,显著降低了计算内存与时间消耗,为高维数据、金融风控等需要兼顾效率与稳健性的实际场景提供了理论严谨、实施便捷的解决方案。这一成果标志着大数据稳健统计推断研究取得重要突破,为应对当代数据科学中的规模和稳健性权衡难题提供了新的方法论支撑。

196f7e79329a2863e674c20fd160e48a.jpg

讲座结束后,与会师生纷纷表示受益良多。本次讲座拓展了师生们在深度学习鲁棒性、动态治疗方案和大数据统计推断领域的前沿学术视野,进一步激发了同学们研究统计问题的热情。未来研究院将持续邀请海内外专家学者开展高水平学术讲座,持续打造研究院在统计与大数据领域的学术品牌影响力,为推动统计学科发展贡献更多力量。