检测到您当前使用浏览器版本过于老旧,会导致无法正常浏览网站;请您使用电脑里的其他浏览器如:360、QQ、搜狗浏览器的极速模式浏览,或者使用谷歌、火狐等浏览器。

下载Firefox

我院博士生陈楷和张宇谦助理教授合作发表高水平论文

2025-09-28

我院2022级博士研究生陈楷在导师张宇谦助理教授指导下完成的论文“Semi-supervised linear regression: enhancing efficiency and robustness in high dimensions”已被国际统计学期刊Biometrics接收发表。

论文概述

在半监督学习中,主流观点认为,仅在模型误设时,额外的无标记样本才可能提升线性参数的估计精度。本文对这一观点提出挑战,并表明在高维情形下,无标记样本同样能够提供增益。本文首先聚焦于稠密场景,提出了一种稳健的半监督回归系数估计方法,该方法不依赖回归系数的稀疏结构。即便在真实模型为线性的情况下,本文论证了大规模无标记数据的使用仍然能够有效降低估计偏差,从而改进估计的准确性,并增强统计推断的稳健性。此外,针对回归系数稀疏的情形,我们进一步提出了更高效的半监督方法。大量数值实验结果验证了所提出方法的有效性与优越性。


image.png

作者简介

陈楷,中国人民大学统计与大数据研究院 2022 级直博生,研究方向为因果推断,高维统计分析。研究成果发表在Biometrics、Journal of Global Optimization期刊上。

image.png

张宇谦,中国人民大学统计与大数据研究院助理教授,博士生导师。2016年本科毕业于武汉大学,2022年博士毕业于美国加州大学圣地亚哥分校。主要研究方向包括因果推断、半监督学习、高维统计、机器学习、精准医疗等。文章发表于Annals of Statistics、Biometrika等期刊。主持国家自然科学基金青年基金项目,曾获2021年美国统计协会(ASA)非参数统计最佳学生论文奖、2025年泛华统计协会(ICSA)青年研究者奖。