检测到您当前使用浏览器版本过于老旧,会导致无法正常浏览网站;请您使用电脑里的其他浏览器如:360、QQ、搜狗浏览器的极速模式浏览,或者使用谷歌、火狐等浏览器。

下载Firefox

我院多位博士生入选全国工业统计学教学研究会青年统计学家协会年会暨第三届统计理论及其应用国际研讨会博士生论坛

2025-04-23

2025年4月18日至20日,全国工业统计学教学研究会青年统计学家协会年会暨第三届统计理论及其应用国际研讨会在济南隆重召开。我院多名博士生成功入选博士生论坛,并进行报告和海报展示其最新的研究成果。

d5bc8929623747e72de575dbb51290e.jpg

全国工业统计学教学研究会青年统计学家协会2025年年会暨第三届统计理论及其应用国际研讨会致力于汇聚国内外统计学与数据科学领域的顶尖专家及青年才俊,探索学科前沿,共话创新未来。大会由全国工业统计学教学研究会青年统计学家协会主办,山东财经大学统计与数学学院承办,《统计理论及其应用》期刊与知名学术平台狗熊会共同协办。大会特邀多位海内外著名统计学家与杰出青年学者带来前瞻性的主题报告,邀请优秀青年统计学者开展深入研讨,并搭建青年统计人才与知名高校之间的高层次交流与合作平台。此外,大会特别设置博士生论坛,通过严格选拔,共有几十位来自全国各地的博士生围绕最新研究成果开展专题报告与学术海报展示,共享学术思想的交汇与碰撞。

6929137aaaac858a8d0ca371e922903.jpg

我院21级博士生辛家辉进行了题为“Inference under Covariate-Adaptive Randomization with Many Strata”的报告。

b653937edd94b9ea8972630ad069579.jpg

作者:辛家辉,刘汉中,马维

通讯作者:马维

论文概述

协变量自适应随机化广泛用于临床试验和发展经济学等研究中,以平衡基线协变量。现有文献主要关注固定层数下的推断问题,但在实际应用中,例如多中心临床试验,常常涉及大量层数,这对设计与推断带来挑战。本文提出了一套通用的推断框架,扩展了Bugni et al. (2018, 2019) 关于固定层数的理论,允许层数随样本量增长。我们进一步提出一种新的加权回归调整方法,可提升估计效率,并开发了适用于极多层数情形的实用算法。此外,我们强调了设计平衡与推断稳健性的联系,突出了分层区组随机化在提升层内协变量平衡性方面的优势。本文系统探讨了从固定到发散甚至极大量层数下的协变量自适应随机化推断问题。

我院24级博士生林俊一进行了题为“Sparsification Subsampling for Partial Least Squares Regression”的报告。

f541a811f4e6216e61c23cf669c439a.jpg

作者:林俊一,李梦雨,孟澄,周永道

通讯作者:孟澄,周永道

论文概述

偏最小二乘(PLS)回归在降维、多响应回归及多分类任务中表现突出,但在大规模数据上的应用常受限于计算复杂性。本文提出一种基于稀疏化子抽样的偏最小二乘(Spar-PLS)回归算法。我们通过矩阵逐元素子抽样构建稀疏矩阵,获得协方差矩阵的无偏近似,并进一步基于核心元素估计方法融入PLS框架,利用核方法提升计算效率。理论分析表明该方法在特定概率下可获得最小方差估计。仿真和实证研究验证了其在准确性、预测性能和计算效率上的显著优势。

我院22级博士生黄君烈进行了题为“Efficient Approximation of Leverage Scores in Two-dimensional Autoregressive Models”的海报展示。

27ac71f67ccd6307a2366c210dbcea9.jpg

作者:黄君烈,黄倩楠,康欣来,李梦雨,孟澄,张静怡

通讯作者:孟澄,张静怡

论文概述

杠杆值用于量化数据集中各数据点的影响力,广泛应用于子抽样方法以提取具有代表性的子样本。本文聚焦于二维自回归模型中的杠杆值计算与应用,基于协变量矩阵的结构特性,提出了一种高效的近似算法。理论分析证明该方法能够实现快速且精确的杠杆值估计,数值模拟进一步验证了其在准确性与计算效率方面的优势。此外,我们将该方法应用于高光谱图像的异常检测任务,在保持检测精度的同时,显著提升了计算效率。

我院24级博士生薛敦耀进行了题为“Core-elements Subsampling for Alternating Least Squares: Efficient Algorithms for Large-Scale Recommendation Systems”的海报展示。

b6808542b2d803749eeec24327c5c55.jpg

作者:薛敦耀,李梦雨,孟澄,张静怡

通讯作者:孟澄,张静怡

论文概述

本文提出了一种针对交替最小二乘(ALS)算法的新型基于元素的子集选择方法,旨在提升处理缺失值矩阵时的低秩矩阵分解效率,适用于推荐系统中的用户-物品交互数据。传统 ALS 在大规模数据上因反复回归计算导致计算开销高。为此,我们提出了一种核心元素抽样方法,通过选取具有代表性的数据子集并结合稀疏矩阵运算,有效逼近 ALS 结果。理论分析表明该方法在大幅降低计算成本的同时保持了与全样本 ALS 估计相近的精度。大量仿真实验和实际应用验证了其在大规模推荐系统中的有效性和应用潜力。

简介

辛家辉,中国人民大学统计与大数据研究院2021级博士研究生,主要研究方向为自适应试验的设计与推断。

黄君烈,中国人民大学统计与大数据研究院2022级博士研究生,主要研究方向为大数据子抽样、图像异常检测和非参数统计等。

林俊一,中国人民大学统计与大数据研究院2024级博士研究生,主要研究方向为高效的大规模统计模型、最优传输及生成模型等。

薛敦耀,中国人民大学统计与大数据研究院2024级博士研究生,主要研究方向为大数据抽样、最优传输、生成模型等。