检测到您当前使用浏览器版本过于老旧,会导致无法正常浏览网站;请您使用电脑里的其他浏览器如:360、QQ、搜狗浏览器的极速模式浏览,或者使用谷歌、火狐等浏览器。

下载Firefox

我院博士研究生陈灿贻和导师朱利平教授合作发表多篇高水平论文

2022-10-06

2022年9月14日,我院2018级博士生陈灿贻与其博士生导师朱利平教授等合作的论文“Distributed Sparse Composite Quantile Regression in Ultrahigh Dimensions”被统计学期刊《StatisticaSinica》接收。

论文概述

大数据时代,海量高维厚尾数据无处不在。本文讨论了在潜在的任意噪声分布下的超高维线性回归模型的分布式估计和支撑集恢复问题。复合分位数回归是最小二乘法的一种有效替代方法,对重尾噪声具有鲁棒性,同时在轻尾噪声下保持合理的效率。复合分位数回归损失的高度非光滑性对超高维分布式估计的理论和计算发展提出了新的挑战。为此,我们将复合分位数回归引入最小二乘法框架,并提出了一种基于近似牛顿方法的分布式算法。这种算法既节约计算量又节约通信量,只需要在机器之间传递梯度信息。我们证明了在有限次通信后所产生的分布式估计量达到了近乎最优的速率,同时为其估计和支持恢复的准确性提供了理论保证。我们进行了广泛的实验来验证我们算法富有竞争力的经验性能。

发表页面



陈灿贻与其博士生导师朱利平教授等合作的另一篇论文“Distributed Decoding from Heterogeneous 1­Bit Compressive Measurements”在2022年8月被统计学期刊《Journal of Computational and Graphical Statistics》接收。

论文概述

我们为1比特压缩感知开发了一种具有通信效率的分布式估计。在1比特压缩感知问题中,未知的稀疏信号被编码为带有噪声和符号翻转的二进制测量。我们允许在不同节点收集的测量结果有不同的符号翻转概率和噪声强度。这就导致了异质性问题。我们提出了一种通过惩罚最小二乘法的分布式算法来恢复稀疏信号。这种算法在计算上是非常有效的——只需要传递梯度信息。即使提从一个糟糕的初始估计出发,所得到的分布式估计也会在一次迭代后收敛,并在恒定的迭代次数后达到接近最优的速率。我们在一些正则性条件下证明了,只要总的样本量N满足$(slogp)/(δ^2N)=O(1)$,其中p是维度,s是底层真实稀疏信号的非零元素的数量,分布式估计就能在有限的迭代次数后以精度δ接近底层真实稀疏信号。我们建立了支撑集恢复的统计保证。我们提供了大量的实验来说明我们提出的分布式算法的有效性。

发表页面

作者简介

陈灿贻,中国人民大学统计与大数据研究院2018级直博生,主要研究方向为分布式统计学习、独立性检验和充分降维。目前已有六篇论文发表在统计学期刊《StatisticaSinica》、《Journal of Computational and Graphical Statistics》、《Journal of Multivariate Analysis》、《Statistics and Its Interface》和《应用概率统计》,并曾参加2021年数据科学前沿论坛暨博士研究生学术交流研讨会做分组报告。博士学习期间成绩优异,多次获得中国人民大学一等奖学金。

朱利平,中国人民大学“杰出学者”特聘教授,统计与大数据研究院院长,博士生导师。详情请见个人主页:http://isbd.ruc.edu.cn/sztd/1300f3797f4e477789514056a51c9dfa.htm.


代表论文

1. Canyi Chen, Wangli Xu, and Liping Zhu. 2022. “Distributed Estimation in Heterogeneous Reduced Rank Regression: With Application to Order Determination in Sufficient Dimension Reduction.” Journal of Multivariate Analysis 190 (July): 104991. https://doi.org/10.1016/j.jmva.2022.104991.

2. Yilin Zhang, Canyi Chen, and Liping Zhu. 2022. “Sliced Independence Test.” Statistica Sinica. https://doi.org/10.5705/ss.202021.0203.

3. Canyi Chen and Liping Zhu. 2022. “Distributed Decoding From Heterogeneous 1-Bit Compressive Measurements.” Journal of Computational and Graphical Statistics 0 (ja): 1–25. https://doi.org/10.1080/10618600.2022.2118751.

4. Canyi Chen, Yuwen Gu, Hui Zou, and Liping Zhu. 2022. “Distributed Sparse Composite Quantile Regression in Ultrahigh Dimensions.” Statistica Sinica. https://doi.org/10.5705/ss.202022.0095.

5. Yiran He, Canyi Chen, and Wangli Xu. 2022. Distributed Estimation of High­dimensional Linear Quantile Regression. Statistics and Its Interface.

6. Song, Pengfei, Canyi Chen, Yuan Lou, Hui Jiang, Weimin Li, Liping Zhu. 2020. Assessing Effectiveness of Integrated Strategies for Preventing and Controlling the Outbreak of COVID­19 and Predicting Impact of Opening Exit Channels to Leave Hubei Province. Chinese Journal of Applied Probability and Statistics 36(3): 321-330.