检测到您当前使用浏览器版本过于老旧,会导致无法正常浏览网站;请您使用电脑里的其他浏览器如:360、QQ、搜狗浏览器的极速模式浏览,或者使用谷歌、火狐等浏览器。
下载Firefox2022年9月20日,我院博士研究生闫引桥与导师罗翔宇副教授合作的论文“Bayesian Tree-Structured Two-Level Clustering for Nested Data Analysis”被统计学期刊《Journal of Computational and Graphical Statistics》接收。
论文概述
数据集成(Data integration)在大数据时代起着至关重要的作用。嵌套数据(nested data)是来自多个来源的一组观察结果的组合,并且在来源层面(source level)和观察层面(observational level)都表现出异质性。复杂的性质使得嵌套数据的合理可视化和联合分析具有挑战性。在本文中,我们提出了一个非参数贝叶斯模型来实现嵌套数据分析的树结构两层次聚类。两层次聚类用于分别梳理出源和观察中存在的异质性,而树结构先验用于在观察层面为聚类的潜在层次进行建模。所提出的贝叶斯模型非常灵活,因为它不需要精确指定簇数或树的宽度/深度,并且它可以自动学习观察簇中的底层树结构,从而提供嵌套数据的合理可视化。我们通过 partially collapsed Gibbs 采样进一步提供了严格的后验采样方案,并使用模拟实验展示了所提出方法的性能。最后,对两种不同类型的嵌套数据(多源图像数据和多个体单细胞表达数据)的应用证明了所提出的贝叶斯方法的优势。
发表页面
作者简介
闫引桥,中国人民大学统计与大数据研究院2019级直博生。目前已有一篇论文发表在统计学期刊《Journal of Computational and Graphical Statistics》,曾参加2021“International Society for Bayesian Analysis World Meeting”会议。博士学习期间成绩优异,多次获得博士研究生一等奖学金和二等奖学金。
罗翔宇,中国人民大学统计与大数据研究院副教授,博士生导师。研究领域包括统计基因组学、贝叶斯统计、统计计算。已在《Journal of the American Statistical Association》、《Nature Communications》等统计学或综合类国际一流期刊发表多篇论文,论文曾获美国统计学会W.J. Youden in Interlaboratory Testing奖。
论文发表
Yinqiao Yan and Xiangyu Luo (2022). Bayesian Tree-Structured Two-Level Clustering for Nested Data Analysis. Journal of Computational and Graphical Statistics.