检测到您当前使用浏览器版本过于老旧,会导致无法正常浏览网站;请您使用电脑里的其他浏览器如:360、QQ、搜狗浏览器的极速模式浏览,或者使用谷歌、火狐等浏览器。
下载Firefox2024年5月24日上午10:00-11:00,普渡大学副教授Wei Sun在崇德西楼702会议室进行了主题为“Online Statistical Inference for Low-rank Reinforcement Learning”的学术讲座。
讲座描述了一个具有高阶上下文信息的在线决策问题,其中真实模型参数具有低秩结构。讲座提出了一种完全在线的流程,用于对自适应收集的数据进行统计推断。模型参数的低秩结构以及数据收集过程的自适应性使得这一问题变得复杂:标准的低秩估计器存在偏差,无法以顺序方式获得,而现有序列决策制定算法中的推断方法未能考虑低秩性,同样存在偏差。为了解决这些问题,讲座引入了一种新的在线去偏方法,以同时处理这两类偏差来源。
讲座结束后,师生们受益良多,对嘉宾们的精彩讲座表示感谢。研究院今后会继续邀请专家学者开展讲座,不断拓宽学术视野。