“2023杭州数据科学前沿国际研讨会”圆满落幕
作者:admin
时间:2023-08-23
阅读量:3584次

2023821-22日,以“高维统计与机器学习”为主题的“2023杭州数据科学前沿国际研讨会”在杭州西溪宾馆顺利召开。会议由浙江大学数据科学研究中心主办,由哥伦比亚大学袁明教授担任学术委员会主席,浙江大学数据科学研究中心百人计划研究员崔逸凡研究员担任组织委员会主席。

 

本次会议为期两天,参会代表150余人,共安排两场大会报告,22场邀请报告,围绕复杂数据的数据分析、因果推理的最新进展、统计学习、机器学习理论、统计机器学习、应用统计学等议题进行了深入交流与探讨。

 

821日上午,本次会议组织委员会主席、浙江大学数据科学研究中心百人计划研究员崔逸凡研究员主持开幕式,并代表中心向前来参会的各位嘉宾表示热烈欢迎,他提到,杭州数据科学前沿国际研讨会是浙江大学数据科学研究中心的标志性会议,会议旨在聚焦世界最前端数据科学相关问题的研究,为来自世界各地的众多专家学者提供交流平台,共同探讨展示数据科学方面最新的研究成果,促进数据科学学科发展。本次会议学术委员会主席、美国哥伦比亚大学袁明教授出席开幕式并致辞,希望各位与会者参会愉快并有所收获。

 

本次会议邀请了美国麻省理工大学Cecil H. Green教授、COPSS奖获得者、知名数据科学家Martin Wainwright和中国科学院院士、北京大学讲席教授陈松蹊教授分别于21日上午和22日上午做大会报告。

 

21日开幕式结束后,由美国宾夕法尼亚大学讲座教授、COPSS奖获得者蔡天文(Tony Cai)主持,Martin Wainwright教授以“Challenges with Covariate Shift: What is it and What to do about it?”为主题作了1小时的精彩大会报告。

 

美国麻省理工大学Cecil H. Green教授、知名数据科学家Martin Wainwright

 

在报告中,Wainwright教授首先解释了协变量偏移的概念。他指出,协变量偏移可能导致机器学习模型在实际应用中的预测性能下降,因为模型在训练数据上学到的规律可能无法适应测试数据的分布情况。为了解决此类问题,Wainwright教授针对协变量偏移提出使用非参数回归方法在再生核希尔伯特空间(RKHS)中进行建模。这种方法与传统的RKHS非参数回归方法相比有一些不同之处:Wainwright教授引入了源分布(即训练集上的分布)和目标分布(即测试集上的分布)之间似然比的概念,并将其作为损失函数中的权重,以消除协变量偏移引起的偏差。Wainwright团队通过研究证明,在处理协变量偏移问题时,核岭回归(KRR)具有最优的minimax收敛速度。通过选择适当的正则化参数,KRR能够实现最佳性能。同时,他们还指出,存在协变量偏移的情况下,在函数类中通过最小化经验风险也可以获得次优的估计。除了传统的预测任务,Wainwright团队提出的方法在存在协变量偏移的情况下,进行因果推断也有出色的表现。

 

报告现场

 

 

822日,浙江大学数据科学研究中心主任孙文光教授主持了当天的大会报告,他向大家介绍了本次的大会报告人中国科学院院士、北京大学讲席教授陈松蹊教授。陈松蹊教授以Statistical Inference for Decentralized Federated Learning”为主题进行了一场精彩报告。

 

中国科学院院士、北京大学讲席教授 陈松蹊教授

 

陈院士首先介绍了传统联邦学习方法在隐私保护和数据分布非独立同分布方面存在的问题。为了解决这些问题,陈院士团队探索了基于分布式联邦学习的统计推断方法,并进行了理论推导和解释。他们首先推导了分布式随机梯度下降算法得到的不同客户端的估计量的均方误差和一致性误差,并证明了Polyak-Ruppert平均估计在去中心化分布式计算中具有渐近正态性。然而,这一渐近正态性的得出对客户端数量的限制比分布式M估计更为严格。为了克服这一限制,陈院士分享了他们团队提出的一种单步估计方法,该方法允许更多的客户端参与,同时也能实现与非分布式情况下原始Polyak-Ruppert平均估计相同的效率。此外,陈院士还分享了他们团队构建的基于Polyak-Ruppert平均估计和他们所提出的单步估计的置信区间,以实现在分布式联邦学习下的统计推断。最后,陈院士团队还分享了分布式连接网络的稀疏性对所提出的单步估计的统计性质的影响。

 

报告现场

 

此外,会议安排了22场分组报告。会议结束后,与会人员对本次会议表示赞赏,专家学者们的分享为数据科学领域的研究者和从业者们带来了新的启示。

 

“数据科学前沿国际研讨会”作为浙江大学数据科学研究中心的重要学术活动,已经成功举办两届,本次为第三届会议。数据科学研究中心将进一步发挥桥梁作用,为国内外学者提供学术交流的平台,推动数据科学学科发展,为多学科的交叉融合创造更多可能性。

 

 

参会人员合影

 

 

大会报告文字素材/郑朝聚

编辑/牛茜