“第十一届泛华统计协会大会” 成功举办
时间:2020.01.02 浏览次数:534

2019年12月20-22日,以“统计与数据科学主导的创新”为主题的第十一届泛华统计协会大会在杭州市黄龙饭店圆满举办。会议由国际泛华统计协会(ICSA)主办,浙江大学数据科学研究中心承办,上海交通大学数学科学学院协办。由宾夕法尼亚大学李洪哲教授担任学术委员会主席,Janssen R&D 李钢、浙江大学张立新教授担任组织委员会主席。

本次会议为期3天,参会代表700余人,共安排3个大会报告,170个平行报告,邀请中国、日本、韩国、新加坡、印度、澳大利亚、新西兰、加拿大、美国、英国、智利、瑞士、比利时、瑞典和以色列等国家和中国香港、中国台湾等地区的顶尖数据科学专家学者参会,就人工智能、大数据时代下的统计教育、机器学习和数据挖掘、现代统计理论、生物统计和医药统计、纵向数据分析、贝叶斯方法、非线性计量经济、高维数据统计推断等问题展开深入交流与讨论。

12月20日上午,本次会议学术委员会主席、美国宾夕法尼亚大学李洪哲教授主持开幕式并致辞,他表示,2019年第十一届泛华统计协会大会是一次规模盛大、极具国际影响力的大会。本次大会旨在为广大的统计学专家、学者及青年学生提供一个学术交流、相互学习的平台,促进浙江大学数据科学研究,推动中国统计学科的发展。国际泛华统计协会主席、耶鲁大学生物统计系讲座教授张和平随后发表讲话,对远道而来的嘉宾和报告人以及会议代表表示欢迎和感谢,他表示,泛华统计协会(ICSA)是一个非营利性组织,是国际统计界影响最大的统计学会之一,拥有一大批国际著名的统计学家作为其理事。自成立以来,每三年召开一次泛华统计协会国际会议,之前已经在美国、新加坡和中国香港、台湾、北京、广州、上海等地成功举办了十届会议。本次由ICSA主办、浙江大学协办的为其第十一届会议。他回顾了第十一届泛华统计协会大会的工作,对浙江大学承办本届会议表示衷心感谢。

开幕式结束后,Peter Hall Lecture的主席,浙江大学数据科学研究中心学术委员主任、美国宾夕法尼亚大学讲座教授、沃顿商学院院长蔡天文(Tony Cai)致辞,他提到,当今时代是统计学的黄金时代,他希望有更多的青年学者加入数据科学领域,并介绍了Peter Hall Lecture的来源以及本次受邀演讲者著名统计学家、普林斯顿大学讲座教授Jianqing Fan。随后,Jianqing Fan教授以“Communication-Efficient Accurate Statistical Estimation”作了1小时的精彩大会报告。范剑青教授首先简单介绍了在大数据环境下大数据的共同特征以及所面临的挑战,回顾了分布式学习算法的优点以及现有的研究结果,指出当数据以分布式方式存储时直接应用传统统计推断过程的缺点。范教授接着介绍了两种具有高效传输准确率的统计估计器。此种估计器是通过分布式优化迭代算法实现的:在每次迭代中,各个节点机器并行计算并与中央处理器通信,然后中央处理器将节点机器的梯度矢量估计进行聚合并且将其传输给各个节点机器以进行新的更新。范教授从函数的线性逼近和不动点理论的角度出发分析该算法的可行性,给出了关于优化误差的依赖于局部样本点个数的收缩性理论,并且提供了简单直观的证明想法。范教授指出当局部样本点个数比较大的时候,该算法具有线性收敛性,并且每一步迭代的统计精确度得到改进。此外,对于一些典型的统计应用问题,范剑青教授指出该算法作为多步估计器,在有限步迭代后可以实现统计效率。最后范教授通过大量的数值实验验证了相关的理论结果,表明了该算法的优越性能。

21日,新研究者奖与Pao-Lu Hsu奖的颁奖典礼如期举行。泛华统计协会主席张和平、第十一届泛华统计协会大会学术委员会主席李洪哲、组织委员会主席李钢为十一位新研究者奖获奖者颁发获奖证书及奖金。随后,为Pao-Lu Hsu奖的获奖者赵宏宇颁发了奖杯。作为本次大会的特邀报告人,美国耶鲁大学公共卫生学院赵宏宇教授以“Fisher’s 1918 Quantitative Genetics Model In the Genomics Era”为题目进行了一场精彩报告。1918年,年轻的Ronald Fisher基于20世纪初重新被发现的孟德尔遗传学在当时新兴的统计学框架写下了《The correlation between relatives on the supposition of Mendelian inheritance》。近一百年来,这篇体量宏大的论文牵引着遗传学和统计学的两个近乎独立的学科逐渐孕育了新兴学科: 统计遗传学。在这篇开山论文中,Fisher提出了影响深远的微效多基因假说(polygeny):一个典型的数量性状—或者复杂性状—的变异是由许多效应微小的基因位点决定。随着生物技术的发展,特别是人类基因组计划的完成,全基因组水平SNP标记开始涌现。基于SNP标记的全基因组关联分析(GWAS)逐渐挖掘出与复杂性状之间存在统计水平显著的关联SNP位点。正如Fisher所预测的那样,这种关联的特点是效应微小而位点众多。然而,基于p值显著性水平决策得到的单独位点效应的简单叠加并不能充分解释表型变异从而导致“missing heritability”问题的出现。之后,基于混合线性模型的REML估算方法极大地提高了复杂性状的遗传率估算,使得百年前Fisher提出的polygeny模型重新焕发光彩,促进了“missing heritability”问题的发展。然而,REML是本质上一种MLE,对于遗传结构的有诸多前提假设。但,实际上我们对基于polygeny遗传结构知之甚少,需要在比较宽泛的视角下对REML估计的遗传率进行分析和评估,并且发展其它工具用于探索missing heritability问题。在Fisher的奠基论文发表一百年之际,赵宏宇教授的演讲是结合了当代统计学、遗传学、和生物信息学方法,对Fisher提出的问题和技术框架进行了全面的分析和回顾,并着重介绍了目前取得的重要进展和成果。赵宏宇教授为此问题的深入研究开发了一系列新的统计方法和生物信息学分析工具,为剖解复杂性状带来了曙光。

22日,美国哥伦比亚大学的Zhiliang Ying教授作为当天的特邀报告人,以“Statistical models and methods for educational and psychological measurement”为题目进行了1小时的大会报告。

泛华统计协会是国际统计界最著名的统计学会之一,在统计学界具有很高的国际学术影响力,拥有一大批国际上著名的统计学家作为其理事。大会的成功举办,为国内外学者提供国际合作与学术交流的平台,推动统计和数据科学在理论、方法和应用等方面的研究和发展;推动杭州的统计学及相关数据科学的健康发展,并且为浙江大学的统计专业及相关学科的发展产生积极而又深远的影响。