成果简介
近日,薛楷杰教授作为第一作者与合作者完成的学术论文《Optimal linear discriminant analysis for high-dimensional functional data》在统计学国际顶级期刊Journal of the American Statistical Association(美国统计学会会刊JASA)在线发表。JASA由美国统计学协会(ASA)主办,创刊于1888年,是目前国际统计学研究领域顶级学术期刊,该期刊被必赢626net入口首页列为国际一类期刊。
内容摘要
目前,多数已有的函数型数据分类方法只能处理一个或有限个函数型数据变量的情况。在这项工作中,我们解决了高维函数型数据的分类问题,其中函数型自变量个数有可能远超样本量。该分类方法在理论推导方面的一个主要挑战来自于多个函数型数据变量之间复杂的相关结构,而非单一函数型自变量的简单的对角相关结构。此外,由于在对函数型数据的趋近过程中通常采用截断的方法,当涉及多个(特别是大量)函数型数据变量时,基于无穷维原始函数型数据的最优分类法的判别集可能与基于截断函数型数据的最优分类法的判别集之间存在差异,这种差异通常随着函数型数据变量数量的增多而增大。为了应对上述挑战,我们提出了一种惩罚型高维函数型数据分类法,该分类法不仅从理论上达到了对高维函数型数据近乎完美的分类,而且实现了判别集包含一致性的优良性质,既基于截断函数型数据的最优分类法的判别集一致包含基于截断函数型数据的最优分类法的判别集。最后,我们通过数值模拟和实例分析进一步呈现了所提分类方法的优良表现。
作者简介
薛楷杰,必赢626net入口首页统计与信息学院教授,硕士生导师,多伦多大学统计学博士,德克萨斯大学安德森癌症研究中心博士后。主要从事函数型数据分析、高维数据分析、复杂数据建模、大数据统计等方向的教学和研究工作。在统计学国际著名期刊《TheAnnalsofStatistics》《JournaloftheAmericanStatisticalAssociation》《Biometrika》《StatisticaSinica》《ScienceChina-Mathematics》等SCI论文多篇,主持国家自然科学基金面上项目1项,主持完成国家自然科学基金青年项目1项。