利用统计学习和函数逼近的方法建立数据挖掘算法

Word Cloud with Data Mining related tags
Word Cloud with Data Mining related tags

4月26日,华中农业大学理学院数学与统计学系陈洪副教授在机器学习领域研究中取得新进展,并以第一作者和通讯作者身份在国际应用数学顶级期刊《应用与计算调和分析》(Applied and Computational Harmonic Analysis)发表《基于相关熵损失的稀疏核回归》(Kernel-based sparse regression with the correntropy-inducedloss)的研究论文,该期刊集中收录应用调和分析和机器学习理论等研究方向的创新成果,也是我校数学学科领域高质量研究成果的突破。

该研究针对传统核回归方法对非高斯噪声数据敏感的问题,引入相关熵损失到稀疏核学习,建立了算法的泛化性、稀疏性和计算复杂性的理论分析,并通过模拟和真实数据实验验证了算法处理噪声数据的优势。该算法设计、理论分析和应用可进一步推广到子采样学习、分布式学习等前沿大数据分析问题,提升大数据算法挖掘噪声数据的能力。

近年来,陈洪博士的研究工作以机器学习的泛化性能分析为根基,针对数据处理问题的数学特性来设计算法,再利用统计学习和函数逼近的方法建立算法的理论基础,并探索构建了算法在实际数据挖掘问题中的应用模型。

沿着该主线,陈洪的研究工作从回归和分类学习问题起步,设计了系列核正则算法和贪婪算法,建立了其一致性和收敛性的分析,探讨了半监督学习的逼近理论基础。相关研究成果先后发表于MIT知名期刊 《Neural Computation》、国际神经网络会刊《Neural Networks》、《Information Sciecnes》 。近期,该领域的研究工作又逐步深入到排序学习问题,并引入算子逼近来刻画排序学习的数学特性,构建了系列排序算法,这一算法在药物发现和推荐系统数据实验中验证了其有效性。系列研究成果先后发表于相关学科知名国际学术刊物等。

近年来,理学院采取切实措施,重视学术交流与合作,强化教学与科研团队建设,试行青年教师“教学科研双导师制”和“教学科研双能手培植计划”,促进科研教学相融合,部分科研领域取得了一系列突破,有望为我校教学与科研工作更好地提供基础理学支撑。

论文链接:http://www.sciencedirect.com/science/article/pii/S1063520316300045

(据华中农业大学)

原创文章,如若转载,请注明出处。

相关文章