近期,公司2019级计算机科学与技术研22班研究生胡文进撰写的题为《An Efficient Data Classification Decision Based on Multimodel Deep Learning》在国际期刊《Computational Intelligence and Neuroscience》(中科院数学与计算生物学领域:2区)上发表。
该论文针对文本分类模型在多源文本数据集下存在分类准确率下降以及网络模型结构比较深等问题,提出了一种基于深度学习的集成文本分类方法来提高模型的鲁棒性。
该方法基于深度学习的三种网络架构,在DNN、RNN和CNN三种网络的基础上进行了改进。在DNN网络架构中,结合BP算法和多种优化器算法来训练模型;在RNN网络架构中,设计具有横向和纵向学习的GRU网络、多种优化器算法和ReLU激活函数训练模型;在CNN网络架构中,采用多层卷积和池化来提取文本特征并结合多种优化器算法来训练模型。最后,将三种网络架构采用融合策略和并行架构训练方法集成一个性能更加强大的文本分类模型。通过对比实验结果比较,表明集成模型比单个分类器性能更优,对多种数据集均能实现更好的分类性能。(撰稿:胡文进 审核:张凯兵)
胡文进个人简介:
胡文进,男,1996年,中共党员。2022年拼搏体育官网入口计算机科学技术专业获工学硕士学位。主要研究方向为基于深度学习的文本分类和自然语言处理。在校期间,参与导师的国家科技重大专项子课题及其它横向研发项目多项,获第十二届中国老员工服务外包创新创业大赛全国三等奖,2020年拼搏体育官网入口研究生学业三等奖学金。在校期间,发表SCI二区论文1篇,EI期刊论文1篇。主要研究方向:基于深度学习的文本分类和自然语言处理。