首页 | 本学科首页   官方微博 | 高级检索  
     检索      

四种机器学习算法预测大豆蛋白质定位对比研究
引用本文:李佳楠,高兴泉,李卓,滕小华,黄斌,张继成,唐友.四种机器学习算法预测大豆蛋白质定位对比研究[J].大豆科学,2022,41(3):337-344.
作者姓名:李佳楠  高兴泉  李卓  滕小华  黄斌  张继成  唐友
作者单位:吉林农业科技学院电气与信息工程学院,吉林吉林132101;吉林化工学院信息与控制工程学院,吉林吉林132000;吉林化工学院信息与控制工程学院,吉林吉林132000;吉林农业科技学院电气与信息工程学院,吉林吉林132101;东北农业大学电气与信息工程学院,黑龙江哈尔滨150030
基金项目:国家自然科学基金(31801441);
摘    要:为探索不同缺失程度大豆蛋白质亚细胞定位预测的有效方法,提升大豆蛋白质亚细胞定位预测能力,本研究以1万条已知亚细胞定位位置的大豆蛋白质序列数据为研究对象,进行5%、10%、15%、20%和30%不同缺失比例完全随机缺失,分别运用SVM算法、朴素贝叶斯算法和随机森林算法和决策树4种机器学习算法预测缺失序列的亚细胞位置,对原始位置和预测后的位置进行相关性分析,对比分析不同算法的准确性和性能。结果显示:随机森林算法预测的准确率最高;朴素贝叶斯算法的运行速度最快;朴素贝叶斯算法的运行内存最小。在不考虑运行时间和运行内存因素,且对预测的准确率要求较高的情况下,随机森林算法的预测效果要优于另外3种算法;同种情况下,若对运行内存要求较高时,可优先考虑朴素贝叶斯算法。结果说明不同机器学习方法在不同缺失程度的预测需求下的适用性,可应用于大豆蛋白质数据的定位预测。

关 键 词:支持向量机算法  朴素贝叶斯算法  决策树算法  随机森林算法  大豆蛋白质  完全随机缺失  序列位置预测
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号