期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王新阳贾相宇陈志泊崔晓晖许福《农业机械学报》2021,52(8):195-204，212

针对森林生态站中大量图像、视频、GIS数据等非结构化数据以及生态指标等结构化数据存储效率低、检索性能差的问题,提出了基于Hadoop和HBase的森林生态站大数据存储框架。基于所提出的框架,给出了森林生态数据存储业务流程,并对森林生态大数据平台涉及的核心技术进行了优化:①设计预分区算法保证数据在集群中均匀分布。②根据生态数据特点科学设计了RowKey,实现生态数据的快速检索。③针对原生HBase不支持多条件查询问题,设计基于索引数据和服务器性能评估的ElasticSearch索引分片放置策略,以此基于ElasticSearch的二级非主键索引技术优化多条件检索HBase生态数据库。④针对生态站海量小图像存储困难问题,提出基于数据站点及时间关联性的打包合并策略。⑤解析GIS数据使之进行高效存储。通过实验对以上理论进行验证。结果表明,ElasticSearch索引分片放置策略比默认分片策略的查询时间平均减少20 ms,比基于改变ElasticSearch评分策略的查询时间平均减少20 ms。结构化数据规模为1×108条时,系统的检索时间为1.045 s,比原生HBase检索速度提升3.99倍,在非结构化数据为1×107条时,采用数据站点及时间关联性的打包小图像策略是基于SequenceFile合并效率的1.15倍,是原生HBase的1.79倍;在1×104次并发用户的情况下,优化后的每秒查询数是原来的1.88倍,每秒吞吐量是优化前的1.74倍,系统响应时间比优化前降低69.5%。结果表明,本文所提出的方案在集群负载均衡、海量结构化和非结构化数据检索效率以及系统吞吐量等方面都有了明显的性能提升,为森林生态数据的存储和管理提供了必要的理论基础和技术实现。相似文献

2.

基于混合驱动的本科教学评价指标体系分析系统的构建与应用——以北京市某大学为例

崔晓晖张戎陈俊生齐建东《中国林业教育》2018,(1)

教学评价指标体系的分析结果是优化高校现行本科教学评价指标体系的重要依据。以北京市某大学为例,利用已有教学评价数据分析现行本科教学评价指标体系的信度和效度,是该校教评中心的年度业务需求之一。基于此,尝试借助信息化技术对本科教学评价指标体系分析系统的构建进行了探索。首先,基于混合驱动的数据分析模式,对本科教学评价指标体系分析系统的功能需求进行归纳,并明确了系统构建的总体框架。其次,对本科教学评价指标体系分析系统采取的信度分析和效度分析方法进行了重点介绍。最后,应用构建的本科教学评价指标体系分析系统对该校2011—2014年的本科教学评价数据进行了具体分析,结果表明该校采用的本科教学评价指标体系具有较高的可信度,但在效度方面应根据学生班级规模不同等情况,制定差异化的教学评价指标权重分配方案,以便获得更具辨识能力的本科教学评价结果。相似文献

3.

基于Spark框架XGBoost的林业文本并行分类方法研究 总被引：1，自引：0，他引：1

崔晓晖师栋瑜陈志泊许福《农业机械学报》2019,50(6):280-287

针对当前互联网+技术与林业的交叉融合,涌现出海量待挖掘的涉林文本,而林业文本分类的相关研究尚不成熟的问题,使用网络爬虫技术面向互联网采集涉林文本,基于丰富的语料重新构建分类标签,提出基于Spark计算框架的XGBoost并行化方法,对林业文本进行分类。经由交叉验证,构建的XGBoost并行分类算法准确率为0. 923 4,在各类别中最低F1为0. 860 4,最高为0. 998 4;其在2. 1万条、4. 2万条、8. 4万条数据集上的训练加速比分别为2. 13、3. 47、3. 82。结果表明,基于该标签设定的分类模型对现存互联网中涉林文本的适应性较好;Spark环境下实现的XGBoost并行化算法的准确率显著优于其他4种机器学习(朴素贝叶斯、GBDT决策树、BP神经网络和ELM神经网络算法)的并行化算法,算法执行效率远高于单机版本,且数据量越大,其加速比越高,能有效应对海量林业文本的实时、准确分类。相似文献

4.

基于改进型果蝇算法的无性系种子园设计

齐建东刘春霞崔晓晖李伟《农业机械学报》2018,49(11):195-200

种子园的规划设计是林木育种的基础工作,在亲本数量不确定的前提下,最大限度避免种子园内无性系之间近交繁殖,保证种子园具有较高的遗传效益,是种子园设计的目标。以内蒙古红花尔基樟子松(Pinussylvestris var. mongolica)国家良种基地的1、1.5、2代种子园樟子松无性系通过SSR等技术分析得到的不同亲本之间的遗传距离为数据支撑,考虑复杂的亲本关系,通过改进的智能优化算法进行种子园设计,并将最终结果与其他智能优化算法和传统算法的结果进行对比分析。结果表明：改进型果蝇算法的收敛速度和效果优于其他算法,由所有算法分别执行200次之后的对比结果中可见,其最大值低于其他算法的最小值。在完全随机算法设计方案中存在多处同一无性系分株相邻出现,遗传算法和改进型果蝇算法设计方案并无同一无性系分株作为近邻出现且改进型果蝇算法设计方案的优先交配优于遗传算法设计方案。结果表明,基于遗传距离处理亲本复杂的亲缘关系,采用智能优化算法进行方案配置,可以为高世代种子园设计提供参考。相似文献

5.

基于注意力机制的林木物候期识别方法

崔晓晖陈民陈志泊许福王新阳《中南林业科技大学学报(自然科学版)》2021,(7):11-19

[目的]针对物候期识别传统方法特征提取不充分、未对关键特征进行区分,导致方法泛化能力较差、迁移应用识别精度低的问题,本研究将注意力机制引入残差神经网络,结合基于数字照相的物候观测方式,提出具有较强细粒度特征识别能力且实用性较强的林木物候期识别方法,从而为林木的长期实时物候监测提供技术支撑.[方法]以PhenoCam中的... 相似文献

6.

改进型遗传算法在种子园无性系配置设计中的应用

王晴齐建东崔晓晖李伟《林业科学》2018,(4)

【目的】使用优化算法优化种子园无性系配置的设计方案,以保证种子园子代在具有较高的遗传增益的前提下维持丰富的遗传多样性,为高世代种子园的无性系配置设计提供参考。【方法】基于已有的内蒙古红花尔基樟子松国家良种基地的樟子松亲本为材料,采用SSR分子标记技术及其分析软件确定樟子松亲本之间的遗传距离,使用优化算法开展基于遗传距离的樟子松种子园无性系配置优化设计,并基于研究目标改进原有的优化方法,最后与传统的种子园无性系配置方案、其他优化方法得到的方案进行对比分析。【结果】使用本文改进的优化算法获得的种子园无性系配置方案优于传统的顺序错位以及其他方法的种子园配置方案,该方法能够使遗传距离较近的无性系在配置上保持最大距离,减少近亲交配机会,在一定程度上扩大了子代的遗传基础。【结论】当已知种子园无性系亲本间遗传距离时,可利用本文提出的基于传统遗传算法进行改进的多种群并行自适应的方法,即改进型自适应并行遗传算法,来实现基于遗传距离的种子园无性系优化配置。相似文献

7.

基于TextRank和簇过滤的林业文本关键信息抽取研究

陈志泊李钰曼许福冯国明师栋瑜崔晓晖《农业机械学报》2020,51(5):207-214，172

目前,获取林业文本关键信息存在2个问题:关键信息获取主要从关键词角度考虑,忽略了词语的信息类型;网络上的林业文本没有统一的记述结构,词语信息类型提取困难。为此,本文提出了基于改进TextRank和簇过滤的林业文本关键信息抽取方法,以关键词+信息类型两部分表示文本关键信息。首先,抽取关键词并进行Word2Vec向量化,然后通过构建融合词语特征值、边权值的图模型对TextRank进行改进,对经迭代收敛得到的稳定图进行归并聚类形成簇;然后,设计簇品质评价公式进行簇过滤,再次应用TextRank形成最终簇集合;最后,对簇进行信息类型标注。对于测试文本,通过比较关键词向量和簇心向量的距离获得词语的信息类型,将信息类型与关键词结合得到文本的关键信息。基于2 000篇与林业政策新闻相关的林业文本进行实验,最终簇集合的紧密度为0. 968 0,间隔度为0. 057 2,综合评价指标为0. 887 1;对其中400篇文本进行关键词人工标注,将本文关键词抽取方法与TextRank、TF-IDF等6种算法进行比较,结果表明,本文方法在MRR、Bpref、准确率和综合评价指标上均获得了较好的效果,说明本文方法在提取林业文本关键词方面具有优势。相似文献