首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 523 毫秒
1.
[目的/意义]对科技文献正文内容进行语义建模的方法进行总结分析,为文献模型相关研究和实际应用提供参考和借鉴。[方法/过程]归纳当前科技文献内容语义描述模型的特点,将其分为文档组件模型、修辞特征模型和科学论述模型3类,并进行对比分析,以学术论文为例开展应用实践,从知识管理、语义出版、语义检索、科学论证分析等方面探讨模型的应用情况。[结果/结论]科技文献内容语义描述模型推动了文献的深度挖掘、知识结构定位和关联分析,促进了文献内部细粒度知识的发现、共享和利用,有助于科学传播与知识创新。  相似文献   

2.
[目的/意义]如何利用科技文献中的知识对深度学习算法模型进行训练改进,以获取知识、发现知识是情报研究的重要课题。为充分挖掘和利用科技文献中的知识,本文提出构建基于科技文献知识的人工智能引擎的目标。[方法/过程]本文以文献情报工作为出发点,立足科技文献是人类知识的最重要载体,探究人工智能取得飞速突破的本质所在,创新性提出了文献情报领域从“科技文献库”转变为“科技知识引擎”的建设思路。[结果/结论]本文论述了中国科学院文献情报中心在构建基于科技文献知识的人工智能(AI)引擎的建设实践,探讨了利用深度学习技术挖掘知识以服务情报研究的方法,以期为学界提供参考。  相似文献   

3.
[目的 /意义]针对传统文献分类方法未能充分利用文献结构信息的问题,本文提出使用关键词-文献图网络构建文献之间的结构信息,并用于增强传统基于文献内容的分类方法。[方法 /过程]本文借助图卷积神经网络建模关键词-文献图数据,学习文献在图网络中的节点表示。同时使用Bert+BiLSTM学习文献的内容表示。然后,我们将文献的节点表示与内容表示进行拼接,得到融合文献结构信息和文本语义信息的表示,并基于该表示开展文献分类。[结果 /结论]实验结果表明,文献的结构信息能够提升文献分类的性能,但单一的结构信息并不能很好地实现文献分类。通过错误分析,我们发现模型在处理包含新兴交叉科学和新概念的文献时容易出现分类错误,表明模型在处理这类数据时还有一定的局限性,是未来需要继续优化的方向。  相似文献   

4.
[目的/意义]开展面向数字人文的古籍触发动词识别及分类研究,对于古籍文本的深层次挖掘和内容揭示具有重大的意义。本文利用深度学习分类算法,探索依据古籍触发词进行事件句文本多元分类的自动化方法。[方法/过程]在构建了典籍事件触发词分类体系和触发词典的基础上,选取4个不同类别的事件句文本作为实验数据,利用Onehot和Tokenizer对类别标签和句子文本进行分别编码后,输入Bi-LSTM模型中训练分类器,并通过调整参数设置了对比实验,采取通用的评价指标分析了分类器的性能。[结果/结论]经过多次训练和调整之后得到的分类器,在测试集的评估中精确度达到了0.95,证明基于深度学习的实验方法和构建的触发词数据集能够有效的帮助我们实现古籍事件句文本的自动化多元分类。  相似文献   

5.
[目的/意义]智库报告是由独立研究机构提供的专业分析和政策建议,为决策者和公众提供决策支持和促进社会进步的重要工具。智库报告摘要可以为读者提供一个简洁明了的概述,以便他们能够快速了解报告的主要内容和结论,从而提高信息筛选、传播效果和知识传递的效率。目前的智库报告存在主题差异大导致生成摘要不准确的问题,亟需对现有的文本摘要方法进行改进。[方法/过程]针对上述问题,本文提出了一种融合关键词的智库报告摘要模型。首先使用关键词抽取算法抽取原文中的关键词信息,其次提出一种基于交叉注意力机制的融合关键词模块用于提升模型对于主题信息的感知能力,并且在训练的过程中使用了对比学习训练。[结果/结论]结果表明,融合关键词的摘要模型在智库报告文本摘要任务中的Rouge-1、Rouge-2和Rouge-L值优于其他文本摘要模型,分别达到了48.23、32.55和42.50,在智库报告文本摘要任务上具有更优的摘要效果。  相似文献   

6.
[目的/意义]科技文献数据资源具有覆盖广、数量大、类型多、更新快、时效强等特点,为提高科技文献数据管理效果和数据安全,本文基于数据生命周期模型对科技文献管理体系进行研究。[方法/过程]对科技文献管理模式进行探索,基于数据管理流程,构建了科技文献的生命周期体系,并从数据创建、数据存储、数据预处理、数据计算、数据服务、数据归档、数据销毁等7个阶段对数据管理工具和数据管理方法进行阐述。[结果/结论]本文对科瑞唯安核心数据集WOS BP数据进行了基于科技文献生命周期的管理和实践,同时基于DAMA数据质量的6个评估维度对数据管理效果进行综合评价。  相似文献   

7.
[目的/意义]当前高校图书馆对资源共享、联盟共建的发展路径越来越重视。针对高校图书馆联盟在实现文献信息资源共建过程中存在的问题,利用区块链技术构建新型联盟共建共享体系,实现联盟成员馆间文献资源优势互补。[方法/过程]在采用MVVM(Model-View-ViewModel)架构基础上,以激励机制、共识机制、分布式结构、智能合约及大数据分析等作为底层支撑,构建基于区块链的区域性文献信息资源共建共享机制,模型构架中以“用户需求”为中心,利用“激励机制”调动联盟集团用户及个体用户参与文献信息资源共建共享的积极性。[结果/结论]通过模型构建促进区域高校联盟建设共建共享,打破联盟内高校图书馆间“信息孤岛”,实现各成员馆联合采访、精准典藏、区域流通,从而优化文献资源建设,提高资源质量,实现资源安全,更好的为高校用户提供高质量精准服务。  相似文献   

8.
[目的/意义]雨花英烈精神是中国共产党新民主主义革命精神的重要组成和代表,雨花英烈的原始革命文献是记录雨花英烈精神的重要来源与载体,利用内容标注、特征构建等文本处理技术对文献内容进行深度挖掘,既有助于弘扬革命文化,赓续红色血脉,也有益于开拓技术应用对象,促进技术水平提升。[方法/过程]本文以雨花英烈相关原始文献为数据来源,以雨花英烈为对象构建雨花英烈轻量级本体,以此作为雨花英烈群体特征描述框架,基于领域词表及触发词特征从雨花英烈革命文献中抽取本体中相关实例,实现对雨花英烈多维属性的形式化特征构建。雨花英烈轻量级本体的类别及属性描述了雨花英烈群体特征框架,通过对抽取的本体实例的数据分析,则可实现对雨花英烈群体特征的数据分析。[结果/结论]通过对雨花英烈基本信息、革命活动及狱中斗争的有关文本内容的统计分析,从数据角度进一步揭示了雨花英烈的群体特征,包括受教育程度高、牺牲年龄小,长期在国民党统治中心坚持斗争,坚守信仰,对党忠诚,满怀修齐治平的家国情怀,自觉践行对高尚的道德追求等。运用轻量级本体等本文量化分析方法有助于具象化地呈现雨花英烈的崇高理想信念、高尚道德情操以及为民牺牲的大无畏精神内涵。本文对于创新雨花英烈精神的呈现方式与传播效果有一定参考价值。  相似文献   

9.
[目的/意义]为实现文献资源的细粒度组织,满足用户日趋精准的信息服务需求,研究提出一种基于PDF版式特征的文献篇章结构细粒度自动抽取方法。[方法/过程]方法充分利用机器学习在信息分类方面的优势,针对非结构化的PDF文档,基于其版式特征对章节标题进行自动分析、识别与抽取。根据章节标题的坐标定位,将正文内容以段落为最小颗粒度自动匹配至所属标题的下级位置,最终实现文档全文结构的细粒度抽取和重组。[结果/结论]经实测,机器自动抽取平均正确率达80%,针对非结构化PDF文档的细粒度抽取工作具有较好的现实意义和应用前景,基于底层方法设计构建的数据处理系统现已投入实际应用,大幅解放人工进行篇章结构细粒度抽取的工作。  相似文献   

10.
[目的/意义]为解决当前农业科技管理中广泛存在数据链不完整,数据支撑决策能力不足的情况,本文提出了一套从农业科技管理需求出发的产业知识服务模型,并就其中的关键环节科学数据和科技文献关联进行了研究和实践,以期为图书情报机构服务农业科技管理和产业发展提供理论与实践案例。[方法/过程]本文首先梳理了知识服务和数据关联现状,其次在分析农业科技管理中的产业需求特征和数据管理生命周期的基础上,构建了包含产业特征的知识服务模型,然后以四川农业科学数据和科技文献为基础,从产业要素出发,设计了本体模型和系统,最后完成实践。[结果/结论]研究最后集成20个数据类型,24 284条科学数据和科技文献,1个系统平台和1个子平台,建立了多源异构、中英两语种的数据关联,实现了基于产业知识服务的科学数据和科技文献关联和平台交流。研究成果将对农业科技管理与图书情报学跨领域合作,科学数据和科技文献跨部门共享提供借鉴。  相似文献   

11.
[目的 /意义]互联网的发展带动了社交网络的快速发展,为用户提供了一个方便的信息发布、传播和接受的渠道,但其低门槛的特性也催生了一批灰黑色力量——网络水军,他们传递虚假信息,破坏网络秩序,成为互联网生态中的一大问题。[方法 /过程]本研究提出了一种基于深度学习的网络水军识别模型,结合用户的基础信息、历史言论、交互行为3方面特征,并加入了“社交亲密度”属性,通过特征提取与向量融合,利用卷积神经网络构建起水军识别模型。[结果 /结论]通过实证分析与模型对比,实验构建的模型在精确率、准确率等指标均取得了较好的效果,可以为网络水军识别提供一定技术支持与理论指导。实验表明,利用机器学习方法主动识别网络水军账号,对重点账号进行实时监管与事前防范,可以更加及时有效地避免恶性网络事件发生,降低非法势力破坏舆情生态的风险。  相似文献   

12.
[目的/意义]为了提高大豆叶片图像的分类精度与效率,进一步对大豆叶片图像进行存储与管理。[方法/过程]本文利用深度学习方法,针对肉眼观察准确率较低且不同人群分类结果差异较大的大豆叶片图像数据提出了一种自动分类方法。本研究首先对大豆叶片进行ROI感兴趣区域划分,进而利用分水岭分割方法对大豆叶片进行提取,最后通过深度学习高效精确的实现了大豆叶片的分类识别。[结果/结论]通过分析大豆叶片形态图像特点后,基于深度学习开展了对大豆叶片形态的分类识别的研究,达到了较高的识别准确率。  相似文献   

13.
基于深度学习的渔业领域命名实体识别   总被引:2,自引:0,他引:2  
为了解决基于分词的渔业领域命名实体识别效果受分词准确度影响这一问题,采用一种基于深度学习的渔业领域命名实体识别方法。该方法使用神经网络训练得到字向量作为模型输入,避免了分词不准确对渔业领域命名实体识别效果造成的影响;针对渔业领域命名实体长度较长这一特点,使用LSTM单元保持较长时间记忆信息,并将标记信息融入到CRF模型中构建Character+LSTM+CRF实体识别模型。为验证方法的有效性,在渔业领域语料集上进行多组实验,结果表明,本研究中提出的Character+LSTM+CRF方法具有较好的效果,与LSTM模型相比较,在准确率、召回率、F值上分别提升了3.39%、2.99%、3.19%,对于渔业领域实体识别具有较好的效果。  相似文献   

14.
[目的/意义]研究情报认知模型库的组织、建设方法,帮助科研人员和情报分析人员快速形成对学科领域的准确认知,协助识别科技机遇、甄别技术威胁。[方法/过程]情报认知模型库包含跨领域的各种技术要素和文献信息,因此在结构上包括文献库、算法库、学科领域知识库、研究应用案例库等,支持研究热点识别、技术性能对比、智能分析方法推荐、算法辅助设计等功能。模型库的建设流程包括对情报认知模型的收集、验证、存储、组织、利用等,其中对模型的验证是至关重要的一步。[结果/结论]构建情报认知模型库对开展科学技术领域情报工作具有重要意义,能够发挥科技数据基础设施、科技情报分析工具箱的效果。情报认知模型库的构建需要情报人员、科学技术领域专家、信息技术人员的通力合作,未来需要进一步考虑模型库的维护升级、推广应用等问题。  相似文献   

15.
[目的/意义]近代文献中的图像作为重要的历史史料,日益受到人文学者的重视,大规模图像资源的深度标注也随之成为图像数据基础设施建设的重要组成部分,利用深度学习对海量图像进行内容解析是图像研究的新方向。本文的研究目的,是通过基于EfficientNet的迁移学习在近代文献图像分类中的实证研究,解决大规模近代文献图像的自动分类问题,提高其在实际应用中的准确率和效率。[方法/过程]本文的研究方法,是根据近代文献图像中的特征分析,采用7 645张近代文献图像数据集,通过裁切、白平衡、色调分离、仿射变换等图像增强手段串行叠加,提高样本图像的多样性,并通过对深度学习算法的研究,使用微调的简化EfficientNet深度卷积神经网络模型进行迁移学习,最终得到了在近代文献图像分类上表现良好的模型。[结果/结论]本文的研究结论,是根据实验结果发现,该模型有效提高了图像分类效率和分类准确性,对于解决近代文献中大规模图像的自动分类具有一定的推广价值。  相似文献   

16.
[目的]在科技情报资源快速增长的环境下,通过大文本数据分析快速发现研究主题,且进一步挖掘各研究主题下的技术发展与变化,对做出全面快速响应的科技情报工作有着重要的意义。[方法]针对大文本数据,利用Python实现了文本预处理后的LDA模型主题发现与技术演进,首先构建文本预处理泛化模型,实现技术词自动识别处理;然后基于技术词进行LDA模型构建及可视化,来识别研究主题;最后基于技术词构建技术演进的计算模型,来进一步挖掘技术的发展与变化。[结果]文章以SiC技术领域43621项专利为分析对象进行了实践,包括文本预处理、主题发现及可视化、某主题下技术发展和变化分析等全流程,处理畅通且用时很短(案例全程历时约10分钟)。[局限]文章提出的LDA各主题下技术演进模型中,文档只与其相关度最大的主题关联,尚未对文档多主题关联情况下的演进效果进行对比,后续有待进一步优化验证。[结论]文章提出的方法对快速全面把握一个科技领域有着重要作用,通过主题的识别以及主题之下的技术发展变化,可以以不同的颗粒度去研究一个科技领域,并对后续的调研分析提供有价值的线索。  相似文献   

17.
[目的]研究基于功能-结构互反馈的虚拟植物建模方法。[方法]在分析当前虚拟植物建模方法缺点的基础上,提出了基于功能-结构互反馈思想的建模方法,详细阐述了该方式建模的各个步骤,包括形态结构模型的确定、生物量生产模型的确定、生物量分配模型的确定、器官重建模型的确定以及形态结构模型与功能模型的融合方法。[结果]基于功能-结构互反馈的机制突破了生理生态模型与形态结构模型的界限,可以解决2类模型之间数据传输的困难,建立融合2者于一体的模型,能够有效的反映植物形态与功能之间内在的关联关系,更加符合植物的生长机理。该建模方式在动态模拟植物生长方面具有显著的优越性。[结论]基于功能-结构互反馈的虚拟植物建模方法为下一阶段植物生长状态的模拟提供了基础,对动态准确的模拟植物的生长过程有着重要意义。  相似文献   

18.
[目的/意义]随着面向典籍的数字人文研究的不断深入,对基于文本内容的细粒度分类要求不断提高,合理的分类已成为数字化典籍研究和有效利用的关键。[方法/过程]研究利用分面分类思想,以典籍文本数据及相关典籍词典为研究对象,结合概念语义信息,组织并描述典籍内容数据特征。[结果/结论]本文构建的分类体系突破典籍数量、体裁和种类的限制,从政治、经济、文化、社会和军事5个维度将典籍内容进行有序的组织与揭示,对典籍数字资源的深度开发和利用具有重要价值。  相似文献   

19.
[目的/意义]硕士研究生是学术研究的生力军和后备力量,探讨其学术信息消费的信任影响机制,有助于提高学术信息生产和学术信息服务的质量,更好地满足硕士研究生的学术信息消费需求。[方法/过程]基于信任理论和信息利用行为相关理论,采用访谈法针对40个样本获取研究所需数据,运用扎根理论编码所获取的数据,构建并阐释硕士研究生学术信息消费的信任影响机制模型,最后提出改进硕士研究生学术信息消费的策略。[结果/结论]信息来源特征、信息渠道特征、信息内容特征和硕士研究生个人特征影响硕士研究生对学术信息的感知信任,硕士研究生对学术信息的感知信任影响其学术信息消费,感知信任在前述4个因素和学术信息消费之间发挥中介作用。  相似文献   

20.
基于ResNet-50深度卷积网络的果树病害智能诊断模型研究   总被引:1,自引:1,他引:1  
[目的/意义]果树病害危及农业生产安全,运用人工智能技术帮助果农及时准确地识别果树病害对保障农业安全生产具有重要意义。[方法/过程]采用10000张果树叶片病斑图像数据集,通过旋转、污化、增噪、切割等图像增强手段,提高样本图像的多样性;使用ResNet-50深度卷积网络模型,进行机器学习,获得果树病害识别模型,并基于此模型开发了应用软件提供在线诊断服务。[结果/结论]实验结果表明:该模型对4种果树病害的平均识别率达到92.9%,和相关研究成果相比具有较好的诊断效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号