首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于C#正则表达式的农业文献管理系统的研究与应用
引用本文:杨波,张立娜.基于C#正则表达式的农业文献管理系统的研究与应用[J].安徽农业科学,2012(5):2988-2990.
作者姓名:杨波  张立娜
作者单位:1. 吉林财经大学信息经济学院,吉林长春,130122
2. 吉林农业大学,吉林长春,130118
摘    要:利用PDFBOX和正则表达式批量提取已下载到本地的PDF格式农业文献的元数据,建立农业文献信息关系型数据库,根据需要建立农业文献管理系统,提高农业文献利用效率和科研效率。在C#环境下,对PDFBOX进行封装,利用数据流的写入功能将PDF格式的农业文献的二进制内容以简体中文输出,再利用正则表达式设计规则模型批量提取相关元数据。

关 键 词:PDF  PDFBOX  正则表达式  元数据  提取

Research and Application of C # Regular Expression in Agricultural Document Management System
Institution:YANG Bo et al(Information and Economy College of Jilin University of Finance and Economics,Changchun,Jilin 130122)
Abstract:By using PDFBOX and regular expression to extract the metadata of agricultural documents in PDF format which has been downloaded to the local,then create an agricultural document management system to improve the efficiency of utilization of agricultural documents resource and research.In C # environment,package PDFBOX,use the writing function of the data stream convert the binary content of the agricultural documents in PDF format to Simplified Chinese and output,then design rules model by regular expression to extract metadata of PDF documents.
Keywords:PDF  PDFBOX  Regular expression  Metadata  Extraction
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号