共查询到18条相似文献,搜索用时 421 毫秒
1.
2.
网络爬虫主要受到网络延迟和本地运行效率的限制,传统的基于多线程的网络爬虫架构主要为了消除网络延迟而没有考虑到本地运行效率。在高并发的条件下,多线程架构爬虫由于上下文切换开销增大而导致本地运行效率降低,同时使得网络利用率下降,如何能够在最大化利用网络资源的情况下减小系统本地开销是一个需要研究的问题。针对以上问题,本文提出基于协程的分布式网络爬虫框架来解决,从开销、资源利用率、网络利用率上对协程框架和多线程框架进行了分析,并基于协程实现了一个分布式网络爬虫。实验表明该框架无论从开销、资源利用率和网络利用率上相对于多线程框架有比较明显的优势。 相似文献
3.
4.
5.
近年来发生的多起运用网络爬虫技术恶意爬取网络数据的案件,这些案件涉及公民个人信息保护、网络数据权属界定等诸多法律问题,引发了网络从业人员和法律人士的广泛关注。善意爬虫会促进网络数据的有效流通和运用,进而促进互联网产业的健康快速发展。恶意爬虫则会影响被爬取方网站的正常运行,攫取被爬取网站的重要数据,甚至构成刑事犯罪。网络从业人员必须遵守相关法律规定、按照机器人协议的要求合法合理地进行公开数据爬取,防范爬虫行为可能带来的法律风险。 相似文献
6.
7.
随着农业新闻数据日益膨胀,保证以农业为主题的增量爬虫成为爬取农业信息的相关手段,增量爬虫的原理可以依据农业新闻数据的更新爬取数据相关更新的内容,剔除出已经爬取的重复内容[[]]。文章结合农业新闻数据信息的特点,提出了一种适用于农业新闻信息的基于Redis的布隆过滤器的增量去重方法,摆脱超大的持久化文件撑爆内存的问题。通过实验证明随着抓取相关农业信息的增加,该方法在保证内存不被撑爆同时能有效提高增量爬取农业信息的效率,在增量信息爬取的过程中具有很好的应用价值[[]]。 相似文献
8.
9.
10.
聚焦爬虫是主题搜索引擎的核心部件。针对目前聚焦爬虫搜索策略的不足,提出基于主题相关度和页面重要性相结合的综合相关度来判别页面主题相关性,并采用自适应免疫进化算法这种搜索策略指导聚焦爬虫的爬行,实验结果证明,该算法下载的主题相关网页数所占比例明显高于最佳搜索和广度优先搜索算法的比例,具有更高的搜索效率。 相似文献
11.
[目的/意义]当前农业新闻分类研究中的模型训练以被动学习方式居多,普遍存在数据无法即时标注及标注成本过高的问题,对农业新闻分析工作也造成了一定阻碍。为解决该问题,运用主动学习或者深度主动学习技术从未标注数据中选择更有价值和代表性的数据进行人工标注并构建标注数据集,提升农业新闻挖掘工作效率和效果。[方法/过程]将文本分类常用的机器学习模型结合主动学习方法分析提升效果,以及使用BERT模型结合3种采样策略进行深度主动学习训练,在共19 847条样本的新闻爬虫语料上以筛选出农业相关新闻为目标,通过每轮增加30个样本标注的迭代实验进行测试。[结果/结论]实验结果表明:主动学习方法的应用对各个模型的训练过程均有明显提升。其中BERT模型配合判别性主动学习采样函数,具有最优的新闻文本分类效果和最低的标注数据需求。 相似文献
12.
1600t摩擦压力机上支重轮半体模锻成形模具设计 总被引:1,自引:0,他引:1
韩东熙 《延边大学农学学报》2008,30(4)
介绍了在1600 t摩擦压力机上模锻工程机械履带式推土机支重轮半体的工艺、成形模设计方法、工作原理及模具使用过程中注意事项等. 相似文献
13.
一种可变形履带行走装置的设计 总被引:1,自引:0,他引:1
针对微型履带车辆在丘陵山区崎岖路面和坡地作业时存在稳定性减弱、爬坡性能变差等问题,提出了一种采用三连杆运动变形机构,由固定在行走架上的液压缸驱动变形机构变形,使得行走架在一定角度范围内处于水平的可变形履带行走装置设计方案。通过对变形机构的自由度计算和可变形履带行走装置的数学建模,分析了平衡状态下变形杆件的受力情况和机构的变形性能,确定了变形角度与构件之间的相对关系,以及坡地行驶过程中,变形与未变形状态下履带车辆的垂直越障和爬坡性能。结果表明:可变形履带行走装置可实现28°以下坡度自适应;变形后,能够提升车辆在坡地作业时3°左右的爬坡性能,但减弱了垂直越障能力。 相似文献
14.
为解决传统履带式联合收割通常不能实现原地转向、水田通过性较差等问题,提出了新型的液压—机械行走系统方案设计。主要阐述了所采用的技术方案,即采用双联集成变量柱塞泵和2个定量摆线马达组成相互独立闭式液压传动系统;由定量摆线马达驱动安装在履带驱动轮上的单级行星轮减速器,通过单级行星轮减速器增加扭矩后,由履带驱动轮带动履带工作。该设计方案可以实现联合收割机的原地回转,并且提高了联合收割机的水田通过性。 相似文献
15.
为改善小型履带式采伐机转向性能和提高采伐机采伐作业时的工作效率,运用转向动力学和履带行走机构转弯理论对小型采伐机的履带行走机构进行转向阻力矩和转向受力分析,并推导出理论转弯半径、转向阻力矩、转向参数的数学表达式。以履带行走机构接地长度,轨距以及采伐机自重等参数为例进行计算,计算出理论转弯半径、理论转向阻力矩、转向系数、转向比。结果表明,当转向系数k>0.5时,慢侧履带制动,快侧履带提供切线牵引力与实际工作情况完全吻合;同时验证了理论分析的准确性,为小型履带式采伐机的转向理论研究提供了理论依据。 相似文献
16.
山地履带拖拉机纵向坡地越障性能仿真分析及试验验证 总被引:1,自引:1,他引:0
山地履带拖拉机作为一种农用动力机械,工作在地形复杂、条件恶劣的丘陵山区,因此,要求其不仅具有一般履带拖拉机的基本特点,而且应具有良好的坡地越障性能。利用Pro/E三维软件绘制山地履带拖拉机车体几何模型,并在多体动力学软件Recur Dyn中完成履带行走机构的选配及整机动力学模型的建立,同时利用Recur Dyn自带的地面Ground模块建立地面模型,基于以上3种模型对该机进行多体动力学仿真,分析速度、坡度角及拖拉机质心位置对其纵向坡地越障性能相关参数的影响。仿真结果表明,在车速与坡度角一定的情况下,质心位置越靠车体前端且越接近地面,越有利于纵向越障性能。相关的坡地实测试验所测得结果与仿真结果基本保持一致,验证了仿真模型的正确性,为山地履带拖拉机进一步的改进设计提供理论参考依据。 相似文献
17.
18.
张千山 《湖南农业大学学报(自然科学版)》2001,(3)
在网络新闻短短的发展过程中,出现大量的虚假新闻,引起了人们的困惑。文幸分析了网络新闻失实产生的原因,提出了解决网络新闻真实性问题的方法,并对网络新闻真实性的发展前景作了乐观展望。 相似文献