首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 271 毫秒
1.
白色青年羊驼皮肤的基因表达分析   总被引:1,自引:0,他引:1  
 【目的】研究羊驼皮肤功能发生的规律和机理以及发现新的功能基因。【方法】用SMART技术构建白色青年羊驼皮肤cDNA文库,随机挑取13 800个克隆进行规模测序。预处理后,获取高质量的表达序列。用CAP3对高质量序列进行拼接;BLAST对拼接序列进行同源比较,以注释功能;CLUSTER对已知序列进行聚类;根据标准基因词汇体系,并结合人组织基因表达谱分类标准,对具有注释信息的基因聚类进行分类,构建羊驼皮肤的基因表达谱。【结果】cDNA文库库容量达106PFU,从中获得高质量序列7 286条(在GenBank中命名为ASCD)。拼接成5 837条一致性序列,包括446条重叠群和5 391条单一序列。1 732条无相应注释,被认为是新基因。聚类成4 968个单基因簇(Unigene)。该基因表达谱最显著的特点是代表基本转录和翻译系统以及细胞骨架结构的转录本的表达丰度处于最高水平,原胶原I型(Procollagen typeI)等单个基因表达丰度处于较高水平。此外,还发现可能与羊驼毛质量、生长和毛色相关的基因。【结论】首次构建了羊驼皮肤cDNA文库和基因表达谱;获取的大量基因信息反映了青年期白色羊驼皮肤的生理特性和功能;该文库的构建是有效地发现新基因的理想资源。  相似文献   

2.
通过生物信息学分析方法,利用广泛使用的基因芯片技术产生的数万个基因表达数据,揭示基因的功能和相互作用。聚类分析是一种主要的生物信息学分析方法,能高效发掘功能一致的基因。针对基因表达谱聚类分析方法较多、应用者选择方法困难的问题,本研究利用3组基因表达谱模拟数据和1组酵母菌基因表达实际数据,通过Caliński-Harabasz指数、灵敏值和分类正确率3个指标,比较了平滑样条聚类、数量性状关联聚类和局部逼近模糊聚类法3种经典方法。结果表明:平滑样条聚类法的Caliński-Harabasz指数平均数最大,灵敏值平均数最小,分类正确率最大,为最优方法;数量性状关联聚类次之,局部逼近模糊聚类最差。这一结果为今后基因表达谱数据聚类分析方法选择提供了参考依据。  相似文献   

3.
利用RAPD标记分析柞蚕品种资源的亲缘关系   总被引:7,自引:0,他引:7  
刘彦群  鲁成  秦利  向仲怀 《中国农业科学》2006,39(12):2608-2614
【目的】从分子水平揭示柞蚕品种资源之间的遗传关系,为柞蚕的育种及种质资源的利用提供依据。【方法】利用RAPD(random amplified polymorphic DNA)技术,对来自中国6个主要柞蚕产区的66个品种(系)和2个朝鲜的品种的基因组DNA多态性进行分析。根据扩增结果计算单匹配相似系数,用Neighbor-Joining法构建聚类图。【结果】筛选出的33个随机引物对68个柞蚕品种(系)共扩增出296条DNA带,其中多态性带269条(90.88%)。品种间的成对遗传距离在0.120~0.324之间,主要集中在0.200~0.300之间,有99.05%的品种对的遗传距离小于0.300。聚类分析表明,供试的68个柞蚕品种(系)聚为6个类群,并表现出按目前所在地域(产地)聚类的特性。【结论】柞蚕品种资源之间的遗传差异较小,并且遗传聚类与其目前的地理分布有密切相关性。  相似文献   

4.
芝麻空间诱变品系(种)的DNA指纹分析   总被引:5,自引:2,他引:5  
孙建  涂玉琴  张秀荣 《中国农业科学》2007,40(12):2696-2701
 【目的】揭示芝麻空间诱变品系(种)的DNA水平上的变异,探讨芝麻空间诱变的分子机理,以期为作物空间诱变育种提供理论基础。【方法】首次应用AFLP标记对芝麻空间诱变的3个品系(种)及原始对照种豫芝4号(未搭载处理的留地种子)进行DNA指纹分析。【结果】随机组合的30对AFLP引物对原始对照种及3个空间诱变品系(种)进行扩增,共获得1176条DNA谱带,其中多态性谱带625条,多态性位点比率为53.15%,每对引物均扩增出多态性,并且每一个空间诱变品系(种)与原始对照种间均扩增出多态性DNA谱带。利用NTSYS软件进行类平均法(UPGMA)聚类发现3个空间诱变品系(种)明显地聚在一起,与原始对照种存在较大差异。【结论】通过空间诱变能够在DNA水平上导致芝麻遗传物质变异,空间诱变是一种有效的育种途径。AFLP是一种研究植物空间诱变材料的高效率的分子生物学方法。  相似文献   

5.
【研究目的】为了解河北省40年来不同小麦品种之间的遗传多样性,以及为小麦育种工作提供理论依据;【方法】采用酸性聚丙烯酰胺凝胶电泳(A-PAGE)对河北省40年来的118个主栽小麦品种进行了醇溶蛋白位点特异性检测,分析了这些品种的遗传多样性及其变化情况;【结果】这些品种具有118种醇溶蛋白带型,共分离出101条迁移率不同的醇溶蛋白谱带。绝大多数品种在α、β、γ、ω 4个区中存在着较大差异,其中α区有15条带,87种带型;β区有24条带,110种带型;1区有21条带,90种带型;(1)区有41条带,111种带型,其中(1)区的多态性最大。供试品种的遗传相似性系数(GS)在0.043-43.86之间,平均值为0.35。用非加权成组算术平均法对GS值进行聚类,供试品种在GS值为0.354的水平下可明显聚为6类;【结论】用非加权成组算术平均法对Gs值进行聚类,供试品种在GS值为0.354的水平下可明显聚为6类。讨论了种子醇溶蛋白在品种遗传多样性评价方面的应用价值。  相似文献   

6.
利用数量性状构建新疆野苹果核心种质的方法   总被引:8,自引:3,他引:5  
 【目的】以300份新疆野苹果实生株系为试验材料,根据叶片、花朵和果实等器官15个数量性状的遗传多样性,研究新疆野苹果核心种质构建的方法。【方法】采用逐步聚类法,以30%的取样比例,根据2种遗传距离(欧氏距离和马氏距离)、4种系统聚类方法(类平均法、离差平方和法、最长距离法和最短距离法)和3种取样方法(随机取样法、偏离度取样法和优先取样法)构建24个核心种质,以筛选出的最佳构建策略进一步比较7种不同取样比例(10%、15%、20%、25%、30%、35%和40%)的构建效果以确定最适宜的取样比例。【结果】(1) 在新疆野苹果构建中,采用欧氏距离聚类优于马氏距离。(2) 4种系统聚类方法比较表明,最短距离法优于类平均法、离差平方和法和最长距离法。(3) 3种取样方法比较表明,优先取样法和偏离度取样法都能明显提高核心种质的方差差异百分率、极差符合率和变异系数变化率,均适宜于新疆野苹果核心种质的构建,前者略优于后者。(4)20%是最适宜的取样比例。【结论】以20%的取样比例,采用欧氏距离,利用最短距离法进行逐步聚类,结合优先取样法构建的核心种质最有代表性,是构建新疆野苹果核心种质的最佳方法。  相似文献   

7.
【目的】探讨实际问题研究中的不完全数据聚类。【方法】利用相关变量的辅助信息,对缺失数据进行推估,确定其合理的替代值,从而构造出一个“完全”数据集。在此基础上以EM算法循环迭代,参数的估计值和缺失数据的替代值都将逐渐收敛,以相应的贝叶斯后验概率判别个体的归类,进而实现动态聚类。【结果】模拟研究表明,缺值替代法具有较好的收敛性,对有缺失的数据基本都可正确地聚类。【结论】Fisher的鸢尾花花类识别数据验证了缺值替代法的可行性,其聚类的准确性高于缺值删除法,基本接近完全数据聚类。  相似文献   

8.
石榴品种数量分类研究   总被引:9,自引:0,他引:9  
 【目的】分析石榴表型遗传多样性,从数量分类角度对其进行分类研究,为石榴品种形态分类和优良品种选育奠定基础。【方法】根据28个形态特征对62个石榴品种资源对生物学特进行观察并测定性状数值,利用UPGMA法和组内均联法作图。【结果】组内均联法和UPGMA法都支持品种亲缘近的品种聚合在一起;组内均联法聚类,可以将石榴品种划分出,分别为单瓣和复瓣、重瓣、台阁3个品种群;UPGMA法可以分出单瓣、重瓣和台阁品种群,但出现了极个别品种的交叉,两种方法与形态分类基本一致;UPGMA法对62个品种聚类,支持了在形态分类时把花色、株高、花瓣性状作为分类标准。【结论】数量分类用于石榴品种分类研究与形态分类基本一致,可以支持形态分类,同时可以显现品种亲缘关系,并且花色、花瓣、株高在聚类分析中起着重要作用。  相似文献   

9.
【目的】寻求更为准确的盐渍土分类方法。【方法】对模糊聚类法的原理进行了介绍,并结合西北某机场重要建筑物的地质特点,利用模糊聚类法对该地区10个检测点的地基土进行了分类。【结果】西北某机场10个检测点的地基土可分为4类,即(1,2,3,4,8,9)区域属于亚硫酸盐渍土;(5,6)区域属于亚氯盐渍土;(10)区域属于碳酸盐渍土;而(7)区域属于非盐渍土。【结论】盐渍土分类的模糊聚类法较传统分类法简单、准确可靠,尤其是能具体判断出某点或某区域是否为盐渍土,对盐渍土的评判和地基处理有较大帮助。  相似文献   

10.
基于模糊聚类分析的田间精确管理分区研究   总被引:13,自引:0,他引:13  
【目的】以海涂围垦区盐碱土为研究对象,将从SPOT遥感影像提取出的NDVI数据和盐碱地土壤生产力的主要限制因子盐分数据及部分养分数据作为变量进行精确农业管理分区研究。【方法】模糊c均值聚类方法被用来进行分类分区,并引入了模糊聚类指数和归一化分类熵两种分区效果评价指标,对分区结果进行比较和评价。【结果】本研究区,最佳的分区数目为3个。对处于每一子区内土样的化学特性和实测棉花产量数据进行方差分析,发现其均值在所定义的每个管理分区内都存在着统计意义上的显著差异性,其中子区3具有最高的肥力水平和作物产量,而子区1最低。【结论】利用所选取的变量,模糊c均值聚类算法可以较好地进行管理分区划分。分区结果不但可以指导采样,而且可用于实施变量投入和精确施肥推荐,为样区土壤管理提供科学的决策依据。  相似文献   

11.
Several typical supervised clustering methods such as Gaussian mixture model-based supervised clustering (GMM), k- nearest-neighbor (KNN), binary support vector machines (SVMs) and multiclass support vector machines (MC-SVMs) were employed to classify the computer simulation data and two real microarray expression datasets. False positive, false negative, true positive, true negative, clustering accuracy and Matthews' correlation coefficient (MCC) were compared among these methods. The results are as follows: (1) In classifying thousands of gene expression data, the performances of two GMM methods have the maximal clustering accuracy and the least overall FP+FN error numbers on the basis of the assumption that the whole set of microarray data are a finite mixture of multivariate Gaussian distributions. Furthermore, when the number of training sample is very small, the clustering accuracy of GMM-Ⅱ method has superiority over GMM- Ⅰ method. (2) In general, the superior classification performance of the MC-SVMs are more robust and more practical, which are less sensitive to the curse of dimensionality, and not only next to GMM method in clustering accuracy to thousands of gene expression data, but also more robust to a small number of high-dimensional gene expression samples than other techniques. (3) Of the MC-SVMs, OVO and DAGSVM perform better on the large sample sizes, whereas five MC-SVMs methods have very similar performance on moderate sample sizes. In other cases, OVR, WW and CS yield better results when sample sizes are small. So, it is recommended that at least two candidate methods, choosing on the basis of the real data features and experimental conditions, should be performed and compared to obtain better clustering result.  相似文献   

12.
以广东省第二次土壤普查成果资料为主要数据源,选取贝叶斯决策、BP神经网络、概率神经网络、聚类等分类方法分别对数据源进行分类;并且,笔者为了充分利用有监督学习分类准确率高和无监督学习无需标定的学习样本的优点,提出了基于监督--非监督的聚类算法,然后对上述五种方法的评价结果作了比较分析;实验表明文章提出的基于监督--非监督聚类方法只利用少量的有标定学习样本,即可得到较高的分类准确率,特别在少量样本时,该方法能得到比贝叶斯决策方法、BP神经网络和概率神经网络等监督学习方法更好的土地评价结果;在实际应用中,可以尝试结合监督和非监督学习的方法,实现分类正确率和获取大量有类标签的样本之间的折中。  相似文献   

13.
茶叶市场掺假现象愈演愈烈,为了保护消费者权益,促进茶叶产业的发展,对茶叶进行快速高效的溯源鉴定是尤其重要的。目前,市面上采用的茶叶溯源方法大多需要数量较为固定的样本量去进行预测分析,但在实际应用中,由于大规模样本的需求,会导致预测成本进一步提高。本文以浙江安吉白茶为研究对象,通过在不同的有监督与半监督模型下对不同样本量预测准确度的比较,为实际应用中,在保证预测准确度的前提下,合理经济化的选取样本量提供了参考意见。结果显示,在有标签样本较少的情况下,基于半监督算法建立的茶叶溯源模型效果比有监督算法建立的茶叶溯源模型效果更好。  相似文献   

14.
目的 针对传统混合高斯模型前景检测运算量过大问题,提出一种基于空间约束的混合高斯前景检测算法。方法 通过快速初始化缩短模型的初始建立过程;采用双重背景模型机制,以自适应背景减法的前景检测结果作为混合高斯前景检测的空间约束条件,降低模型在背景区域的冗余运算;运用多策略自适应模型更新,提高前景检测的准确性。结果 在各种测试场景下,与传统混合高斯法、CodeBook、GMG、偏差均值混合高斯模型(MODGMM)等算法相比,该算法具有更好的准确率以及4倍以上的处理速度。结论 在固定相机场景下的运动目标检测中,算法能有效提高传统混合高斯法的准确性且具有极高的实时性。  相似文献   

15.
This paper describes a supervised learning approach to sow-activity classification from accelerometer measurements. In the proposed methodology, pairs of accelerometer measurements and activity types are considered as labeled instances of a usual supervised classification task. Under this scenario sow-activity classification can be approached with standard machine learning methods for pattern classification. Individual predictions for elements of times series of arbitrary length are combined to classify it as a whole. An extensive comparison of representative learning algorithms, including neural networks, support vector machines, and ensemble methods, is presented. Experimental results are reported using a data set for sow-activity classification collected in a real production herd. The data set, which has been widely used in related works, includes measurements from active (Feeding, Rooting, Walking) and passive (Lying Laterally, Lying Sternally) activities. When classifying 1-s length observations, the best method achieved an average recognition rate of 74.64%, for the five activities. When classifying 2-min length time series, the performance of the best model increased to 80%. This is an important improvement from the 64% average recognition rate for the same five activities obtained in previous work. The pattern classification approach was also evaluated in alternative scenarios, including distinguishing between active and passive categories, and a multiclass setting. In general, better results were obtained when using a tree-based logitboost classifier. This method proved to be very robust to noise in observations. Besides its higher performance, the suggested method is more flexible than previous approaches, since time series of any length can be analyzed.  相似文献   

16.
陈伟利  陶和平  刘斌涛 《安徽农业科学》2010,38(20):10662-10664
多光谱遥感图像反映了不同地物的光谱信息,而SAR图像则反映了地表不同地物的后向散射强度信息。通过二者结合,可以实现优势信息互补,提高遥感影像分类的精度。多光谱影像与单波段单极化SAR图像融合分类有2种策略:一种是将SAR图像作为一个波段加入多光谱影像中进行分类;另一种先把多光谱影像与SAR图像融合,然后对融合后的图像进行分类。以成都市使用支持向量机分类方法对2种分类策略下的分类精度进行验证。结果表明,后者分类精度要高于前者,同时2种分类方法的分类精度都明显高于单独使用多光谱影像的分类精度。  相似文献   

17.
基于贝叶斯法的长白落叶松林分优势高生长模型研究   总被引:3,自引:2,他引:1  
贝叶斯统计推断是基于总体信息、样本信息和先验信息的一种统计推断方法,并已成为森林生长模型中的一种重要方法。本文以长白落叶松人工林为对象,基于1 687对林分优势高与年龄数据,利用Richards生长方程构建基于贝叶斯法和经典概率统计法的林分优势高生长模型,探讨贝叶斯统计法拟合小样本量数据的稳定性。分别基于全部样本,以及随机抽取的10%、5%和2%样本,利用经典概率统计法(非线性最小二乘法)、无先验信息的贝叶斯统计法和有先验信息的贝叶斯统计法进行参数估计,分析模型表现和参数分布。模型评价指标包括均方根误差(RMSE)、贝叶斯统计常用的DIC统计值以及参数的可信区间。结果表明:基于小样本的贝叶斯统计与大样本的经典概率统计的拟合结果相近,但贝叶斯统计法估计的参数稳定性强,且抽样5%时的RMSE值最小。有先验信息的贝叶斯统计拟合结果优于无先验信息的贝叶斯统计拟合结果,参数分布也较为集中,不确定性小;有先验信息贝叶斯统计和经典概率统计的参数分布区间有较大重叠。另外,有先验信息贝叶斯统计对3种不同样本量的拟合结果显示,参数标准差以及模型RMSE值都是在抽样5%时最小,说明用贝叶斯统计的拟合精度及参数确定性与样本量大小也有一定关系。研究验证了贝叶斯统计在利用先验信息、基于小样本量进行森林生长建模时的优越性。   相似文献   

18.
本研究旨在比较线性回归模型与机器学习模型在利用体尺性状预测体重时的准确性。测定102头革吉那布地区两岁龄牦牛相关体尺性状(体高、体长和胸围)与体重,然后将数据按照不同比例梯度分为训练集和测试集,利用传统的一般线性模型方法和机器学习方法(高斯过程回归、支持向量机)分别构建体尺性状与体重之间的回归预测模型。每个比例均重复5次,将体重的真实值与预测值之间的相关系数均值作为当前比例下的模型准确性结果。结果显示,随着训练集数据的增加,线性回归模型的预测结果较稳定在0.71至0.80之间,而机器学习方法的预测准确性最高达到0.91。故在训练集数据充足的情况下,相比于一般线性模型,利用机器学习方法进行预测具有更高的准确性。  相似文献   

19.
农田不同粒级土壤含水量光谱特征及定量预测   总被引:3,自引:1,他引:2  
【目的】土壤含水量是土壤属性的关键参数。摸清不同机械组成条件下土壤水分的光谱变化并实现土壤含水量的定量预测,为农田水分的快速监测及土壤其他属性的定量获取提供依据。【方法】通过人为控制获得不同粒级和不同含水量的土壤样品,确定室内土壤光谱测定的几何条件,采集不同土样的光谱特征并进行比较,按粒径等级利用最小二乘法(PLSR)建立农田土壤含水量的光谱定量预测模型。【结果】土壤光谱反射率总体趋势是随含水量增加而降低,其差异随着波长的增加和含水量的降低而增加,在1 400 nm和1 900 nm的水分敏感波段随含水量增加光谱吸收深度也增加。但当含水量大于40%时,通过孔径为0.15 mm 筛子的土壤样品(处理D-1),在350-1 240 nm光谱反射率随含水量增加而升高,而1 240 nm以后随含水量增加而降低。相对于将所有样本数据混合建立模型,分粒级建立的模型在细颗粒土壤中预测效果得到了明显改善,并且样品越细模型在预测效果和稳定性也越好:最优模型均方根误差RMSE=4.13%,决定系数R2=0.90。同时,数据归一化处理后所建立的模型在一定程度上降低了噪声的影响,从而在预测效果和稳定性上也有所改善。【结论】土壤光谱随含水量的变化而变化,但并不都表现随含水量增加光谱反射率降低的特点,当含水量大于40%时,细颗粒土壤样本表现为在350-1 240 nm波段光谱反射率随含水量增加而升高;土壤含水量预测模型的精度和稳定性随着土壤粒径变小、样本量增大以及光谱数据归一化预处理而得到改善。  相似文献   

20.
以山西省4638种昆虫在7个地理小区的分布、内蒙古7766种昆虫在14个地理小区的分布和中国16804属昆虫在67个生态区域的分布3组数据为样本,用传统的层层合并的相似性聚类分析法(SCA)和新的不需合并的多元相似性聚类分析法(MSCA)进行运算分析,对比结果表明,不合并法都能得到既符合统计学逻辑,又符合地理学、生物学逻辑的结果;合并法在参与小区较少时,还能够得到与不合并法类似的结果,随着参与小区的增多,聚类结构发生变化,以致聚类功能彻底丧失。无论两种聚类结果差异大小,其性质都迥然不同:不合并法的相似性系数是固有的、互相独立的、同时存在的,聚类结果是所有小区之间关系亲疏、距离远近的状态;合并法的每个相似性系数都是合并的依据或结果,前一个系数是后一个系数产生的条件,后一个系数是前一个系数消亡的结果,严格按照顺序,当最后一个系数产生时,前面所有系数和所有小区都已不复存在,聚类结果只是记录不断合并、不断消亡的过程。因此在肯定合并法历史价值的同时,认为申效诚等创建的多元相似性系数公式及多元相似性聚类分析法摈弃合并降阶这一产生偏差和错误的根源,能够得出相对客观的聚类结果,是生物地理学研究领域有效的聚类分析工具,必将推动生物地理学定量研究迈入一个新阶段。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号