首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
全基因组关联分析(genome-wide association study,GWAS)是定位基因组中与性状显著关联的变异位点的有效方法。随着表型记录的完善、高通量基因型分型技术的发展,以及统计方法的改进,全基因组关联分析在人类疾病、动物植物遗传等领域得到了广泛的应用。假阳性是影响全基因组关联分析结果可靠性的重要因素之一。为了控制假阳性,除了校正P值,GWAS模型从最简单的方差分析(或用于质量性状的卡方检验)到加入固定效应协变量的普通线性模型(general linear model,GLM),再到加入随机效应的混合线性模型(mixed linear model,MLM)持续改进,控制了多种混杂因素导致的假阳性。将个体的遗传效应拟合为由基因组亲缘关系矩阵(genomic relationships matrix,GRM)定义的随机效应是目前常用的方法。由于MLM的参数估计大量消耗计算资源,研究人员不断尝试模型求解优化和GRM的构建优化(GRM的构建优化同时也提高了计算效率),最终将基于MLM计算的时间复杂度由O(MN3)逐步改进到O(MN),实现了计算速度与统计功效的飞跃。针对质量性状...  相似文献   

2.
对猪全基因组高密度SNP基因型数据及生长性状表型数据进行全基因组关联分析,以期找到影响这些性状的候选基因,更准确地了解这些生长性状的遗传基础。利用Illumina猪60KSNP芯片对191头杜洛克猪进行基因型检测,使用R语言环境下GenABEL 软件包提供的单标记回归分析模型,对体重达100 kg 日龄(D100)、活体背膘厚(BFT)和活体眼肌面积(LMA)3个生长性状的表型分别进行全基因组关联分析。在D100和LMA2个性状中分别检测到1个基因组水平和6个染色体水平显著关联的SNP,均位于5号染色体;没有检测到与BFT显著相关的SNP。生物信息学分析表明,BTG1和EFCAB6可能是影响生长性状的重要候选基因,但其功能有待进一步研究确认。关键词猪;全基因组关联分析;候选基因;生产性状。  相似文献   

3.
[目的]本研究将FASTmrEMMA、最小角回归(least angle regression, LARS)和随机森林(random forest, RF)方法应用于全基因组选择,以提高植物数量性状预测的准确性和效率,为植物遗传和育种提供有益信息。[方法]对拟南芥自然群体的模拟数据和真实数据进行全基因组预测。在模拟数据分析中,设置不同的表型缺失率,以平均绝对误差(mean absolute error,MAE)、均方误差(mean squared error,MSE)、预测模型拟合度和计算时间为指标,比较基于最小角回归和随机森林的两阶段算法(two-stage algorithm based on least angle regression and random forest, TSLRF)、基于随机森林的两阶段变量选择(two-stage stepwise variable selection based on random forest, TSRF)、随机森林和全基因组最佳线性无偏预测(genomic best linear unbiased prediction, GBLUP)4种方法的优劣。在拟南芥真实数据研究中,针对长日照花期(days to flowering under long day, LD)、春化长日照花期(days to flowering under long day with vernalization, LDV)和短日照花期(days to flowering under short day, SD)实施全基因组预测,并利用这些表型预测值与观测值进行全基因组关联分析,以比较上述4种全基因组选择方法的性能。[结果]模拟研究表明:在不同表型缺失率下,TSLRF的全基因组预测准确度和预测模型拟合度均较高;真实数据的TSLRF分析也获得相似的结论,且检测到40个已报道与目标性状显著关联的基因。[结论]TSLRF方法的全基因组预测准确度和模型拟合度较高,计算速度快,为分子育种和优异亲本组合的预测提供理论依据。  相似文献   

4.
数量性状的表型变异受到大量效应微小的遗传位点和诸多环境因素的共同作用,但在数量性状的遗传研究领域,关于不同遗传位点之间加性效应与上位效应相对重要性的认识却存在着分歧。近年来,伴随着全基因组关联分析在人类及家养动物数量性状研究中的发展,在全基因组关联分析的框架内进行上位效应遗传位点的检测越发受到重视。文章以遗传力失踪问题为出发点,首先综述了标记-QTL连锁分析和GWAS框架下传统上位效应遗传位点的检测方法,然后对基于表型方差同质性检验和广义线性混合模型方法的上位效应统计推断以及混杂因素的处理方法进行了总结与梳理,旨在为数量性状全基因规模上位效应的相关研究提供理论参考。  相似文献   

5.
【目的】高产是小麦育种的永恒主题,利用全基因组关联分析发掘控制小麦产量性状的QTL区段及优异基因,为小麦分子标记辅助选择育种提供理论依据和标记信息。【方法】以新疆本地188个冬小麦品种资源为材料,利用小麦55K SNP芯片进行全基因组扫描,通过对6个不同环境下的株高、穗长、小穗数、可育小穗数、穗粒数、千粒重、粒长、粒宽、籽粒长/宽比9个产量相关性状进行表型鉴定,利用6个环境下各性状数据及最佳线性无偏预测(BLUP)数据,基于混合线性模型(MLM)对表型和基因型进行全基因组关联分析。【结果】经主成分分析,将188个材料分为地方品种和育成品种2个亚群;利用6个环境下各性状数据,9个性状共检测到1 309个显著性SNP标记,其中,每个显著性SNP位点可解释7.259%—70.792%的表型变异。利用BLUP数据,9个性状共检测到66个显著性位点,同时与2个性状关联的共有SNP位点有5个,贡献率波动范围为8.498%—21.877%。将同时与2个性状或2个以上环境关联到的重复位点作为稳定的显著性关联位点,9个性状共检测到38个稳定关联位点,包括株高重复位点5个,穗长重复位点10个,小穗数重复位...  相似文献   

6.
【背景】猪的肉质性状是重要的经济性状。研究影响各类肉质性状的分子机制,发掘关键基因,从而指导猪的遗传改良,对改善猪肉品质具有重要意义。当前肉质相关的机制研究主要是基于DNA的基因组研究,而对肉质性状的DNA甲基化研究以及结合基因组和甲基化组的综合分析却鲜有报道。【目的】通过基因组和DNA甲基化组联合分析,筛选、鉴定了影响猪肉质的潜在关键基因。为猪肉品质的遗传改良研究提供借鉴。【方法】检测了140头大白猪背最长肌的28个肉质性状,通过表观基因组关联分析(EWAS)与全基因组关联分析(GWAS)筛选了各性状显著关联的CpG和SNP位点。随后以SNP为协变量对GWAS和EWAS重叠的显著关联位点进行条件关联分析,进一步筛选具有独立效应的CpG位点。然后以CpG位点的甲基化水平为因变量,以SNP为自变量进行关联分析从而鉴定甲基化数量性状位点(meQTL)。最后使用顺式甲基化数量性状位点(cis-meQTL)作为工具变量进行孟德尔随机化分析,从而推断cis-meQTL与表型之间的因果关系,同时对位点进行注释,鉴定潜在的关键基因。【结果】(1)在屠宰45 min黄度值(b45min  相似文献   

7.
基因组选择是指利用覆盖在全基因组范围内的分子标记信息来估计个体育种值。利用基因组信息能够避免因系谱错误带来的诸多问题,提高选择准确性并缩短育种世代间隔。根据统计模型的不同,基因组选择方法可大致分为基于BLUP(best linear unbiased prediction, BLUP)理论的方法、基于贝叶斯理论的方法和其他方法。目前应用较多的是GBLUP及其改进方法 ssGBLUP。准确性是基因组选择模型最常用的评价指标,用来衡量真实值和估计值之间的相似程度。影响准确性的因素可以从模型中体现,大致分为可控因素和不可控因素。传统基因组选择方法促进了动物育种的快速发展,但这些方法目前都面临着多群体、多组学和计算等诸多挑战,不能捕获基因组高维数据间的非线性关系。作为人工智能的一个分支,机器学习是最贴近生物掌握自然语言处理能力的一种方式。机器学习从数据中提取特征并自动总结规律,利用该规律与新数据进行预测。对于基因组信息,机器学习无需进行分布假设,且所有的标记信息都能够被考虑进模型当中。相比于传统的基因组选择方法,机器学习更容易捕获基因型之间、表型与环境之间的复杂关系。因此,机器学习在动物基因组...  相似文献   

8.
畜禽全基因组选择   总被引:1,自引:1,他引:1  
数量遗传学在经历了传统的数量遗传学后逐步发展产生了数量遗传学与分子遗传学、生物技术相结合的分子数量遗传学。应用分子标记定位影响重要经济性状的QTL已经取得了显著的成果。QTL一旦得到定位,确定了该位点对表型的贡献率,就可以利用位于QTL侧翼的标记直接进行标记辅助选择。然而应用于标记辅助选择的标记只捕获了构成表型的一部分变异,而无法检测到构成性状的所有变异,为了解决这个问题,其中的一个途径就是利用全基因组范围内的标记,进行标记与表型的全基因组关联分析,鉴定对性状有影响的遗传标记,然后将这些标记应用于选择,这就是全基因组选择。文章就家畜QTL定位和标记辅助选择进行了简要的概述,同时对家畜全基因组选择进行了重点综述。  相似文献   

9.
大豆巢式关联作图群体蛋白质含量的遗传解析   总被引:1,自引:1,他引:0  
【目的】大豆是重要的经济作物,是人类植物蛋白质和油脂的主要来源。蛋白质含量作为大豆育种的主要目标之一,属于多基因控制的复杂数量性状,并且受环境条件的影响。通过对大豆巢式关联作图群体的蛋白质含量进行全基因组关联分析,解析其遗传构成,为高蛋白质含量的大豆品种育种提供理论基础。【方法】以蒙8206为共同亲本,对临河×蒙8206、正阳×蒙8206、蒙8206×通山与蒙8206×WSB分别杂交,通过单粒传法自交7代衍生的4个重组自交系群体,共计623个家系,整合为一个大豆巢式关联作图群体,利用RAD-seq技术进行SNP标记基因分型,并于2012年至2014年将该群体种植在5个不同田间环境,在大豆完熟期R8时测定蛋白质含量,利用限制性两阶段多位点全基因组关联分析方法(RTM-GWAS)来解析蛋白质含量的遗传构成。【结果】试验群体的蛋白质含量变异较大,蛋白质含量性状遗传率较高,遗传变异可解释85.00%的表型变异。多环境联合方差分析表明,蛋白质含量的基因型、环境以及基因型×环境均达到差异极显著水平。全基因组关联分析共检测到90个蛋白质含量QTL,其中新检测到20个QTL,每个QTL的表型变异解释率...  相似文献   

10.
王竹林  刘曙东  奚亚军 《安徽农业科学》2014,(31):10858-10860,10863
以分子标记技术为基础的作物数量性状基因(QTL)的研究成为目前作物遗传育种研究的热点。QTL定位的基本原理是分析标记基因型和数量性状值之间的连锁关系。进行QTL定位通常需要适当的分离群体,群体的表型数据,群体的基于分子标记的基因型数据,然后统计分析所有的标记基因型和表型的关系,从而在全基因组上确定所有可能的数量性状在染色体上的位置及效应。QTL分析软件winQTLCart2.0使用程序包括:数据准备、软件运行、基因(QTL)定位和分析、制图。QTL定位分析的新方法关联分析利用不同基因座等位变异(基因)间的连锁不平衡关系,进行标记与性状的相关性分析,以达到鉴定特定目标性状基因(或染色体区段)的目的,关联分析大大提高了目标性状基因或者相关QTL的挖掘和定位。  相似文献   

11.
全基因组关联分析(genome-wide association studies,GWAS)通过建立全基因组高密度分子标记以检测基因型与表型间的关联性,已成为动植物数量性状遗传解析的主要方法。然而,以往GWAS方法只注重于个别主要QTL的检测,而且使用仅有2个等位变异的SNP标记不能检测自然群体中广泛存在的复等位变异,一定程度限制了GWAS的应用。限制性两阶段多位点全基因组关联分析方法(RTM-GWAS)首先根据全基因组高密度SNP标记间的连锁不平衡程度,将多个相邻且紧密连锁的SNP标记组成为具有复等位变异(单倍型)的连锁不平衡区段(SNPLDB)标记。其次,RTM-GWAS使用由SNPLDB标记计算的遗传相似系数矩阵作为群体结构偏差的通用估计,并提取该矩阵的特征向量作为模型协变量以降低由群体结构偏差导致的假阳性。最后,利用具有复等位变异的SNPLDB标记与建立的多位点复等位变异模型,RTM-GWAS将性状遗传率作为QTL表型变异解释率的上限,通过两阶段分析策略高效地进行全基因组QTL及其复等位变异的检测,并最终构建多QTL遗传模型。该法还可以基于性状小区观测值,建立QTL与环境互作多...  相似文献   

12.
【目的】通过对芝麻产量相关性状的全基因组关联分析,挖掘与产量性状关联的SNP位点及预测候选基因,为通过分子标记辅助选择育种等方式提高芝麻产量提供技术基础。【方法】以363份不同遗传背景和地理来源的芝麻种质资源构成的自然群体为研究对象,调查2年2点4环境下8个产量相关性状(单株产量、单株蒴数、蒴粒数、千粒重、株高、主茎果轴长、始蒴高度和表观收获指数)的表型值,借助覆盖全基因组的42 781个SNP标记,利用多位点SNP随机效应混合线性模型(multi-locus random-SNP-effect mixed linear model,mrMLM)对8个产量相关性状进行全基因组关联分析,检测与产量相关性状显著关联的SNP位点,并预测候选基因。【结果】在4个不同环境下,8个产量相关性状表现出广泛的表型变异,变异系数为6.51%—33.57%;相关性分析表明单株产量与单株蒴数、株高、主茎果轴长、表观收获指数呈极显著正相关;方差分析表明产量相关性状的基因型效应、环境效应、基因型与环境互作效应均达到了极显著水平。通过多位点全基因组关联分析共检测到210个与产量相关性状显著关联的SNP,在2018年南阳环境下检测到47个SNP,解释表型变异的1.63%—17.29%;在2019年南阳环境下检测到35个SNP,解释表型变异的1.94%—11.90%;在2018年平舆环境下检测到35个SNP,解释表型变异的2.15%—15.90%;在2019年平舆环境下检测到53个SNP,解释表型变异的1.25%—11.13%;在4个环境的综合BLUP条件下检测到75个SNP,解释表型变异的1.44%—13.58%。上述210个SNP涉及到175个位点,其中10个位点在3个及以上环境中被重复检测到。在这10个位点基因组区域内,共鉴定到214个候选基因,其中156个候选基因具有功能注释,主要涉及植物代谢、生物调控、生长发育等生物学过程。根据功能注释筛选出4个可能与芝麻产量相关的候选基因,其中SIN_1006338编码1-氨基环丙烷-1-羧酸合酶3(1-aminocyclopropane-1-carboxylate synthase 3-like),参与乙烯的生物合成;SIN_1024330编码碱性螺旋-环-螺旋(basic helix-loop-helix)转录因子,负向调控植物细胞和器官的伸长;SIN_1014512编码吲哚-3-乙酸-酰胺合成酶GH3.6(indole-3-acetic acid-amido synthetase GH3.6),参与调控茎和下胚轴细胞的伸长生长;SIN_1011473编码泛素受体蛋白DA1(protein DA1-like),参与调节植物细胞增殖周期。【结论】通过多位点SNP随机效应混合线性模型的全基因组关联分析,检测到175个与产量相关性状显著关联的位点,筛选出4个可能与产量相关的重要候选基因。  相似文献   

13.
全基因组关联分析(genome-wide association studies,GWAS)通过建立全基因组高密度分子标记以检测基因型与表型间的关联性,已成为动植物数量性状遗传解析的主要方法。然而,以往GWAS方法只注重于个别主要QTL的检测,而且使用仅有2个等位变异的SNP标记不能检测自然群体中广泛存在的复等位变异,一定程度限制了GWAS的应用。限制性两阶段多位点全基因组关联分析方法(RTM-GWAS)首先根据全基因组高密度SNP标记间的连锁不平衡程度,将多个相邻且紧密连锁的SNP标记组成为具有复等位变异(单倍型)的连锁不平衡区段(SNPLDB)标记。其次,RTM-GWAS使用由SNPLDB标记计算的遗传相似系数矩阵作为群体结构偏差的通用估计,并提取该矩阵的特征向量作为模型协变量以降低由群体结构偏差导致的假阳性。最后,利用具有复等位变异的SNPLDB标记与建立的多位点复等位变异模型,RTM-GWAS将性状遗传率作为QTL表型变异解释率的上限,通过两阶段分析策略高效地进行全基因组QTL及其复等位变异的检测,并最终构建多QTL遗传模型。该法还可以基于性状小区观测值,建立QTL与环境互作多位点模型,不仅能检测与环境有交互作用的主效应QTL,还能检测仅与环境有交互作用的无主效应QTL。RTM-GWAS不仅解决了以往GWAS不能估计复等位变异的问题,而且通过使用多位点模型拟合多个QTL提高了检测功效并能有效地控制假阳性的膨胀,为全面解析自然群体QTL及其复等变异提供了通道。该法能估计出等位基因的效应及其在群体内的相对频率,由其结果建立的QTL-allele矩阵代表了目标性状在群体中的全部遗传组成,不仅可用于候选基因发掘,还为群体内QTL及其复等位变异(基因及其复等位基因)的动态研究(群体遗传分化以及特有与新生等位变异)提供了新的工具。依据QTL-allele矩阵,还能进一步利用计算机模拟产生杂交组合后代基因型,并预测杂交组合后代纯合群体的表现,从而进行优化组合设计与分子设计育种。此外,RTM-GWAS还适用于双亲杂交后代重组自交系群体以及多亲杂交后代巢式关联作图群体,因避免了群体结构偏离的干扰,检测功效更高。本文归纳了RTM-GWAS的原理和方法,并综述了其在遗传育种研究中的应用。  相似文献   

14.
多性状联合全基因组选择能够有效利用性状间的遗传相关和环境相关,有望提高表型预测的准确性。本研究提出了结合辅助性状的全基因组选择策略,以来源广泛的342份玉米自交系为试验材料,对其进行基因分型测序(GBS)并分析其农艺性状,对每个目标性状均基于辅助性状及其组合进行预测,利用五倍交叉验证法评价其预测力。结果表明,利用与目标性状相关性较高的辅助性状可较大程度地提升预测力,尤其是对于低遗传力性状;随着辅助性状个数的增加,预测力也随之增加。进一步比较了5种统计模型结合辅助性状的全基因组选择的表型预测力,总体而言,再生核希尔伯特空间(RKHS)模型和贝叶斯B(BayesB)模型的预测效果较优,而极端梯度提升(XGBOOST)模型的预测效果较差。本研究结合辅助性状有效提高了玉米全基因组选择的预测准确性,为玉米的全基因组选择育种提供新的思路和参考。  相似文献   

15.
【目的】果肉颜色是柚类品种重要的外观性状以及品质性状,挖掘与柚果肉颜色显著相关的变异位点及相关基因,为进一步理解柚类品种果肉呈色机理以及分子标记辅助育种奠定基础。【方法】通过表型调查及色差仪测量,对100份柚类种质的果肉颜色进行评价和分类,利用GBS(genotyping-by-sequencing)测序技术对所有材料进行简化基因组测序。将测序得到的基因型数据通过GCTA软件计算特征值及特征向量分析群体结构,利用plink 2.0软件计算不同果肉颜色群体的遗传分化系数(Fst),选用GEMMA软件中GLM模型进行全基因组关联分析,选取与颜色表型显著关联的变异位点进行等位变异分析,根据柑橘LD大小对变异位点邻近位置进行基因注释,筛选出与果肉颜色形成相关的候选基因,随机选择4份白肉柚和4份红肉柚材料在不同发育时期对候选基因表达进行初步验证。【结果】根据果肉颜色将100份柚类种质分为白肉柚和红肉柚两大类,其中包含58份白肉柚和42份红肉柚。通过Fst遗传分化指数分析和GWAS全基因组关联分析共筛选到Fst系数大于0.4且-log10(P)>9的位点6个,对6个变异位点进行基因分型,根据...  相似文献   

16.
【目的】挖掘与叶绿素含量显著关联的单核苷酸多态性(single nucleotide polymorphism, SNP)位点和候选基因,为甜瓜叶绿素含量改良提供分子靶点和基因资源。【方法】以118份具有广泛变异的甜瓜种质为自然群体,采用2 531 449个高质量SNP标记对叶片叶绿素含量进行全基因组关联分析,挖掘优异等位变异,并预测候选基因。【结果】甜瓜自然群体叶绿素含量趋向正态分布,包含5个明显的亚群。利用Q模型对2次试验的叶绿素含量及其最佳线性无偏预测(best linear unbiased prediction, BLUP)值进行关联分析,共检测到15个显著位点,分布在甜瓜第1、2、4、8、11、12号染色体上,表型贡献解释率为5.62%~6.69%。其中,8个位点的不同基因型之间存在显著表型差异。结合关联位点的候选区域和转录组数据,共鉴定到28个差异表达基因,其中MELO3C018513.2和MELO3C003666.2是改良甜瓜叶绿素含量的潜在候选基因。【结论】通过高质量SNP标记Q模型的全基因组关联分析,共检测到15个与叶绿素含量显著关联的位点,筛选出2个可能与叶绿素含...  相似文献   

17.
【目的】果粒大小是葡萄外观和产量的重要构成因子之一,为受多基因调控的复杂数量性状,挖掘葡萄果粒大小相关性状的关键遗传调控位点和基因,将有助于葡萄产量的提高。【方法】本研究以150份葡萄品种资源为材料,分别于2019年和2020年对葡萄果实单粒重、种子数目和种子质量等进行测定,并结合重测序获得的高密度基因型数据进行全基因组关联分析(genome-wide association study,GWAS),挖掘调控各性状的遗传位点和基因。【结果】各性状在关联群体中呈现广泛的连续变异,变异系数为39.55%—68.89%;在不同年份均服从正态分布,符合数量性状遗传特征;相关性分析表明葡萄果实单粒重、种子数目和种子质量呈显著正相关。全基因组关联分析共检测到150个与果实单粒重显著关联的SNP,在2019年检测到99个SNP,解释表型变异的14.48%—25.59%;在2020年检测到73个SNP,解释表型变异的16.08%—26.83%;其中24个SNP位点在两个年份均检测到,主要位于1号、5号、11号和16号染色体。相较于果实单粒重,检测到的与种子数目显著关联的SNP较少,2019年检测到1个...  相似文献   

18.
通过对贵州栽培型地方茶树气孔性状进行全基因组关联分析(GWAS),找出影响其气孔发育相关基因,为贵州栽培型地方茶树开发利用提供依据。该研究利用简化基因组测序技术(GBS),以253份贵州栽培型地方茶树种质资源为材料,进行全基因组关联分析。结果表明,与5个气孔表型性状有关的SNP位点共关联45个,在下游50 kb的45个SNPS位点范围内共检测到20个基因。其中6个基因与气孔长度(SL)有关,1个基因与气孔宽度(SW)有关,7个基因与气孔面积(SA)有关,2个基因与气孔密度(SD)有关,4个基因与气孔周长(SP)有关,该研究成果有助于对具有复杂遗传背景和丰富生态类型的栽培型茶树资源的开发利用,以便筛选出适应性强、能够促进贵州茶产业品种结构调整的优良茶树品种。  相似文献   

19.
为了改进在畜禽全基因组关联分析中,利用隐马尔可夫模型(HMM)进行多重检验时的过学习问题,提出将人工神经网络算法(ANN)作为预处理,引入畜禽全基因组关联分析中,较好地弥补了已有的多重检验方法的缺陷,提高了统计推断性能,其运算速度也显著提高。  相似文献   

20.
植物代谢物是人类食物和营养物质的重要来源。代谢组学是对生物体内代谢物进行定量和定性分析,研究代谢物合成和调控机制的一门新兴学科。基于代谢组的全基因组关联分析(metabolome-based genome-wide association study,mGWAS)是将代谢组数据作为表型,与基因型数据进行关联分析的一种方法。概述了近几年利用mGWAS技术在植物代谢调控网络研究、初生和次生代谢物的形成机制、代谢物在植物生长发育和胁迫应答中的作用,同时综述了mGWAS在代谢物相关候选基因的定位和调控营养、品质相关代谢通路的挖掘,为深入了解植物代谢物合成调控的遗传机制奠定基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号