摘 要: | 通过生物信息学分析方法,利用广泛使用的基因芯片技术产生的数万个基因表达数据,揭示基因的功能和相互作用。聚类分析是一种主要的生物信息学分析方法,能高效发掘功能一致的基因。针对基因表达谱聚类分析方法较多、应用者选择方法困难的问题,本研究利用3组基因表达谱模拟数据和1组酵母菌基因表达实际数据,通过Caliński-Harabasz指数、灵敏值和分类正确率3个指标,比较了平滑样条聚类、数量性状关联聚类和局部逼近模糊聚类法3种经典方法。结果表明:平滑样条聚类法的Caliński-Harabasz指数平均数最大,灵敏值平均数最小,分类正确率最大,为最优方法;数量性状关联聚类次之,局部逼近模糊聚类最差。这一结果为今后基因表达谱数据聚类分析方法选择提供了参考依据。
|