背景高通量DNA微阵列技术的广泛使用为人类转录组提供了数百到数千个基因的详细视图。 尽管生物医学研究人员通常设计微阵列实验来探索特定的生物学环境,但基因之间的关系却难以识别,因为它们是复杂且嘈杂的高维数据,并且通常受制于较低的统计能力。 现在的主要挑战是从海量数据中提取有价值的生物信息,以深入了解生物过程和人类疾病的机制。 为了克服这一挑战,需要数学和计算方法,这些方法应具有足够的通用性以捕获基本的生物学特征,并且必须足够简单以有效地应用于大型数据集。 方法无监督机器学习方法提供了新的,有效的基因表达谱分析。 在我们的研究中,整合了两种无监督的基于知识的矩阵分解方法,即独立成分分析(ICA)和非阴性矩阵分解(NMF),以识别阿尔茨海默氏病微阵列基因表达数据集中的重要基因和相关途径。 这两种方法的优点是它们可以作为双聚类方法执行,通过该方法可以同时聚类基因和条件。 此外,他们可以将基因分为不同的类别,以识别相关的诊断途径和调节网络。 两种方法之间的差异在于ICA假设表达模式的统计独立性,而NMF需要阳性约束来生成局部基因表达谱。 结果在我们的工作中,我们分别对Alzheimer病的DNA