基于变分自编码器的流形学习降维方法
Dimension Reduction Method for Manifold Learning Based on Variational Autoencoder
-
摘要: 近年来, 科学数据集的规模和复杂性正在迅速增长, 因此, 理解数据以回答科学问题的任务越来越需要使用有效的降维方法. 现有的降维方法存在“拥挤问题”以及不能嵌入新样本的问题, 因此, 本文提出了一种变分自编码器均匀流形近似与投影的数据降维方法. 首先, 为减小高维数据之间的耦合性, 利用变分自编码器将数据预处理变换成潜在变量. 然后, 运用均匀流形近似与投影进一步将潜在变量降维, 使低维嵌入更好地保持原始高维数据之间的相似性关系. 最后, 将所提方法用训练集进行拟合, 并嵌入一个样本外测试集来评估对新数据的泛化能力. 实验结果表明, 与一些有代表性的优秀降维方法相比, 所提方法在数据可视化、特征提取、数据的局部结构保留以及分类任务上有显著的改进效果.