UMAP:统一流形逼近和降维投影

Published on Aug. 22, 2023, 12:10 p.m.

统一流形逼近和投影 (UMAP) 是一种降维技术,可用于类似于 t-SNE 的可视化,但也可用于一般的非线性降维。该算法基于关于数据的三个假设

数据均匀分布在黎曼流形上;
黎曼度量是局部常数(或可以近似);
歧管是本地连接的。
根据这些假设,可以用模糊拓扑结构对流形进行建模。通过搜索具有最接近的等效模糊拓扑结构的数据的低维投影来找到嵌入。

基础数学的详细信息可以在 ArXiv 的论文中找到:
https://arxiv.org/abs/1802.03426

项目地址
https://github.com/lmcinnes/umap
文档地址
https://umap-learn.readthedocs.io/en/latest/