当我们在谈论迁移学习时,到底在迁移什么?

2025-09-10

bioinformatics , 迁移学习 , 空间转录组

本文的讨论源于近期开展的亚细胞水平细胞分型实验。一项相关研究中，利用snRNA-seq的丰富标签辅助了空间转录组（spatial transcriptomics）的细胞类型注释。鉴于snRNA-seq数据量大、成本低廉且标签信息丰富，而空间转录组的细胞注释则相对昂贵，针对这一问题，经典的解决方案是利用snRNA-seq数据训练一个分类器，进而对空间转录组数据进行细胞类型分类。这正是典型的Teacher-Student（教师-学生）学习范式。

这种迁移学习模式到底是在迁移什么知识?

snRNA-seq向spatial transcriptomics迁移的一个显著特点是基因能够对齐，且基因间的相互作用关系具有保守性。这意味着无论snRNA-seq数据是否带有标签，这种基因间的保守关系都不会受到影响。随后的实验也证实，主动引入标签信息甚至可能破坏这种固有的关系。因此，在处理这类具有深层生物学关联的数据迁移学习问题时，我们应更深入地探究其内在机制。从某种程度上说，在这种特定情境下，数据的标签信息不仅可能无用，甚至可能产生负面影响，这使得问题自然地转向了无监督学习范式。这也印证了“无监督学习是深度学习未来重要发展方向”这一观点。

CC BY-NC-SA 4.0 by Xiang CHEN 陈向

本文由 Xiang CHEN 陈向 创作，采用 CC BY-NC-SA 4.0 协议，首发于 https://chenxofhit.xyz 个人网站。

您可以自由地：

分享 — 在任何媒介以任何形式复制、发行本作品
演绎 — 修改、转换或以本作品为基础进行创作

惟须遵守下列条件：

署名 — 您必须给出适当的署名，提供指向本许可协议的链接，同时标明是否（对原始作品）作了修改。您可以用任何合理的方式来署名，但是不得以任何方式暗示许可人为您或您的使用背书。
非商业性使用 — 您不得将本作品用于商业目的。
相同方式共享 — 如果您再混合、转换或者基于本作品进行创作，您必须基于与原先许可协议相同的许可协议分发您贡献的作品。

商业使用请联系：[email protected]