单细胞转录组学方法的Word2vec时刻展望
对于单细胞转录组学特别是以单细胞测序技术产生的数据分析里面,很多研究者直接从 ZINB分布来建模,ZINB分布确实能够刻画 scRNA-seq数据但是个人觉得这种刻画非常拧巴,也有大量的论文指出单细胞数据不符合 ZINB分布。
我们每个领域都在期盼自己领域的 Word2vec时刻的到来。Word2vec不以任何目的为目的,只是在概率上寻求对数据本身的建模,看似无用却大道至简。有了 Word2vec,很多下游任务变得更简单明了。实际上,Word2vec直接影响了后面产生的强大模型比如 Transformer。
对于单细胞组学的分析,出路在哪里呢?除了BERT外,个人觉得目前只能从对比学习上来展开,我们在谈对比学习上我们需要思考对比学习到底学习到了啥?我个人坚定看好单细胞转录组学方法的 Word2vec方法或许能从对比学习方法里面诞生。让我们共同期待这一天的早日到来。