用户反馈

请留下您的宝贵意见,我们将为您提供更好的产品和服务。

问题或建议

请描述您的问题

联系方式(留下联系方式将更快获得反馈哦)

请留下您的联系方式

  • 账号密码登录
  • 手机动态登录
图形校验码
  • 企业登录
  • 开放单位登录
  • 个人注册
  • 企业注册
图形校验码

图形校验码
  • 重置密码

技术干货|动植物特殊物种的单细胞注释方法讨论

2025-08-13 05:53:09

阅读(3072)

2.gif

动植物特殊物种的单细胞注释方法讨论


  单细胞测序技术已广泛应用于人类、小鼠等模式物种,但在动植物特殊物种中,由于基因组注释不完善、研究较少等原因,在数据质控、细胞类型注释和功能分析等环节仍面临诸多挑战。本文将简要梳理特殊物种单细胞注释的常用思路和方法,帮助您快速了解相关内容。


  本文将分别介绍非人鼠哺乳动物和植物的细胞注释方法,并补充同源基因转换和特殊物种的富集分析思路。文中涉及的参考文献已在文末列出,便于进一步查阅。随着领域不断发展,相关方法也在不断丰富,欢迎与我们交流探讨。





  细胞注释方法        

                          Part.1

7.png

   1. 非人鼠哺乳动物  


  对于动物研究,除人类和小鼠外,还有一些物种(如斑马鱼、线虫、果蝇等)已有较多研究,这类物种可以直接参考同物种的相关文献。例如,研究果蝇心脏发育的单细胞文章就参考了果蝇的相关基因特征 [1]。然而,对于如鸡、牛、海鞘等研究相对较少的非模式物种,细胞注释可参考以下方法:


    1.1  marker基因注释


  优先查找同物种文献:如有同物种的单细胞研究,优先参考其细胞注释所用的marker基因。


  参考近缘或模式物种:如同物种资料不足,可借鉴近缘或模式物种的相关文章,动物也可直接参考人/鼠的同源基因。


  结合保守基因功能:如以上均不能满足,可关注在未知细胞群中特异表达的基因,结合其已知功能特征推断细胞类型。一些具有保守功能或表达特征的基因也可作为参考。例如,研究鸡发育过程的单细胞文章就利用了保守基因进行注释[2]。


   1.2   同源基因转换


  将该物种的基因转换为人类等研究较多物种的同源基因,再用这些基因进行细胞注释。这样可以充分利用人类丰富的基因功能和表达信息。例如,鸡视网膜的单细胞研究在跨物种比较时就采用了同源基因转换[3]。


    1.3   差异基因富集分析


  对每个细胞群的差异基因进行功能富集分析(如GO/KEGG),结合富集结果描述细胞群特征。此方法主观性较强,但在缺乏注释信息时非常有用。通常先获得各未知细胞群的差异基因,再进行单基因或基因集的通路富集分析,结合富集结果来描述和定义细胞群特征。



    2.植物  


    2.1   marker基因注释


  优先查找同物种文献:如有同物种的单细胞研究,优先参考其细胞注释所用的marker基因。例如,拟南芥数据可直接参考其经典marker基因,并结合基因集打分等方法[4]。


  需注意,不同基因组版本的差异可能带来额外困难,如基因注释不一致、基因名不同等,建议提前核查。


  参考近缘或模式物种:如同物种资料不足,可借鉴近缘或模式物种的相关文章。例如,油茶可参考茶树或拟南芥的相关研究[5]。


  结合保守基因功能:如以上均不能满足,可关注在未知细胞群中特异表达的基因,结合其已知功能特征推断细胞类型,例如保守基因的功能特征。


    2.2   同源基因转换


  将该物种基因转换为拟南芥等模式植物的同源基因,利用其丰富的表达信息和功能注释,作为参考。


    2.3   差异基因富集分析


  同样地,对于研究较少的物种,可通过富集分析确定细胞群特征[5]。先获得各未知细胞群的差异基因,再进行单基因或基因集的通路富集分析,结合富集结果描述和定义细胞群特征。


   2.4   实验验证


  如条件允许,可对未知细胞群的top差异基因进行RNA原位杂交等实验,直接验证基因表达分布。


  例如,一篇研究水稻的文章参考了经典marker,并结合原位杂交实验来定义部分细胞群[6]。


    3. 注释结果的验证  


  可以利用公共数据来辅助判断注释的可靠性。例如,可以计算细胞群与公共数据的表达相似性[7];也可以基于微阵列数据的基因表达信息来验证细胞注释结果[8];Wendrich等人将细胞群的top20差异基因与公共数据进行比较来确定细胞类型[9]。


  若存在已注释好的细胞类型表达谱,也可以通过SingleR、CellTypist等工具来自动注释。进一步,也可与已知细胞类型的单细胞数据进行整合分析,提高注释准确性。



  同源基因转换方法

Part.2

7.png

  下面介绍几种常用的同源基因转换方法。


  1. 代码工具  


  biomaRt:R包,支持Ensembl数据库的跨物种基因同源转换(支持125个动物类别和233个植物类别)。


  homologene:R包,基于NCBI HomoloGene数据库,支持基因同源映射(支持21个物种)。


  babelgene:R包,聚合多数据库信息,支持基因同源映射(支持19个物种)。


  2. 在线工具  


  可以通过Ensembl数据库的biomaRt在线工具来进行转换。


  Ensembl(https://www.ensembl.org/biomart/martview/37577e83a2122c2022f1abb8c703591f)

  Ensembl plants

  (https://plants.ensembl.org/biomart/martview/1a9c766c1ea21107b6beea921a4a8487)


  3. 序列比对  


  数据库里能够进行同源转化的物种是有限的。对于数据库不支持的物种,可用BLAST等工具进行序列比对,结合InterProScan等工具预测蛋白功能。



  特殊物种的富集分析

Part.3

7.png

  特殊物种在富集分析上也有一些常用手段。常见富集分析工具需要相应的注释数据,例如:Bioconductor的OrgDb,但该数据库目前仅包含了20个物种的注释数据集。对于数据库不支持的物种,可以首先尝试同源转换;其次也可以考虑用InterProScan、KOBAS等工具手动构建注释库,即先进行序列比对和功能注释,再进行GO/KEGG富集分析。

8.png


  结语:


  特殊物种的单细胞注释虽然面临挑战,但通过参考文献、同源基因转换和功能富集等方法,依然可以获得较为可靠的注释结果。希望本文能为您提供实用的参考。



  参考文献:



  1. Huang X, Fu Y, Lee H, et al. Single-cell profiling of the developing embryonic heart in Drosophila.Development.2023;150(16):dev201936. doi:10.1242/dev.201936.

  2. Williams RM, Lukoseviciute M, Sauka-Spengler T, Bronner ME. Single-cell atlas of early chick development reveals gradual segregation of neural crest lineage from the neural plate border during neurulation. Elife. 2022;11:e74464. Published 2022 Jan 28.  doi:10.7554/eLife.74464.

  3. Yamagata M, Yan W, Sanes JR. A cell atlas of the chick retina based on single-cell transcriptomics. Elife. 2021;10:e63907. Published 2021 Jan 4. doi:10.7554/eLife.63907.

  4. Yin R, Chen R, Xia K, Xu X. A single-cell transcriptome atlas reveals the trajectory of early cell fate transition during callus induction in Arabidopsis. Plant Commun. 2024;5(8):100941.doi:10.1016/j.xplc.2024.100941.

  5. Zhao S, Rong J. Single-cell RNA-seq reveals a link of ovule abortion and sugar transport in Camellia oleifera. Front Plant Sci. 2024;15:1274013. Published 2024 Feb 2.doi:10.3389/fpls.2024.1274013.

  6. Zhang TQ, Chen Y, Liu Y, Lin WH, Wang JW. Single-cell transcriptome atlas and chromatin accessibility landscape reveal differentiation trajectories in the rice root. Nat Commun.2021;12(1):2053. Published 2021 Apr 6. doi:10.1038/s41467-021-22352-4.

  7. Brown CC, Gudjonson H, Pritykin Y, et al. Transcriptional Basis of Mouse and Human Dendritic Cell Heterogeneity. Cell. 2019;179(4):846-863.e24. doi:10.1016/j.cell.2019.09.035.

  8. Jean-Baptiste K, McFaline-Figueroa JL, Alexandre CM, et al. Dynamics of Gene Expression in Single Root Cells of Arabidopsis thaliana. Plant Cell. 2019;31(5):993-1011.doi:10.1105/tpc.18.00785.

  9. Wendrich JR, Yang B, Vandamme N, et al. Vascular transcription factors guide plant epidermal responses to limiting phosphate conditions.Science.2020;370(6518):eaay4970.doi:10.1126/science.aay4970.



来源:寻因生物SeeKGene公众号(寻因生物 原创)

版权声明

本网所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

您可能想看

  • 昌平区促进先进制造业发展暂行办法

    昌平区政策

    2024-02-27 06:52 阅读(6167)

  • 北京生命科学研究所2023年国际评估圆满完成

    北京生命科学研究所2023年国际评估圆满完成

    2023-12-23 16:40:46 阅读(124868)

  • 昌平区 《北京市工作居住证》办理指南

    昌平区政策

    2024-02-27 02:52:57 阅读(11690)

  • 昌平区加快独角兽、专精特新企业培育发展支持办法

    昌平区政策

    2024-02-27 06:57:38 阅读(56191)

  • 中关村高新技术企业培育服务办法(试行)

    科创政策

    2024-02-27 09:39:53 阅读(14306)