联系电话

400-102-9559

Title
打开微信“扫一扫”
打开网页后点击屏幕
右上角“分享”按钮

生物信息分析常用软件与网站 2——序列信息库应用

小小小烁烁 2019-04-14 16:53:06

阅读(61)

点赞(0)

收藏(0)

在此之前我已经有介绍过对于R语言小白来说的救命稻草——生物信息分析常用的作图软件。(https://www.renrenlab.com/news/3081.html)

今天,就来给大家介绍一下生物信息分析常用的序列信息库。


网站一:NCBI:https://www.ncbi.nlm.nih.gov/

美国国立医学图书馆(NLM)于1988年11月4日建立国家生物技术信息中心(National Center of Biotechnology Information,简称NCBI)。NCBI首先创建GenBank数据库,在重点开发GenBank的同时,又于1991年开发了Entrez 数据库检索系统。该系统整合了GenBank、EMBL、PIR和SWISS-PROT等数据库的序列信息以及MEDLINE有关序列的文献信息,并通过相关链接,将他们有机地结合在一起。随着ncbi数据库各种资源的丰富,NCBI已经成为科研工作者必不可少的资料查找,数据分析的工具。

百度搜索NCBI,你将会看到以下界面:

图片1.png

键入搜索信息,点击Search,进入Entrez检索

图片2.png

NCBI功能非常强大,今天我主要来介绍一下NCBI的blast功能

我们可以点击右侧BLAST键,或键入网址:blast.ncbi.nlm.nih.gov

图片3.png

BLAST功能分为五种:

图片4.png

• Blastn:是将给定的核酸序列与核酸数据库中的序列进行比较;

• Blastp:是使用蛋白质序列与蛋白质数据库中的序列进行比较,可以寻找较远的关系;

• Blastx:将给定的核酸序列翻译成蛋白质与蛋白质数据库中的序列进行比对,对分析新序列和EST(表达序列标签)很有用;

• Tblastn:将给定的氨基酸序列与核酸数据库中的序列进行比对,对于寻找数据库中序列没有标注的新编码区很有用;

• Tblastx:只在特殊情况下使用,它将DNA被检索的序列和核酸序列数据库中的序列全部翻译成蛋白质序列,然后进行蛋白质序列比对。

我们将序列贴入,选择种类点击blast:

图片5.png

比对之后,BLAST会按照评分高低、序列相似度对结果进行排序

图片6.png

图片7.png

如果你要去一个没有网络的地方,你可以提前下载本地化的版本,这样在没有网络情况下,依旧可以进行blast。 

NCBI BLAST+本地化

1. 安装配置BLAST+程序

在ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/中下载最新的BLAST可执行程序

2. 本地BLAST库配置文件

/home/yourpath/下新建一个文件,命名为.ncbirc 。在文件中添加内容:

[BLAST]

BLASTDB=/home/yourdbpath/

3. 下载库文件

使用BLAST+自带的update_blastdb.pl脚本下载nr和nt等库文件

https://www.ncbi.nlm.nih.gov/books/NBK279690/

NCBI除了以上功能还能进行基因序列查询

图片8.png

RNA序列查询:

https://www.ncbi.nlm.nih.gov/genome

图片9.png

还可以进行引物的设计。当你搜索一个核酸序列之后,按照一下步骤进行操作:

图片10.png

图片11.png

图片12.png

常用子数据库

1.NR(Non-Redundant Protein Sequence Database)非冗余蛋白库

所有GenBank+EMBL+DDBJ+PDB中的非冗余蛋白序列,对于所有已知的或可能的编码序列,NR记录中都给出了相应的氨基酸序列(通过已知或可能的读码框推断而来)以及专门蛋白数据库中的序列号。NR库相当于一个以核酸序列为基础的交叉索引,将核酸数据和蛋白数据联系起来。NT(Nucleotide Sequence Database),核酸序列数据库,是NR库的子集。

ftp://ftp.ncbi.nih.gov/blast/db

2.Taxonomy 数据库,NCBI的分类数据库,包括大于7万余个物种的名字和种系,这些物种都至少在遗传数据库中有一条核酸或蛋白序列。其目的是为序列数据库建立一个一致的种系发生分类学。

 https://www.ncbi.nlm.nih.gov/taxonomy

3. RefSeq(the reference sequence database).参考序列数据库,包含RefSeq_genomic,RefSeq_protein和RefSeq transpans,即具有生物意义上的非冗余基因,转录本和蛋白质序列,是经过NCBI和其他组织校正的数据库,包括了官方的基因符号和可选的符号。

https://www.ncbi.nlm.nih.gov/refseq

 RefSeq数据库和GenBank数据库的区别在于:

GenBank是一个开放的数据库,对每个基因都含有许多序列,很多研究者或者公司都可以自己提交序列,genbank的数据可能重复或者不准。而RefSeq数据库被设计成挑出一个代表序列来减少重复,是NCBI提供的校正的序列数据和相关的信息。数据库包括构建的基因组contig、mRNA、蛋白和整个染色体。refseq序列是NCBI筛选过的非冗余数据库,一般可信度比较高。

更多信息

• 用户可以在NCBI Bookshelf中找到NCBI手册,该手册详细的介绍了NCBI中的各种资源。在NCBI的主页上还有“教育(Education)”链接,其中有多个教程可供用户学习。用户还可以通过网站地图了解NCBI中的各种资源。在“About NCBI”网页上还有生物信息学入门和其它补充资源。NCBI还设有面向用户的服务人员回答各种问题,用户可以发邮件到info@ncbi.nlm.nih.gov向他们提问。www.ncbi.nlm.nih.gov/About/newsletter.html网页上还有NCBI最新的更新信息。用户还可以到www.ncbi.nlm.nih.gov/Sitemap/Summary/email_lists.html订阅各种更新信息邮件。NCBI现在还设有RSS服务。

• Nucleic Acids Research, 2009, Vol. 37, Database issue D5–D15

 

网站二:Ensembl

Ensembl和Ensembl Genomes基因组序列资源数据库是EMBL-EBI(核酸蛋白序列数据库)的两个子库。Ensembl数据库(http://www.ensembl.org)提供高质量、综合注释的脊柱动物基

因组数据,Ensembl Genomes(http://ensemblgenomes.org)数据库提供非脊椎动物全基因组数据。 Ensembl可以检索到的内容包括:基因、转录物、变异位点、表型、结果变异、体细胞变异、基因进化树、基因组比对、翻译、克隆和片段等。 

这是Ensembl的首页:

图片13.png

点击Downloads:

图片14-1.png图片14-1.png

图片14.png

即可完成数据库下载,数据库的查找可从/pub/索引进行查找。

图片15.png

图片16.png

Ensembl还可以对序列进行在线查找:

例如搜索Ensembl Genes 89的Human genes(GRCh38.p10)

图片17.png

对gene、External等进行设置之后,点击Results,即可看到相应结果:

图片18.png

这个网站还可以对翻译后序列进行查看:

图片21.png


网站三:UCSC https://genome.ucsc.edu/

随着众多物种基因组测序的完成,仅仅以纯文本的方式存储和展示基因组DNA字符将无法满足对测序数据的研究,因此,UCSC应用而生。UCSC能够满足在任何尺度上快速地查询和显示基因组的内容,以及对基因组序列进行注释,注释内容可以在一个窗口中显示所有与某一基因组区域相关的信息:定位和序列信息、已知基因和预测基因、表型和文献支持、mRNA和EST、调控(CpG岛)、比较基因组信息、SNP、基因组重复元件等。

这个网站主页就可以看到,它的功能是多样化的,该网站还可以下载最新的可提供序列:

图片22.png

该网站的最大优势就是可以可视化的看到基因位点:

图片23.png

图片24.png

输入一个gene位置信息,比如ENSG00000121236 :TRIM6 chr11: 5596109-5612958

图片27.png

查看自己的数据:

• https://genome.ucsc.edu/goldenPath/help/customTrack.html

图片28.png

该网站与前几个网站相同,也可以进行BLAST操作:

图片29.png

图片30.png

该网站独有的Gene Sorter工具:

图片31.png

序列下载

图片32.png

图片34.png

看了这期的生物信息分析,希望能对大家的分析有所帮助!

来源:小小小烁烁 原创

版权声明

本网所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

扫码分享:

如果您有科研方面的困扰,发布需求让我们帮您解决吧发布需求

您可能想看

  • 颠覆你的想象!首届智博会发布“黑科技”创新产品

    首届中国国际智能产业博览会23日在此间开幕。一批具有人性化的“黑科技”亮相展会,颠覆人们的想象。

    2018-08-28 12:15:30 阅读(819) 创新创业 智博会 黑科技 意念假肢 电子皮肤 癌症早筛 AI 中科院 浙江大学 腾讯 科大讯飞 翻译机 新能源 汽车 清华大学 石墨烯 阿里云 纳米 机器人

  • 重磅:2018世界大学学术排名最新出炉

    2018年8月15日, 2018软科世界大学学术排名于今日正式发布。

    2018-08-16 10:55:57 阅读(848) 排名 世界大学 学术 2018 清华大学 北京大学 浙江大学 西北工业大学 北京理工大学 重庆大学 南京工业大学 南京信息工程大学 上海大学 北京科技大学

  • 2018年未来科学大奖揭晓,袁隆平等7位顶尖科学家获奖!

    9月8日,第三届未来科学大奖颁奖典礼在北京举行。李家洋、袁隆平、张启发获得“生命科学奖”,马大为、周其林、冯小明分获物质科学大奖,林本坚获数学与计算机科学大奖。

    2018-09-12 10:55:34 阅读(525) 未来科学 颁奖 李家洋 袁隆平 张启发 马大为 周其林 冯小明 林本坚 科学家 生命科学奖 物质科学奖 数学与计算机科学奖

  • 重磅:2018年国家优青获得者出炉!

    今天 (8月17日) ,2018年国家自然科学基金评审结果正式揭晓。国家自然科学基金委发布的公告表示,今年决定资助优秀青年科学基金项目400项。

    2018-08-17 11:52:33 阅读(3159) 优秀青年 国家自然科学基金 评审 公告 清华大学 浙江大学 中国科学技术大学 北京航空航天大学 北京大学 复旦大学 南京大学 中山大学 2018年

  • 2018药企偏差与变更实施与改进专题培训班

    偏差和变更,对于任何企业任何质量系统来说,都是两个最基础的工具,用的好的企业可以使这两个工具极大地促进公司质量体系的建立和完善。

    2018-08-31 19:09:09 阅读(370) 培训班 FDA 偏差 变更 质量体系 制药企业 政策法规 DMAIC GMP 药品研发 质量管理

Copyright 2015-2017 人人实验(北京)科技有限公司 All Rights Reserved 京ICP备15058824