3986.net
小网站 大容量 大智慧
当前位置:首页 >> 幼儿读物 >>

生物信息学上机实验2019--更新 46页PPT文档_图文

生物信息学 上机练习
1. 生物序列的信息检索 2. 多序列比对及进化树的构建 3. (选做) Phylip使用

1,序列的数据库信息检索示例:
待查询序列:
CCCCTGCCTGGCAGCCCTTTCTCAAGGACCACCGCAT CTCTACATTCAAGAACTGGCCCTTCTTGGAGGGCTGC GCCTGCACCCCGGAGCGGATGGCCGAGGCTGGCTTC ATCCACTGCCCCACTGAGAACGAGCCAGACTTGGCCC AGTGTTTCTTCTGCTTCAAGGAGCTGGAAGGCTGGGA GCCAGATGACGACCCCATAGAGGAACATAAAAAGCAT TCGTCCGGTTGCGCTTTCCTTTCTGTCAAGAAGCAGTT TGAAGAATTAACCCTTGGTGAATTTTTGAAACTGGACA GAGAAAGAGCCAAGAACAAAATTGCAAAGGAAACCAA CAATAAGAAGAAAGAATTTGAGGAAACTGCGGAGAAA GTGCGCCGTGCCATCGAGCAGCTGGCTGCCATGGATT GAGGCCTCTGGC

问题
1,这是什么基因?基因的标识符是什么?在基因组 上的定位是怎样的?
2,编码的蛋白质多少个氨基酸?序列标识符为?序 列是?
3,该蛋白没有保守的功能结构域 ? 4,该蛋白亚细胞定位是?它的功能是怎样的? 5,该蛋白在真核生物中是否保守? 6,该蛋白有没有三级结构信息?

答案
1. 该基因为人的BIRC5基因;基因标识符:NM_001168.2; 染色体定位:17号染色体,76210277..76221716; 2. 人的BIRC5蛋白质包含142个氨基酸,序列标识符为: NP_001159.2;
序列为: MGAPTLPPAWQPFLKDHRISTFKNWPFLEGCACP…
3. BIRC5具有保守的功能结构域BIR; 4. BIRC5的细胞亚定位:胞质,核;其功能有:
(1) 在瘤形成过程中可能起一定作用; (2) 阻碍G2/M期的细胞编程性凋亡; (3) Chromosomal passenger complex (CPC)的成员之一。
等等。
5. 该基因在真核生物中最保守很可能是来自毛猩猩Pongo abelii的BIRC5蛋白:Q5RAH9; 6. 该蛋白的三级结构已知,在PDB中的标识符为1E31等。

2,多序列比对及进化树构建
构建Cytochrome C1家族进化树
1. 在Uniprot数据库中搜索Cytochrome C1 在不同物种中的氨基酸序列,下载fasta文 件
2. 使用MEGA软件对结果进行分析:
1)多序列比对(MSA multiple sequence alignment)
2)构建进化树

Cytochrome C1家族序列获取
? 工具网站 uniprot.org/ ? ?advanced search
? ?customize

调整结果显示格式
?选择想要显示的内容,例如显示列为
– Entry name – Organism – Sequence – Protein names
?save
? ?以蛋白名称:Cytochrome C1为关键词搜索

搜索结果

编辑Fasta序列文件
? 选择搜索结果中Entry name 以“CY1_”开 头的序列(选十几个物种序列,每一个种属 只选一个序列,即entry name一样的只选 择一个即可)
? ?点retrieve

编辑Fasta序列文件
? Download FASTA格式的 文件
? 直接下载下来的序列名称 会很累赘,可以将该文件 以文本形式打开,对序列 名称进行编辑,让其看起 来更加简洁明了

Fasta文件格式
以>为开头,后接序列名称,重启一行,输入序列
>CY1_BOVIN MAAAAATLRGAMVGPRG… >CY1_YEAST MFSNLSKRWAQRTLSKS… >CY1_HUMAN MAAAAASLRGVVLGPRG… >…

Fasta文件要求
? 序列名称中不含有 ‘=’ 字符
? 氨基酸序列可以分成多行,但内部不要有 空格
? 每个序列的title仅保留蛋白/基因名称+种 属来源,如:CY1_YEAST

MEGA 5软件使用
? 打开MEGA 5,拉开Align菜单,选择 Edit/Build Alignment

MEGA 5软件使用
? Creat a new Alignment
? 选择Protein

MEGA 5软件使用
? 在新弹出的窗口中,选择Data->Open>Retrieve Sequences from File,然后导 入刚才保存的fasta文件

多序列比对
? Ctrl+A选择全部序列,Aligment->Align by ClustalW

多序列比对
? 可以修改各补偿值等参数,点OK

多序列比对
? 多序列比对完成
? Date?export alignment, 导出MEGE format和 Fasta format两份结果, 得到一个*.meg文件 和一个*.fas文件

进化树构建
? 关闭Alignment窗口,回到MEGA软件主 窗口,File -> Open A File/Session,打 开之前保存的*.meg文件

进化树构建
? 选择Phylogeny->Construct/Test Neighbor-Joining Tree
? 点yes

进化树构建& bootstrap 验证
? 点compute
Bootstrap method 验证进化树,点开
选择 bootstrap

调整树的形状及树枝长度

去掉不可信的分支

3,(选做) Phylip使用 自展法- 进化树的可靠性分析
Bootstrap Method ? 从排列的多序列中随机有放回的抽取某一列
,构成相同长度的新的排列序列;
? 重复上面的过程,得到多组新的序列;
? 对这些新的序列进行建树,再观察这些树与 原始树是否有差异,以此评价建树的可靠性。
? 一般Bootstrap的值>70,则认为构建的进化树 较为可靠。

随机有放 回的抽取 原始数据 的一列, 直到列数 和原始数 据一样
有放回意 味着有些 列被采到 多次,有 的列没有 采到

比较一致性, 两种做法
Phylib采用

Phylip软件包介绍
? 由华盛顿大学遗传学系开发,免费的系统发 育分析软件包。
? 几乎最广泛使用的系统发生分析程序,主要 包括以下几个程序组:分子序列组,距离矩 阵组,基因频率组,离散字符组,进化树绘 制组。
? 访问及免费下载地址:
evolution.genetics.washington.edu/phylip.html

Phylip软件包介绍
? Phylip包含了35个独立的程序,这些独立的程序都 实现特定的功能,这些程序基本上包括了系统发生 分析的所有方面。
? 多种不同平台的版本(包括windows,Macintosh ,DOS,Linux,Unix和OpenVMX)。
? Phylip软件包的文档是非常详细的,对于每个独立 的程序,都有一个独立的文档,详细的介绍了该程 序的使用及其说明。

Phylip软件包的应用
? outfile是一个记录文件,记录了分析的过程 和结果,可以直接用文本编辑器(如写字 板)打开。
? outtree是分析结果的树文件,可以用 phylip提供的绘树程序打开查看,也可以用 其他的程序来打开,如treeview等。
由于默认输出的名字是一样 的,为了防止被覆盖,要把 默认的输出名字改一下

Windows 版本的phylip 软件包

示例:Phylip软件包构建进化树

新建文本文件 testSeq.fasta

现有8段protein序列:
>P1

复制以下序列,注意最后是 fasta格式

MPRFAANLSMMFTEVPFIERFAAARKAGFDAVEFLFPYNYSTLQIQKQLE

>P2

MPRFEANLSMMFTEVPFAERFADARKAGFDAVEFLFPYCYSDLQIQCQLE

>P3

WPRFEANLSMMFTEVPFAERFADARKIGFDAEEFLFPYCYSDLQIQCQLE

>P4

MPCFAANLSMMFTEVPFIERFAAARKAGFDAVEFLFPYNYSTLQIQKQLE

>P5

MPRFEANLSMEFTAVPFIERFADARKAGFDAVEFLFPYCYSTLQIQKQLE

>P6

MPRFEANLSMMFTEVPFAERFADARKAGFDAEEFLFPYCYSDLQIQCQLE

>P7

MPRFEANLSMEFTEVPFIERFADARKAGFDAVEFLFPYCYSTLQIQKQLE

>P8

WPRFEANLSMMFTEVPFAERFADARKAGFDAEEFLFPYCYSDLQIQCQLE

? 第一步:使用CLUSTALX 多序列比对, File/Load Sequenes读入 testSeq.fasta,输出格式 File/Save Sequenes as 为
*.PHY

这步的目的是完成格式转换, 准备构建进化树的序列

PHY的格式
? 输出的*.PHY文件: 8和50分别表示8个序列和每个序列有50个氨基 酸

? 第二步:双击打开SEQBOOT ,按路径输入刚才生成 的 *.PHY文件;设定适当参数;输出outfile文件。
注意输入正确的文 件地址,可以把文 件拷到当前目录

这步的目的是用 Bootstrap的方 法产生多个复本

可以使用默认值,输入Y 随机数

? 重命名Outfile文本文件为Outfile1,打开如下: (包括了100个replicates)

? 第三步:打开PROTPARS(最大简约法),输入 Outfile1文件后如下显示:

多组数据

目的是构建各 个副本的进化 树

? 设定适当参数;运行输出outfile和treefile文件。

? 重命名Outfile文本文件为 Outfile2,重命名OutTree 为OutTree2;打Outfile2 开如右:
(包括了100个replicates的 结果)

? 第四步:打开CONSENSE程序,输入outtree2, 运行输出outfile和treefile文件。分别重命名为 outfile3和treefile3.tre
该步骤目的是综合100个复本,构建一致的 进化树

? 获得的结果文件中,文本文件outfile3显示如下:
outfile

? 树文件outtree3.tre用TREEVIEW软件打开显示:
outtree

作业:
? 自主选择你所感兴趣的问题,利用生物信息学信 息检索途径,回答你的问题。
? 格式: 已知:… 待查询问题: … 解答途径: 方法、数据库… 结果:…
–鼓励使用新途径解决新问题!
?本科已修生物信息课的同学可以不用上机,但需要完成此项作业。

作业要求
? 发信至 snttustc.edu ? 邮件名称:学号+姓名 ? 答题内容使用文本文件(TXT),如无截图
内容不要使用Word文件或其他格式。 ? 文件名:学号+姓名.TXT


推荐相关:

生物信息学bioinf7 28页PPT文档_图文.ppt

生物信息学bioinf7 28页PPT文档_幼儿读物_幼儿教育_教育专区。七、蛋


生物信息学第一章 生物信息学引论 119页PPT文档_图文.ppt

生物信息学第一章 生物信息学引论 119页PPT文档 - 生物信息学 2019/8/19 1 课程安排 1、时间:每周一下午5~8节 教室:第三教学楼第二阶梯教室 学时:每周4...


生物信息学概论的案例2 76页PPT文档_图文.ppt

生物信息学概论的案例2 76页PPT文档_幼儿读物_幼儿教育_教育专区。同义置换与非...Mathews & Donoghue (2019) Science 286:947-950 Science 295: 1683 3/1/...


生物信息学课件-PPT文档资料_图文.ppt

生物信息学课件-PPT文档资料_理学_高等教育_教育专区...利用计算机分析分子结构。通过 交互操作平移、旋转和...2019年3月,北京大学于成立了 生物信息学中心; ? ...


2019年最新-生物信息学基础讲座-精选文档_图文.ppt

2019年最新-生物信息学基础讲座-精选文档_理学_高等教育_教育专区。2019 生物信息学基础讲座第3讲 生物信息学与数学 微积分 calculus 函数function ? ? 一元函数...


2019总结课程-PPT精选文档_图文.ppt

2019总结课程-PPT精选文档_动物植物_PPT模板_实用文档2019 生物信息学 复习重点 《生物信息学》第一讲 生物信息学从事对基因组研究相关生 物信息的获取、加工、...


2019总结课程 52页PPT文档_图文.ppt

2019总结课程 52页PPT文档 - 生物信息学 复习重点 《生物信息学》第一讲 生物信息学从事对基因组研究相关生 物信息的获取、加工、储存、分配、 分析和解释。 1...


2019年-生物信息学6二级数据库及数据库的格式-PPT精选....ppt

2019年-生物信息学6二级数据库及数据库的格式-PPT精选文档_理学_高等教育_教育...的一般用于克隆和测序实验的序列,该库随着EMBL的扩充 而实时更新 ...


生物信息学课件1-PPT课件_图文.ppt

生物信息学课件1-PPT课件_理学_高等教育_教育专区。...(1942-46) 人类基因组计划 (1990-2019) 阿波罗...? (经典)用计算机储存、比较、提取、分析、预言、 ...


生物信息学6二级数据库及数据库的格式-PPT文档资料_图文.ppt

生物信息学6二级数据库及数据库的格式-PPT文档资料_理学_高等教育_教育专区。...计算机程序可以利用序列计数或校检求和的值来保证序列 Copyright 2019-2019 Aspose...


最新2019-生物信息学概论第七章蛋白质和RNA结构预测110....ppt

最新2019-生物信息学概论第七章蛋白质和RNA结构预测1101-PPT课件_理学_高等教育_教育专区。最新2019-生物信息学概论第七章蛋白质和RNA结构预测1101-PPT课件 ...


遗传学幻灯13-30页PPT文档资料_图文.ppt

遗传学幻灯13-30页PPT文档资料_理学_高等教育_教育...含有 1383个标记 2019 年将 2275 标记定位到 1157...生物信息学 1、生物信息学(Bioinformatics) 采用...


蛋白质组学研究中的生物信息学-PPT文档资料_图文.ppt

蛋白质组学研究中的生物信息学-PPT文档资料_理学_...? 至2019年,生物信息学数据库总数已达858个。 ? ...实验数据 从序列数据 库中进行发 掘的蛋白质 组学...


生物信息学资源1_图文.ppt

界的单细胞真核生物,它的全基因组 已在2019年测定...欧洲分子生物学实验室的EMBL数据 库也于1982年开始...生物信息学资源1-PPT文档... 70页 5下载券 11...


2019年-11第十一课生物信息学的基因聚类分析-PPT精选文....ppt

2019年-11第十一课生物信息学的基因聚类分析-PPT精选文档_理学_高等教育_教育专区。2019 基因表达数据的聚类分析基因表达数据主要来自于两个方面:一是基因芯片,这是...


第一章医学科学研究方法与思维方式2019-9-17-PPT精品文....ppt

方法与思维方式2019-9-17-PPT精品文档_医学_高等...化学计算机数学生物化 学 生物学 生物信息学 生物...实验与观察 ? 学科交叉意识 46 第三节 医学科学...


生物信息学_图文.ppt

搜试试 2 悬赏文档 全部 DOC PPT TXT PDF XLS ...它体现了生物学、 计算机科学、数学、物理学等学科...? 生物信息学通过对生物学实验数据的获取、 加工、...


生物信息学软件及使用技巧_图文.ppt

搜试试 5 悬赏文档 全部 DOC PPT TXT PDF XLS 广告 百度文库 实用文档 ...3. 用计算机管理实验数据。 Bioinformatics Basics 生物学软件常用功能(核酸类) ...


生物信息学教学模式探讨-2019年精选文档.doc

搜试试 2 悬赏文档 全部 DOC PPT TXT PDF XLS ...生物信息学教学模式探讨-2019年精选文档_理学_高等...以及计算机科学等诸多学科知识进行分析、判断、推理、...


甲型H7N9流感院感技术_(讲议稿)12.12-46页文档资料_图文.ppt

搜试试 2 悬赏文档 全部 DOC PPT TXT PDF XLS ...文档贡献者 chennengq003 贡献于2019-10-04 ...生物信息学原理与方法-第... 暂无评价 29页 5...

网站首页 | 网站地图
3986 3986.net
文档资料库内容来自网络,如有侵犯请联系客服。zhit325@qq.com