Dogecoin - An open-source peer-to-peer digital currency (访问: hash.cyou 领取999USDT)
结构域分析与可视化 基迪奥 生物信息培训小组 1 提纲 • 蛋白结构域与注释方式 • 已知蛋白结构域的注释 • 新序列结构域的挖掘 2 蛋白结构域 • 定义: 结构域是生物大分子中具有特异结构和独立功能的区域, 特别指蛋白质中这样的区域。 例如,锌金属蛋白酶是一类可催化肽链内部肽键水解的 肽链内切酶,尽管所属的各个亚家族成员的整体空间结构差 异显著,但催化活性部位的结构非常类似,故将它们归属于 一类蛋白。 3 一般基因注释存在的问题 一般的基因注释(基于blast )对多结构域的蛋白功能注 释,实际上存在问题。 新序列 ACT domain BLAST 参考序列: (分支酸变位酶) Chorismate mutase domain ACT domain Chorismate mutase 在 BLAST结果中, top hits 是参考序列中的 chorismate mutases - 那么名称 “chorismate mutase” 就自动赋予了新序列. 然后导致一系列错误 (这个序列被赋予错误的名称,EC号,错误的pathway, etc) 4 最终蛋白结构域分析与展示 • 检查确认我们挑选的目标基因(家族)准确 无误; • 围绕对应的结构域讨论目标基因(家族)的 功能。 5 练习数据 • 11个拟南芥NAC转录因子数据存放在“练 习”目录下。 • 请把注意该在线工具的服务器在国外,由 于线路的原因有时候会比较卡。 6 提纲 • 蛋白结构域与注释方式 • 已知蛋白结构域的注释 • 新序列结构域的挖掘 7 绘制已知的结构域 网址: /search/sequence#tabview=tab1 绘制已知的结构域 • 将邮件收到的结果中的这个部分复制到txt 9 绘制已知的结构域 • 分别输入邮件的结果文件和序列文件,并规定序 列的排布顺序。 10 提纲 • 蛋白结构域与注释方式 • 已知蛋白结构域的注释 • 新序列结构域的挖掘 11 MEME使用介绍 1. MEME 用在什么地方 2. 软件参数的设定 3. 结果的解读 4. MEME结构域图的绘制 5. MEME结果与pfam结果的比较 12 MEME的用途 • 在一批序列中,分析其保守的序列。 例如: 从一组某种转录因子的结果序列中,找保守域,则其 潜在为这个转录因子的结合位点; 从一组蛋白家族中,找保守域,则这些保守域可能是 这个蛋白的功能位点。 13 MEME MEME Suite是集合众多预测和注释motif工 具的在线网站,其中MEME算法是基于最大 期望值(EM )算法来识别motif。 地址:/ 14 MEME 点击 Motif Discovery ,然后选择MEME 15 MEME 该页面一共有 5个参数。对任何参数有问 题 ,可以点击 ?(帮助文档 )。 3个关键参数可以考虑: Input the primary sequences (上传数 据 ): Select the site distribution 默认是:Zero or one occurrence per sequence ,某类型的结构域 (motif )在一 条 序 列 只 出 现 0 次 或 1 次 。 改 为 “any number of repetitions” Select the number of motifs 决定在这一组多条序列中,将被挖掘出的结 构域(motif )的种类数量。默认值是3 ,这 意味着在这一组序列中,发现的motif的数 量最多3个。但有时候,我们无法预先了解 这组序列实际上的结构域的数量,那么可以 先填写一份较大的数值。例如10。在完成分 析后,再查看分析结果中结构域的显著性。 例如,如果结果中保守性达到显著水平 P0.05 )的结构域数量是6。那么,则可 (