Dogecoin - An open-source peer-to-peer digital currency (访问: hash.cyou 领取999USDT)
蛋白质及结构域基本信息查询的WEB数据库(PDB-CATH) 1.主要数据来源 a)ProteinDataBank(:该文件为FASTA格式,文件信息包括:蛋白质链ID、氨基酸序列、序列氨基酸长度、 结构测定方式(Xray或者NMR或者其他)等。 b)CATH:ProteinStructureClassificationDatabase(:包括PDB数据库中拥有CATH信息的蛋白质链信息; CathDomainList.v4.0.0:包括PDB数据库中拥有CATH信息的蛋白质链的结构域信息; CathDomainSeqs.ATOM.v4.0.0:包括PDB数据库中拥有CATH信息的蛋白质链的结构域的序 列信息。 2.WEB数据库基本功能和用途 a)用户提交蛋白质链ID或者结构域ID,能返回其基本信息(包括氨基酸序列及长度、结构测 定方式等); b)用户提交任意蛋白质链ID(PDB数据库)或者蛋白质序列,能按一定条件,如:蛋白结 构测定方式(Xray或NMR或其他或全部)或搜索对象(蛋白质链或蛋白质结构域或全部), 查找并返回氨基酸长度相似的蛋白质链或蛋白质结构域的ID及其氨基酸序列基本信息。 3.构建工具 推荐 a)MySQL b)PHP c)Perl 4.WEB数据库搭建步骤 虽然本项目现阶段实现的基本功能和用途离实际应用的意义和复杂性还有差距,但 WEB数据库搭建所用到的工具和搭建步骤却是可移植的。基本步骤如下: a)设计数据库表; b)解析原始文本数据,并装载数据库表数据; c)设计访问界面和查询结果返回界面的PHP页面; d)编写后台程序,其中包括处理HTTP表达请求、建立后台数据库连接、查询和页面显示查 询返回结果。 5.注意事项 a)小组成员对WEB数据库构建有兴趣,并对Perl编程语言、PHP有一定基础或有意愿去学习 Perl、PHP; b)可借鉴3D-Surfer,或者EM-Surfer 。