生物信息软件“机器人” GeneDataMax 与 基因岛服务网站 是用 C 与 PHP (一种服务器端 HTML 嵌入式语言) 编程并建立在 Linux 操作系统与 MySQL 数据库之上的。
Linux 是一个遵循 POSIX ( Portable Operating System Interface ) 标准的开放源码的操作系统,具有 安全、稳定和移植性好,并有丰富的软件支持和强大的网络功能。MySQL 是一种 快速 的多用户、多线索化并具有丰富结构化查询语言 (SQL) 的关系数据库系统。
MySQL 与 Linux 一样,具有开放源码的特点,它们是在自由软件基金会 ( Free Software Foundation ) 通用公共许可证 ( GPL, General Public License ) 注册下使用最广泛的关系数据库与操作系统。Linux - MySQL 的组合特别适合于应付繁忙的网络业务以及那些特别需要授权访问特定数据库的场合。
GeneDataMax 是以 C 语言编程的,其关键技术是用 TCP/IP 及相关协议,编写出能 直接 或 通过代理服务器 经因特网到美国国家生物技术信息中心 (NCBI) 的 GenBank 数据库、欧洲生物信息研究所的 EMBL 数据库以及日本 DNA 数据银行的 DDBJ 数据库等网站自动搜索新数据的软件,并将运算、归类结果自动存入客户端的关系数据库 MySQL 中。客户端数据库还设一 WWW 接口以便于客户在 内部网络 或 因特网 上用浏览器检索。自动收集并归类 DNA 碱基序列的信息可按客户要求设定为每日一次(或数次)或每小时一次(或数次)自动上因特网搜索、下载有关数据,甚至可设定成每分钟一次。每次下载前与客户端数据库进行比较,使之 仅仅下载新数据。
GeneDataMax 软件每天(或每小时)对数据库的资料自动进行一次 统计分析,计算 G + C 含量、读码框的密码子使用频率以及编码蛋白质的平均分子量等并存入客户自己内部的数据库以备查询;软件还能对新数据自动进行分析处理,将 DNA 碱基序列中的编码部分翻译成相对应的氨基酸并计算出蛋白质分子量等,然后把这些新产生的数据也存入数据库中。这些原始与新产生的各种数据以客户易于使用的方式存储,便于客户利用其内部网络或因特网分别以其生物学特性、种名、发表时间、刊物、作者、编码蛋白质命名与功能、碱基序列和关键词等按字母顺序 浏览 或按用户给予的特定词汇 检索。与此同时,软件还能自动收集有关的 MEDLINE 文献摘要,便于客户参考使用。
|