NKChemSQL——针对MySQL的化学信息学扩展

来源 :计算机与应用化学 | 被引量 : 0次 | 上传用户:zfgzfgzfg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
化学数据库是进行化学信息学研究的重要资源,分子属性与指纹计算、分子结构格式转换、分子相似度匹配、精确匹配和子结构匹配以及分子结构图片导出等,都是必需的基本服务内容。应用广泛的数据库系统MySQL却缺乏这些功能,难以满足化学信息处理、网站开发等开发的需求。NKChemSQL是自行编制的MySQL扩展库,通过对开源软件OpenBabel的功能进行包装,以SQL语言的格式完成相应操作。NKChemSQL具有良好的运行表现,经过对含26万余条分子结构信息的NCI数据库进行的测试,全结构匹配只需不到1秒而子结构匹配达300个结构/秒,相似度匹配则达1万个结构/秒。NKChemSQL为开发化学信息学软件和网站提供了非常便利的新方式。 Chemical database is an important resource for chemical informatics research. It is an essential service content for molecular properties and fingerprinting calculation, molecular structure format conversion, molecular similarity matching, exact matching and substructure matching and molecular structure image export. MySQL, a widely used database system, lacks these features and can hardly meet the needs of chemical information processing and website development. NKChemSQL is a self-compiled MySQL extension library that wraps the functionality of open source OpenBabel in SQL language. NKChemSQL has good running performance. After testing the NCI database with more than 260,000 molecular structure information, the whole structure matches in less than 1 second and the substructure matches up to 300 structures / second and the similarity matches up to 1 Ten thousand structures / second. NKChemSQL offers a new and easy way to develop chemical informatics software and websites.
其他文献
采用化学热力学状态函数法,根据真实气体范德华状态方程式和气体恒压热关系式,导出了氧弹内真实气体的恒容热关系式。然后进一步导出了恒容条件下氧弹内试样完全燃烧物系的热
为探究吕家坨井田地质构造格局,根据钻孔勘探资料,采用分形理论和趋势面分析方法,研究了井田7
分析了渤南油田注入水水质 ,探讨了其对油层的伤害。结果表明 ,渤南油田注入水结垢严重 ,注入水中固相颗粒对油层的伤害较大。据此选用阻垢剂 S2 -3保护油层 ,对其进行评价表
孤岛油田 Ng1 + 2油层含油面积 37.2 km2 ,地质储量 2 73× 1 0 5t;油藏埋深 1  1 30~ 1  1 90 m,平均厚度 4.6m;油层主要由一套粉砂和细粉砂岩组成 ,粒度中值 0 .0 6~ 0 .1
竺可桢、钱学森、茅以升、严济慈、苏步青……在浙江科技馆西边的一个展览区,中国科技史上泰斗级的350余张名录镶满了十几面墙。这350余名科学家,都有一个共同的元素“浙 Zh
针对现有方法存在的问题 ,提出按给定连杆上一个基点及过该基点的一根标线的若干位置来设计平面四杆机构的代数解法 ,即根据已知条件分别综合两个双杆组并求出其独立的结构参
利用PowderX软件绘制Y_3Al_5O_(12)粉体的XRD图谱,介绍其用于无机材料化学实验课程;还可根据衍射数据计算晶面指标;利用软件画出的衍射图读取的半峰宽数据,可以计算粉体颗粒
探讨了用有限元方法进行结构动态分析的过程 ,给出了雷达天线结构的动力平衡方程式。以某单位雷达天线模型为例 ,对其结构进行了分析 ,对其固有频率进行了计算 ,并对其振型进
非负矩阵分解(NMF)是1种全新的提取特征和数据降维方法,本文将NMF率先引入近红外(NIR)光谱的数据处理,以识别中药鱼腥草为例,将收集到的干燥鱼腥草样品粉碎后,取适量置于石英