2011-05-09 60 views
1

更新:答案中的链接既有趣又有用,但不幸的是没有解决对java API的需求,所以我仍然期待着任何输入。有没有人使用过pubchemdb?任何类似的API?

我正在构建化合物数据库。我需要所有的同义词(IUPAC和通用名称)以及每个的安全数据。
我将使用在PubChem数据库免费提供的数据(http://pubchem.ncbi.nlm.nih.gov/)

有简单的HTTP查询得到每种化合物的一种简单的方法。例如,为了获得甘油数据,网址是:

http://pubchem.ncbi.nlm.nih.gov/summary/summary.cgi?cid=753 

而下面的URL将返回一个简单的解析格式:

http://pubchem.ncbi.nlm.nih.gov/summary/summary.cgi?cid=753&disopt=DisplaySDF 

但它将只响应非常基本的信息,缺乏安全性数据只有少数常用名字。

JAVA有一个公共领域的API,看起来非常完整,由Scripps(citation)的一个小组开发。代码是here

不幸的是,这个API没有很好的文档记录,并且由于所涉及的数据的复杂性而很难遵循。 对于我所收集的内容,pubchemdb正在使用PubChem Power User Gateway (PUG) XML API

有没有人使用过此API(或任何其他可用的)?我希望有一个关于如何开始的简短说明或教程。

+0

这可能是StackOverflow的专家。有没有可以尝试的化学信息学社区? – 2011-05-09 20:21:42

+0

@Tom它可能相当专业,但我希望有人在这里使用这些数据库。这里回答了很多ncbi问题。我也可以直接与作者联系。 – Aleadam 2011-05-09 23:13:11

+0

嗯,我生活和学习! – 2011-05-11 10:17:15

回答

2

Cactvs Chemoinformatics toolkit(免费用于学术/教育用途)已全面PubChem集成。使用脚本环境,你可以轻松地做类似

 
cactvs>ens create 753 

ens0 

cactvs>ens get ens0 E_NAMESET 

PROPANE-1,2,3-TRIOL GLYCEROL 8043-29-6 29796-42-7 30049-52-6 37228-54-9 75398-78-6 78630-16-7 8013-25-0 175385-78-1 25618-55-7 64333-26-2 56-81-5 {Tegin M} LS-1377 G8773_SIGMA 15523_RIEDEL {Glycerin, natural} NCGC00090950-03 191612_ALDRICH 15524_RIEDEL {Glycerol solution} L-glycerol 49767_FLUKA {Biodiesel impurity} 49770_FLUKA 49771_FLUKA NCGC00090950-01 49927_FLUKA Glycerol-Gelatine G7757_SIAL GOL D-glycerol G9012_SIAL {Polyhydric alcohols} c0066 MOON {NSC 9230} G2025_SIGMA ZINC00895048 49781_FLUKA {Concentrated glycerin} {Concentrated glycerin (JP15)} D00028 {Glycerin (JP15/USP)} 44892U_SUPELCO {Glycerin, concentrated (JAN)} CRY 49782_FLUKA NCGC00090950-02 G6279_SIAL W252506_ALDRICH G7893_SIAL {Glycerin, concentrated} 33224_RIEDEL Bulbold Cristal Glyceol G9281_SIGMA Glycerol-1,2,3-3H G1901_SIGMA G7043_SIGMA 1,2,3-trihydroxypropane 1,2,3-trihydroxypropanol glycerin G2289_SIAL G9406_SIGMA {Glycerol-[2-3H]} CHEBI:17754 Glyzerin Oelsuess InChI=1/C3H8O3/c4-1-3(6)2-5/h3-6H,1-2H {90 Technical glycerine} Dagralax {Glycerin, anhydrous} {Glycerin, synthetic} Glycerine Glyceritol {Glycyl alcohol} Glyrol Glysanin NSC9230 Ophthalgan Osmoglyn Propanetriol {Synthetic glycerin} {Synthetic glycerine} Trihydroxypropane Vitrosupos {WLN: Q1YQ1Q} Glycerol-1,3-14C {4-01-00-02751 (Beilstein Handbook Reference)} AI3-00091 {BRN 0635685} {CCRIS 2295} {Caswell No. 469} {Citifluor AF 2} {Clyzerin, wasserfrei [German]} {EINECS 200-289-5} {EPA Pesticide Chemical Code 063507} {FEMA No. 2525} {Glicerina [DCIT]} {Glicerol [INN-Spanish]} {Glycerin (mist)} {Glycerin [JAN]} {Glycerin mist} {Glycerine mist} Glycerinum {Glycerolum [INN-Latin]} Grocolene {HSDB 492} IFP {Incorporation factor} 1,2,3-Propanetriol C00116 Optim {Propanetriol (VAN)} {1,2,3-PROPANETRIOL, HOMOPOLYMER} {Glycerol polymer} {Glycerol, polymers} {HL 80} {PGL 300} {PGL 500} {PGL 700} Polyglycerin Polyglycerine Polyglycerol {Unigly G 2} {Unigly G 6} G5516_SIGMA MolMap_000024 

cactvs> 

这个隐藏所有PUG丑 - 但在任何情况下,我敢说,PUG 有据可查。该工具包远不止简单的数据下载 - 如果需要,甚至可以打开PubChem并像本地SD文件一样查询。

PubChem不包含安全数据,但。安全性数据依赖于国家/地区,严格管制,您应该非常小心,不要受到责任。请法务人员检查您的方法!

+0

谢谢你的回复。我下载了cactvs pdf文档,我会继续。它看起来很有趣。 – Aleadam 2011-05-10 21:40:09

相关问题