我想从Pubchem数据库中提到的所有IUPAC名称中建立一些长度的前缀和后缀列表,以便我可以在我的项目中进一步使用它们作为特征。因此,我希望所有IUPAC化学名称都位于文本文件中或以某种格式提取这些列表。如何提取从Pubchem(NCBI)提供的数据中提到的所有IUPAC名称到文本文件中?
Thanks.
我想从Pubchem数据库中提到的所有IUPAC名称中建立一些长度的前缀和后缀列表,以便我可以在我的项目中进一步使用它们作为特征。因此,我希望所有IUPAC化学名称都位于文本文件中或以某种格式提取这些列表。如何提取从Pubchem(NCBI)提供的数据中提到的所有IUPAC名称到文本文件中?
Thanks.
听起来你需要像这样Nist species list
您可以搜索大部分也是在Webbook,但我没能找到下载链接配套。
在我们的实验室中,我们得到了一个质谱数据库的Cd(?),其中包含(完整的 - 好像它有250.000个物质)数据库作为文本文件。也许你可以通过一些供应商获得。
该pubchem网站为您提供通过ftp下载他们的数据转储。为什么不使用它?
该文本文件仅包含大约72,000个名称,但我需要更多,因为我的项目中使用的培训文件包含的内容多于lakh.So请帮助我找到一种方法从Pubchem数据库中提取名称。 – kasharavi