tooluniverse-chemical-compound-retrieval by mims-harvard/tooluniverse
npx skills add https://github.com/mims-harvard/tooluniverse --skill tooluniverse-chemical-compound-retrieval通过适当的消歧义和跨数据库验证,检索全面的化合物数据。
重要提示:在工具调用中始终使用英文化合物名称和搜索词,即使用户使用其他语言书写(例如,将“阿司匹林”翻译为“aspirin”)。仅当英文搜索无结果时,才尝试使用原始语言术语作为备用方案。使用用户的语言进行回复。
Phase 0: Clarify (if needed)
↓
Phase 1: Disambiguate Compound Identity
↓
Phase 2: Retrieve Data (Internal)
↓
Phase 3: Report Compound Profile
仅在以下情况下询问用户:
以下情况跳过澄清:
from tooluniverse import ToolUniverse
tu = ToolUniverse()
tu.load_tools()
# Strategy depends on input type
if user_provided_cid:
cid = user_provided_cid
elif user_provided_smiles:
result = tu.tools.PubChem_get_CID_by_SMILES(smiles=smiles)
cid = result["data"]["cid"]
elif user_provided_name:
result = tu.tools.PubChem_get_CID_by_compound_name(compound_name=name)
cid = result["data"]["cid"]
广告位招租
在这里展示您的产品或服务
触达数万 AI 开发者,精准高效
始终在两个数据库中建立化合物身份:
# PubChem → ChEMBL cross-reference
chembl_result = tu.tools.ChEMBL_search_compounds(query=compound_name, limit=5)
if chembl_result["data"]:
chembl_id = chembl_result["data"][0]["molecule_chembl_id"]
对于通用名称(例如,“vitamin”, “steroid”, “acid”):
身份解析清单:
静默检索所有数据。不要叙述搜索过程。
# Basic properties
props = tu.tools.PubChem_get_compound_properties_by_CID(cid=cid)
# Bioactivity summary
bio = tu.tools.PubChem_get_bioactivity_summary_by_CID(cid=cid)
# Drug label (if approved drug)
drug = tu.tools.PubChem_get_drug_label_info_by_CID(cid=cid)
# Structure image
image = tu.tools.PubChem_get_compound_2D_image_by_CID(cid=cid)
if chembl_id:
# Detailed bioactivity
activity = tu.tools.ChEMBL_get_bioactivity_by_chemblid(chembl_id=chembl_id)
# Protein targets
targets = tu.tools.ChEMBL_get_target_by_chemblid(chembl_id=chembl_id)
# Assay data
assays = tu.tools.ChEMBL_get_assays_by_chemblid(chembl_id=chembl_id)
# Patents (for drugs)
patents = tu.tools.PubChem_get_associated_patents_by_CID(cid=cid)
# Similar compounds (for SAR)
similar = tu.tools.PubChem_search_compounds_by_similarity(cid=cid, threshold=85)
| 主要工具 | 备用工具 | 备注 |
|---|---|---|
| PubChem_get_CID_by_compound_name | ChEMBL_search_compounds → get SMILES → PubChem_get_CID_by_SMILES | 名称查找失败 |
| ChEMBL_get_bioactivity | PubChem_get_bioactivity_summary | ChEMBL ID 不可用 |
| PubChem_get_drug_label_info | 注明“药物标签不可用” | 非已批准药物 |
以化合物概况报告的形式呈现结果。隐藏所有搜索过程细节。
# Compound Profile: [Compound Name]
## Identity
| Property | Value |
|----------|-------|
| **PubChem CID** | [cid] |
| **ChEMBL ID** | [chembl_id or "N/A"] |
| **IUPAC Name** | [full name] |
| **Common Names** | [synonyms] |
## Chemical Properties
### Molecular Descriptors
| Property | Value | Drug-Likeness |
|----------|-------|---------------|
| **Formula** | C₉H₈O₄ | - |
| **Molecular Weight** | 180.16 g/mol | ✓ (<500) |
| **LogP** | 1.19 | ✓ (-2 to 5) |
| **H-Bond Donors** | 1 | ✓ (<5) |
| **H-Bond Acceptors** | 4 | ✓ (<10) |
| **Polar Surface Area** | 63.6 Ų | ✓ (<140) |
| **Rotatable Bonds** | 3 | ✓ (<10) |
### Structural Representation
- **SMILES**: `CC(=O)Oc1ccccc1C(=O)O`
- **InChI**: `InChI=1S/C9H8O4/...`
[2D structure image if available]
## Bioactivity Profile
### Summary
- **Active in**: [X] assays out of [Y] tested
- **Primary Targets**: [list top targets]
- **Mechanism**: [if known]
### Key Target Interactions (from ChEMBL)
| Target | Activity Type | Value | Units |
|--------|--------------|-------|-------|
| [Target 1] | IC50 | [value] | nM |
| [Target 2] | Ki | [value] | nM |
## Drug Information (if applicable)
### Clinical Status
| Property | Value |
|----------|-------|
| **Approval Status** | [Approved/Investigational/N/A] |
| **Drug Class** | [therapeutic class] |
| **Indication** | [approved uses] |
| **Route** | [oral/IV/topical/etc.] |
### Safety
- **Black Box Warning**: [Yes/No]
- **Major Interactions**: [if any]
## Related Compounds (if retrieved)
Top 5 structurally similar compounds:
| CID | Name | Similarity | Key Difference |
|-----|------|------------|----------------|
| [cid] | [name] | 95% | [note] |
## Data Sources
- PubChem: [CID link]
- ChEMBL: [ChEMBL ID link]
- Retrieved: [date]
应用于数据完整性评估:
| 等级 | 符号 | 标准 |
|---|---|---|
| 完整 | ●●● | 所有核心属性 + 生物活性 + 药物信息 |
| 基本完整 | ●●○ | 核心属性 + 生物活性 或 药物信息 |
| 基础 | ●○○ | 仅核心属性 |
| 最低 | ○○○ | 仅 CID/名称,数据有限 |
在报告标题中包含:
**Data Completeness**: ●●● Complete (properties, bioactivity, drug data)
每个化合物概况必须包含以下部分(即使“不可用”):
用户:“Tell me about metformin” → 强调药物信息的完整化合物概况
用户:“Verify this SMILES: CC(=O)Oc1ccccc1C(=O)O” → 以消歧义为重点的概况,确认身份
用户:“Find compounds similar to ibuprofen” → 相似性搜索 + 比较属性表
用户:“What proteins does gefitinib target?” → 强调 ChEMBL 生物活性数据并附靶点列表
| 错误 | 响应 |
|---|---|
| “Compound not found” | 尝试同义词,验证拼写,提供 SMILES 搜索 |
| “No ChEMBL ID” | 在身份部分注明,继续使用 PubChem 数据 |
| “No bioactivity data” | 包含“无生物活性筛选数据可用”的部分 |
| “API timeout” | 重试一次,注明不可用数据并标记“(检索失败)” |
PubChem(化学数据库)
| 工具 | 用途 |
|---|---|
PubChem_get_CID_by_compound_name | 名称 → CID |
PubChem_get_CID_by_SMILES | 结构 → CID |
PubChem_get_compound_properties_by_CID | 分子属性 |
PubChem_get_compound_2D_image_by_CID | 结构可视化 |
PubChem_get_bioactivity_summary_by_CID | 活性概述 |
PubChem_get_drug_label_info_by_CID | FDA 药物标签 |
PubChem_get_associated_patents_by_CID | 知识产权信息 |
PubChem_search_compounds_by_similarity | 查找类似物 |
PubChem_search_compounds_by_substructure | 子结构搜索 |
ChEMBL(生物活性数据库)
| 工具 | 用途 |
|---|---|
ChEMBL_search_compounds | 名称/结构搜索 |
ChEMBL_get_compound_by_chemblid | 化合物详情 |
ChEMBL_get_bioactivity_by_chemblid | 活性数据 |
ChEMBL_get_target_by_chemblid | 蛋白质靶点 |
ChEMBL_search_targets | 靶点搜索 |
ChEMBL_get_assays_by_chemblid | 检测方法元数据 |
每周安装量
164
代码库
GitHub 星标数
1.2K
首次出现
2026年2月4日
安全审计
安装于
codex155
opencode155
gemini-cli150
github-copilot147
amp142
kimi-cli141
智能OCR文字识别工具 - 支持100+语言,高精度提取图片/PDF/手写文本
976 周安装
skill-creator:AI CLI技能自动化创建工具,遵循Anthropic最佳实践,支持Copilot/Claude/Codex
447 周安装
Git推送工作流:自动暂存、规范提交、一键推送远程分支的智能脚本
447 周安装
文件管理技能 - 自动化文件/文件夹操作、批量处理、安全管理的智能工具
452 周安装
macOS开发专家指南:SwiftUI、SwiftData、AppKit与macOS 26(Tahoe)开发实践
448 周安装
CI/CD流水线专家指南:GitHub Actions、GitLab CI、Jenkins安全高效部署
446 周安装
Accord Project 智能合同模板生成器 - 自动化创建法律合同与协议模板
476 周安装