智能AI morning

基于前沿法学硕士的代理可以克服自然表型的本体管理瓶颈

2026-05-29 1 阅读 James P. Balhoff, Hilmar Lapp
arXiv:2605.28965v1 公告类型:新 摘要:将自由文本表型描述与本体术语链接起来(通常称为表型注释)对于比较形态学数据的交叉研究整合至关重要。这一劳动密集型过程严重依赖训练有素的人类专家,这使得其难以扩展,从而成为一个关键瓶颈。达杜尔等人。 (2018) 在七项系统发育研究中建立了实体质量 (EQ) 注释的黄金标准 (GS),并用它来评估三名人类管理者和具有基于本体的语义相似性度量的 Semantic CharaParser NLP 工具;他们报告说,机器与人的一致性明显低于策展人之间(人与人)的一致性。在这里,我们重新审视了来自 Anthropic 和 OpenAI 的五位前沿托管法学硕士的基准,每个人都在一个独立的工作空间中充当“代理策展人”,提供源出版物 PDF、原始人类策展人使用的相同注释指南、四个项目本体(UBERON、PATO、BSPO、GO)和验证脚本。根据相同的黄金标准进行评估,每个代理都属于原始研究中三位训练有素的人类生物策展人的策展人间变异范围;表现最好的智能体接近但没有到达表现最好的人类策展人。代理在所有四个指标上都远远优于 Semantic CharaParser。