智能AI
morning
识别和理解文本中的人类价值观:基于法学硕士的可定制架构
2026-05-28
1 阅读
Eduardo de la Cruz Fern\'andez, Marcelo Karanik, Sascha Ossowski
arXiv:2605.27373v1 公告类型:新 摘要:随着智能系统变得更加自主,科学界专注于创建包含伦理和道德考虑的决策机制,这与传统的效用最大化模型不同。为了实现这一目标,一个关键方面是评估这些决策与人类价值观的契合程度。为此,一个有前途的研究方向是开发基于大型语言模型(LLM)的方法,从文本中识别人类价值观,无论是显性的还是隐性的,从而能够在整个过程中识别它们。本文介绍了一种基于法学硕士的架构来检测和量化文本中人类价值观的强度,避免了先前与特定价值理论或复杂提示工程相关的方法的局限性。该架构包括三个协调模块:一个从任何理论框架的基础文本生成结构化价值规范;使用这些规范来标记文本的一个;一种根据修辞和语义证据对支持或阻力进行分级。这种模块化方法将概念化的任务与检测人类价值的任务分开,创建一个由适应各种理论的价值规范驱动的可扩展和可重复的过程。该架构使用多个法学硕士进行实例化,并使用 ValueEval 数据集进行评估。实验证明了良好的检测性能,证实了管道的通用性。