LLM 交易代理中的表示签名和风险反馈协调

arXiv:2605.28850v1 公告类型：新摘要：我们研究金融决策环境中大型语言模型（LLM）代理的行为对齐和表示动态。使用 TradeArena（一个可审计的交易代理测试平台，具有风险报告、执行模拟、内存和可重播轨迹），我们可以分析基本原理、头寸和干预措施在市场压力下如何演变。我们发现了可测量的故障前特征：规划嵌入偏离正常状态质心，融合的计划风险表示将正常状态与预缩减状态分开，并且流形诊断显示故障前的有效秩收缩。为了解决小样本和嵌入选择问题，我们在 8 个 LLM 轨迹上使用 80 个滚动失败锚点，并表明收缩在哈希、LSA、Transformer 和白盒隐藏状态探针中持续存在。使用无 CoT 目标权重、词汇控制、OHLCV 噪声和错误审计报告进行的压力测试表明，基本原理层面的收缩可能会在没有基本原理的情况下消失，而意图空间收缩可能仍然存在；词汇多样性不会崩溃；融合的签名在噪声下仍能提供信息。我们还发现，结构化风险反馈可以充当外部调整信号，无需微调，但不能作为通用的绩效增强器：真实的审计反馈可以改善某些模型的校准、其他模型的回报和回撤，并揭示隐藏或安慰剂反馈具有较高短期回报但调整诊断较弱的情况。最后，一项 51 只股票的日内实验揭示了一个相关性盲点：LLM 的基本原理通常证明集中投资于风险层反复削减的耦合资产是合理的，并以滚动马科维茨基线作为协方差参考。这些结果支持研究主张，而不是盈利能力主张：可审计的风险反馈和代表性轨迹揭示了法学硕士财务推理何时协调、漂移或失败。

订阅66必读