在接受《华尔街日报》(WSJ)採访时,Scaled Cognition 共同创办人兼执行长 Dan Roth 表示,公司致力於解决人工智慧(AI)前沿模型所带来的问题,形容这些模型「令人惊叹」,但同时也「有点像精神分裂症天才」。
「他们能给出令人难以置信的答案,然后你可以再问一次同样的问题,得到完全不同的答案......甚至可能不正确,」他说。
「我们真的相信,这些系统要真正有用,必须能够信任它们。而要让你信任他们,他们必须是可证明可靠的。」

执行长补充说,仅仅一个错误就可能带来可怕的后果,并以医疗人工智慧幻觉处方中单一数字的影像,并给病患错误用药為例。
报告指出,Roth 与共同创办人兼技术长 Dan Klein 希望开发能提供可靠準确结果的替代 AI 架构,这促成了 APT(Agentic Pretrained Transformer)的诞生,这是他们公司的旗舰模型。
《华尔街日报》补充,除了APT,Scaled Cognition还建构了一个企业AI部署平台,具备代理工具、即时代理监控与模拟与评估框架。
正如去年这裡所报导的,幻觉已成為「头条风险」。怀俄明州一名联邦法官威胁要制裁提交充斥虚假案件的AI生成意见书的律师,而律师事务所Butler Snow去年春天也承认其律师依赖幻觉引用。
PYMNTS当时写道:「消费者聊天应用程式中看似古怪的技术故障,当应用於银行、支付或合规时,却迅速成為声誉与监管的地雷。」「业界曾经把幻觉视為初期的失误。如今,它们被视為结构性的。」
去年《华尔街日报》报导指出,领先开发者开始训练 AI 说「我不知道」,而非即兴应变,因為他们意识到机率模型永远无法完全避免错误。
在支付领域,劳埃德银行与Coinbase在部署更安全的生成式AI系统后,提升了对其幻觉防护的信心。在保险业,公司也开始提供涵盖 AI 相关错误的保单,包括幻觉输出,PYMNTS 补充说,「凸显风险已变得多麼严重」。
Scaled Cognition 募集 1 亿美元用於解决人工智慧幻觉问题
Medicare的AI试点证明核准非常简单。付款很困难。
