>>返回【卡城华人网】主页




卡城新闻   加国新闻   即时新闻   娱乐八卦    最新科技   读者文摘   养生保健   美食饮品    居家生活   移民茶馆   艺术中心   风筝专辑   
房屋租赁   求职招聘   便民广告   定居指南    城市介绍   房产动态   留学移民   华人故事    教育话题   财经信息   精华旅游   难得一笑   

>>返回【卡城华人网】主页





卡城新闻  加国新闻  即时新闻  娱乐八卦
最新科技  读者文摘  养生保健  美食饮品
居家生活  移民茶馆  艺术中心  风筝专辑
房屋租赁  求职招聘  便民广告  定居指南
城市介绍  房产动态  留学移民  华人故事
教育话题  财经信息  精华旅游  难得一笑

最新科技
 卡城华人网信息中心
 最新科技
     AI决策行为转为量化指标Appier提出「风险感知决策」框架

AI决策行为转为量化指标Appier提出「风险感知决策」框架

【卡城华人网 www.calgarychina.ca】  2026-03-10 12:24
  免责声明: 本消息未经核实,不代表网站的立场、观点,如有侵权,请联系删除。
【卡城华人网】AI决策行为转为量化指标Appier提出「风险感知决策」框架
Appier 深化AI 创新技术与前瞻研究,研究团队尤其聚焦代理式AI(Agentic AI)与大型语言模型等领域。最新研究论文《回答、拒绝或猜测?探究语言模型的风险感知决策》提出一套可系统化衡量「语言模型在不同风险情境下决策策略」的评估框架,透过创新方法显著提升模型在高风险应用场景中的决策可靠性。



这次研究针对企业最关注的「AI 幻觉与决策可靠性」问题,提出「风险感知决策」(Risk-Aware Decision-Making)框架,将大型语言模型在不同风险情境下的决策行为转化为可量化指标,为企业导入AI 自主运作建立更完整的治理基础。

传统语言模型的评估方式,多以「是否答对」作为主要指标。在企业应用场景中,「答错的代价」与「拒答的价值」往往截然不同。这次研究在维持原有任务题目的前提下,引进「答对奖励、答错惩罚、拒答成本」等设定,系统化建立不同风险情境。语言模型依据自身能力、对答案的信心程度及风险条件进行判断,选择「回答、拒答或猜测」,并以是否能最大化预期报酬作为衡量指标,以评估决策品质与策略合理性。

藉由「风险感知决策」评估框架,研究团队发现,目前多数大型语言模型在不同风险情境下,普遍出现「策略失衡」。例如高风险情境下(错误可能造成重大商业损失),模型仍倾向过度猜测;而在低风险情境下,模型却又过度保守、拒绝回答。这种决策不稳定性,将限制AI 在企业应用场景中的自主化与安全性。研究进一步指出,问题并非完全源自模型知识不足,而是模型不擅长将多项能力「自发性整合为稳定的决策策略」。

为了改善上述问题,研究团队提出「技能拆解」(Skill Decomposition)方法,将模型的决策任务拆解成3 个步骤分别完成:先解题得到初步答案,再评估自己对解答的信心程度,最后依风险条件做期望值推理,进而合并判断「答题或拒答」的最佳策略。透过步骤拆解的推理架构,模型能更有效地整合多项能力,在高风险情境下做出更合理、更稳定的决策,为企业级AI 提供一条具体、可落地的提升路径。

这篇研究论文获得OpenAI「语言模型为何会有幻觉」研究论文的引用,研究成果也将进一步应用在Appier 代理式AI 驱动的广告云、个人化云及数据云产品线,协助企业客户能以更可信任的方式推进自主化工作流程。

「Agentic AI 要走进企业关键流程,不仅在于『更聪明』,更要自主决策能否『更可靠』。」Appier 执行长暨共同创办人游直翰表示,「这次研究将LLM『风险感知』转化为可量化方法论,有助于强化企业级可信任基础,推动Agentic AI 更快、更稳健落地企业场景,加速把AI 能力转化为可规模化交付的商业价值与ROI。」

来源:科技新报

编辑(Edit)     删除(Delete)







>>返回【卡城华人网】主页




版权所有(C), 2002-2026, 卡城华人网中国版 www.calgarychina.ca

版权所有(C), 2002-2026, 卡城华人网中国版 www.calgarychina.ca