|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
卡城新闻 加国新闻 即时新闻 娱乐八卦
最新科技 读者文摘 养生保健 美食饮品
居家生活 移民茶馆 艺术中心 风筝专辑 房屋租赁 求职招聘 便民广告 定居指南 城市介绍 房产动态 留学移民 华人故事 教育话题 财经信息 精华旅游 难得一笑 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
卡城新闻 加国新闻 即时新闻 娱乐八卦 最新科技 读者文摘 养生保健 美食饮品 居家生活 移民茶馆 艺术中心 风筝专辑 房屋租赁 求职招聘 便民广告 定居指南 城市介绍 房产动态 留学移民 华人故事 教育话题 财经信息 精华旅游 难得一笑 |
| 最新科技 |
 卡城华人网信息中心![]()  最新科技
     ![]()  AI决策行为转为量化指标Appier提出「风险感知决策」框架
|
|
【卡城华人网 www.calgarychina.ca】  2026-03-10 12:24   免责声明: 本消息未经核实,不代表网站的立场、观点,如有侵权,请联系删除。 |
Appier 深化AI 创新技术与前瞻研究,研究团队尤其聚焦代理式AI(Agentic AI)与大型语言模型等领域。最新研究论文《回答、拒绝或猜测?探究语言模型的风险感知决策》提出一套可系统化衡量「语言模型在不同风险情境下决策策略」的评估框架,透过创新方法显著提升模型在高风险应用场景中的决策可靠性。
这次研究针对企业最关注的「AI 幻觉与决策可靠性」问题,提出「风险感知决策」(Risk-Aware Decision-Making)框架,将大型语言模型在不同风险情境下的决策行为转化为可量化指标,为企业导入AI 自主运作建立更完整的治理基础。 传统语言模型的评估方式,多以「是否答对」作为主要指标。在企业应用场景中,「答错的代价」与「拒答的价值」往往截然不同。这次研究在维持原有任务题目的前提下,引进「答对奖励、答错惩罚、拒答成本」等设定,系统化建立不同风险情境。语言模型依据自身能力、对答案的信心程度及风险条件进行判断,选择「回答、拒答或猜测」,并以是否能最大化预期报酬作为衡量指标,以评估决策品质与策略合理性。 藉由「风险感知决策」评估框架,研究团队发现,目前多数大型语言模型在不同风险情境下,普遍出现「策略失衡」。例如高风险情境下(错误可能造成重大商业损失),模型仍倾向过度猜测;而在低风险情境下,模型却又过度保守、拒绝回答。这种决策不稳定性,将限制AI 在企业应用场景中的自主化与安全性。研究进一步指出,问题并非完全源自模型知识不足,而是模型不擅长将多项能力「自发性整合为稳定的决策策略」。 为了改善上述问题,研究团队提出「技能拆解」(Skill Decomposition)方法,将模型的决策任务拆解成3 个步骤分别完成:先解题得到初步答案,再评估自己对解答的信心程度,最后依风险条件做期望值推理,进而合并判断「答题或拒答」的最佳策略。透过步骤拆解的推理架构,模型能更有效地整合多项能力,在高风险情境下做出更合理、更稳定的决策,为企业级AI 提供一条具体、可落地的提升路径。 这篇研究论文获得OpenAI「语言模型为何会有幻觉」研究论文的引用,研究成果也将进一步应用在Appier 代理式AI 驱动的广告云、个人化云及数据云产品线,协助企业客户能以更可信任的方式推进自主化工作流程。 「Agentic AI 要走进企业关键流程,不仅在于『更聪明』,更要自主决策能否『更可靠』。」Appier 执行长暨共同创办人游直翰表示,「这次研究将LLM『风险感知』转化为可量化方法论,有助于强化企业级可信任基础,推动Agentic AI 更快、更稳健落地企业场景,加速把AI 能力转化为可规模化交付的商业价值与ROI。」 来源:科技新报 编辑(Edit)     删除(Delete) |
|
|
|
| 版权所有(C), 2002-2026, 卡城华人网中国版 www.calgarychina.ca |
| 版权所有(C), 2002-2026, 卡城华人网中国版 www.calgarychina.ca |