|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
卡城新闻 加国新闻 即时新闻 娱乐八卦
最新科技 读者文摘 养生保健 美食饮品
居家生活 移民茶馆 艺术中心 风筝专辑 房屋租赁 求职招聘 便民广告 定居指南 城市介绍 房产动态 留学移民 华人故事 教育话题 财经信息 精华旅游 难得一笑 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
卡城新闻 加国新闻 即时新闻 娱乐八卦 最新科技 读者文摘 养生保健 美食饮品 居家生活 移民茶馆 艺术中心 风筝专辑 房屋租赁 求职招聘 便民广告 定居指南 城市介绍 房产动态 留学移民 华人故事 教育话题 财经信息 精华旅游 难得一笑 |
| 最新科技 |
 卡城华人网信息中心![]()  最新科技
     ![]()  从神助手到拖累开发,AI 编码助理走下坡恐与训练方式有关
|
|
【卡城华人网 www.calgarychina.ca】  2026-01-09 10:44   免责声明: 本消息未经核实,不代表网站的立场、观点,如有侵权,请联系删除。 |
|
近几个月以来AI 编码助理出现一个令人担忧的现象,背后所支援的大型语言模型品质似乎达到天花板,甚至开始走下坡。
专注金融科技的软体公司Carrington Labs 执行长Jamie Twiss 分享自身观察,原本在AI 协助下可能只要5 个小时、没有AI 协助则要10 个小时的开发任务,现在常常需要花上7、8 个小时甚至更久,这样的状况迫使他回头改用旧版模型。 Jamie Twiss 在Carrington Labs 的工作大量使用模型生成的程式码,团队也有一个沙盒环境,能在没有人工介入的情况下建立、部署并执行AI 生成的程式码,他能用一个独特视角来评估AI 编码助理的实际表现。 AI 编码助理过去常见的问题是语法错误,其次是逻辑缺陷。 AI 生成的程式码常常因为语法错误而无法执行,或错误结构中纠缠不清。对此,解法通常是人工介入、找出程式码错误,最终可以解决问题。 然而,近期推出的模型(例如GPT-5)却有更狡猾、更隐晦的处理方式,经常生成看似可以成功执行、却未如期运作的程式码,表面上避开语法错误。模型可能透过移除安全检查、生成符合开发期望的假输出,或其他避免出错的手段来达成。 Jamie Twiss 以OpenAI 9 种不同版本的ChatGPT 重复试验,主要是GPT-4 系列模型及新的GPT-5 变体,也在Anthropic 的Claude 模型测试,都有类似问题。 Jamie Twiss 推测这与模型针对程式码生成的训练方式有关,旧版模型多以大量看似功能完整的程式码作为训练资料,用来调整模型权重。这种方式并不完美,经常出现语法错误或逻辑缺陷,但至少不会移除安全检查,也不会刻意生成看似合理、实则无用的数据。 然而,当AI 编码助理出现并整合至开发环境中,模型开发商似乎意识到拥有一个强大、明确的训练资料来源,即用于开发的使用者本身。如果AI 编码助理提出的程式码能成功执行,而且使用者接受了,那就代表正向讯号,意味着AI 编码助理做对了;如果使用者拒绝,或者程式码无执行,模型在重新训练时会引导至其他方向。这种观念无疑在一段时间内促成AI 编码助理快速进步,但随着越来越多经验不足的使用者加入,训练资料开始被「污染」了。 因此Jamie Twiss 认为,如果AI 编码助理只追逐短期效益,依赖便宜、充足却品质低劣的训练资料,结果只会继续创造更糟糕的模型。有句话这么说「Garbage in, garbage out」,最终陷入不良循环。模型开发商必须投入高品质的训练资料,甚至砸钱请专家参与其中,才能让模型及其技术变好。 来源:科技新报 作者 陈 冠荣 编辑(Edit)     删除(Delete) |
|
|
|
| 版权所有(C), 2002-2026, 卡城华人网中国版 www.calgarychina.ca |
| 版权所有(C), 2002-2026, 卡城华人网中国版 www.calgarychina.ca |