人工智能公司 OpenAI 今天宣布基于 GPT-4 推出新模型 CriticGPT,这个模型并不是开放的,因为它存在的意义就是帮助 OpenAI 寻找 GPT 中出现的错误。
现阶段大多数 AI 公司都有人工审核团队来检查模型输出的结果,因为模型在长期运行中总会出现幻觉和错误,这就需要人工审核团队来标记并进行修正。
然而随着 ChatGPT 这类产品变得越来越准确,即便出现错误也难以发现,这让负责训练的 AI 工程师和负责审核的人工团队力不从心,比如输出的编程代码错误。
OpenAI 称这是 RLHF 的一个根本限制,即随着技术的发展模型知识和能力逐渐超越人类,这会让对齐模型变得越来越困难。
为此该公司基于 GPT-4 系列模型训练了 CriticGPT,这个新模型也使用 RLHF 进行训练,负责分析和评价包含大量错误的输出结果。
从某种意义上说 OpenAI 这做法就是武当梯云纵、左脚踩右脚,通过人工智能来修正人工智能,当然既然梯云纵也是人工智能那也会存在错误,只不过相较于人工审核团队,CriticGPT 拥有丰富的知识并且效率更高,可以更快更准确地找出错误。
值得注意的是 CriticGPT 还将对人类故意提供的错误内容进行评判,典型案例就是人类每天需要吃几块石头,CriticGPT 将可以识别这类故意的错误内容并进行纠正,防止 GPT 直接给出错误的回答。
最后 OpenAI 也强调现实世界中的错误可能会分布在许多回答中,这是未来需要解决的问题。也就是说至少现阶段,想要彻底根除 AI 模型的错误和幻觉是不可能的。
以上就是“OpenAI的武当梯云纵、左脚踩右脚:推出新模型CriticGPT修正AI错误”的详细内容,想要了解更多IT圈内资讯欢迎持续关注编程学习网。
扫码二维码 获取免费视频学习资料
- 本文固定链接: http://www.phpxs.com/post/12234/
- 转载请注明:转载必须在正文中标注并保留原文链接
- 扫码: 扫上方二维码获取免费视频资料