
当地时辰12月6日,OpenAI公布第二日活动主题:推出了强化微调(Reinforcement Fine-Tuning),匡助斥地者和机器学习工程师打造针对特定复杂范围任务的大师模子。OpenAI CEO Sam Altman在X发帖称,强化微调的后果终点棒体育游戏app平台,是他本年最大的惊喜之一,期待看到民众利用这种功能的创造。
该神气通过全新的模子定制技能,闪斥地者不错使用高质地任务集对模子进行微调,并利用参考谜底评估模子的反馈,从而擢升模子在特定范围任务中的推奢睿力和准确性。
OpenAI的商榷员称,强化微调并不是只教模子模子输出,它的运作相貌是,当模子发现一个问题的时候,商榷者给模子空间区仔细想考这个问题,然后评估模子给出的最终解答,期骗强化学习,商榷者不错强化产生正确谜底的想路,遏制产生造作谜底的想路,只需要“几十个例子”致使12个例子,模子就能以有用的新相貌学习特定范围的推理。
OpenAI商榷员演示,强化微调后的o1 mini测试通过率致使比郑再版o1高24%,比未强化微调的o1 mini提高了82%。
举报 第一财经告白配合,请点击这里此骨子为第一财经原创,文章权归第一财经悉数。未经第一财经籍面授权,不得以任何相貌加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律背负的职权。 如需获取授权请酌量第一财经版权部:021-22002972或021-22002335;banquan@yicai.com。 文章作家
一财科技
关联阅读
OpenAI首发o1郑再版和200好意思元 /月Pro会员ChatGPT Pro的套餐中还不错包括名为o1 pro mode的新o1版块,亦然ChatGPT Pro特有的o1版块。
62 昨天 08:17
OpenAI官宣12天12场新品发布会,AI见地股集体大涨周三,OpenAI首席现实官Sam Altman秘书从12月5日开动为期12天的「OpenAI 12 天」活动,将流通12个职责日发布新的AI功能和居品。
107 309 12-05 10:46
OpenAI放大招!12天12场新品发布知情东谈主士表现公司关于2025年的方针是将活跃用户数目提高至10亿。
160 12-05 09:24
OpenAI聘用Coinbase前高管为首席营销官Rouch之前在加密货币公司Coinbase任职,崇拜全球营销和天下关系。
28 12-04 16:01
马斯克条目好意思司法院禁绝OpenAI转型为谋利性企业埃隆·马斯克条目好意思国一法院禁绝好意思国怒放东谈主工智能商榷中心(OpenAI)“违章”转型为谋利性企业体育游戏app平台。
51 12-02 07:40 一财最热 点击关闭