12天的第二天 OpenAI「强化微调」震撼登场,效果逆天,面向开发者和机器学习工程
直播回放双字幕
**OpenAI扩展强化微调研究计划,面向开发者和机器学习工程师**
OpenAI宣布将扩展其**强化微调研究计划**,旨在帮助开发者和机器学习工程师创建针对特定复杂领域任务进行优化的专家模型。该计划将使参与者能够定制OpenAI的模型,以提高其在特定任务领域的表现,尤其是在法律、保险、医疗、金融和工程等领域。
什么是强化微调?
强化微调是一种新的模型定制技术,允许开发者使用数十到数千个高质量任务对模型进行微调,并通过提供参考答案来评估模型的回答。这种技术有助于加强模型在类似问题上的推理能力,从而提高其在特定任务中的准确性。
适合哪些机构申请?
OpenAI鼓励研究机构、大学和企业申请加入该计划,特别是那些目前依赖专家团队执行复杂任务并且能从AI助手中获益的机构。OpenAI表示,强化微调在那些任务具有客观“正确”答案并且大多数专家能够达成共识的领域,已取得了有希望的成果,特别是在法律、保险、医疗、金融和工程等领域。
计划内容
作为该研究计划的一部分,参与者将获得OpenAI的**强化微调API**的测试权限,用于在自己的领域特定任务中测试这一技术。参与者将被要求提供反馈,以帮助OpenAI在公开发布前改进API。此外,OpenAI希望与愿意分享数据集的组织合作,以帮助提升其模型的性能。
如何申请
有兴趣的组织可以通过填写申请表来参与该计划。OpenAI将根据组织的需求和情况,选择合适的参与者。该计划的名额有限,OpenAI将与申请者联系并告知申请状态。OpenAI计划在2025年初正式公开推出强化微调技术。
申请表包括:
- 组织名称、领域、联系方式等基本信息
- 使用强化微调的具体案例或问题描述
- 已尝试过的其他方法及遇到的挑战
- 定制专家模型的期望输入输出
- 是否有开发团队可以与API合作
OpenAI强调,优先考虑愿意共享数据集的组织,以帮助改进其模型。
计划展望
OpenAI表示,强化微调将在帮助组织提高专业任务执行的效率和准确性方面发挥重要作用,尤其是在专家意见和标准答案明确的领域。
申请地址:https://openai.com/form/rft-research-program/