OpenAI 发布的这一最新更新,不仅让开发者可以访问更强大的 AI 模型,还大幅降低了使用成本。举例来说,之前需要较高费用才能使用的语音功能,现在价格已降幅达 60%。对于预算有限的开发者,OpenAI 还特别推出了"迷你版"语音服务,费用仅为原来的十分之一。具体更新内容如下:
更新亮点:
- OpenAI O1 模型:API 现支持功能调用、开发者消息、结构化输出以及视觉识别等新功能。
- 实时 API 升级:新增 WebRTC 支持,GPT-4O 音频费用降低 60%,同时推出 GPT-4O mini,语音服务费用仅为原来的十分之一。
- 偏好微调(Preference Fine-Tuning):全新定制技术,让开发者根据用户需求更容易优化模型。
- Go 和 Java SDK:官方测试版已上线,方便开发者快速集成。
这些进步意味着什么?
简而言之,AI 应用的开发变得更加简单、经济且定制化。无论是智能客服、自动翻译,还是其他创新应用,开发者都能以更低的成本实现他们的创意。
01. OpenAI O1 模型的实际应用
全新 O1 模型代表了重要的技术升级。相比旧版本,新模型不仅变得更智能,还能更快速地响应用户需求。当前,该模型已向高级开发者开放,并计划逐步扩大使用范围。具体改进包括:
改进亮点:
- 更快的响应速度:处理速度提升 60%,开发者可调节"思考时间",平衡速度与准确性。
- 更强的实用功能:
- 视觉识别:支持图像理解,特别适用于工业生产、科研等领域。
- 精准输出:生成格式统一的内容。
- 个性化对话:调整语气和风格,满足不同场景需求。
- 系统集成:与其他软件系统轻松对接,实现复杂功能。
实际应用案例:
- 智能客服:更好地理解和解决客户问题。
- 供应链优化:帮助企业管理库存和物流。
- 金融分析:协助预测市场趋势。
性能测试成绩:
- 基础能力:准确率 75.7%。
- 编程能力:高达 76.6%。
- 数学计算:某些测试准确率高达 96.4%。

这些进步将推动 AI 应用变得更聪明、更快速,更符合实际需求。未来,无论是在线购物的智能推荐还是工作中的数据分析,都将得到更强支持。

目前,OpenAI 正在分批开放 O1 模型的使用权限,预计更多创新应用将迅速涌现。
02. 更低延迟、更低成本、更高灵活性
OpenAI 的实时 API 使开发者能够构建流畅自然的实时对话体验,适用于语音助手、实时翻译、虚拟导师、交互式客服等场景。以下是更新的主要亮点:
1. WebRTC 支持:
- WebRTC 集成:作为开放标准,WebRTC 让开发者可以跨平台构建实时语音产品,支持音频编码、流式传输、噪音抑制、拥堵控制等功能,确保低延迟和高效互动体验。
2. 降低成本与提升语音质量:
- 价格调整:语音服务价格大幅下调 60%。例如:
- 输入:$40/百万 tokens,输出:$80/百万 tokens。
- 缓存音频:降至 $2.50/百万 tokens。
- GPT-4O mini 语音服务:新推出的迷你版,价格仅为原来的四分之一,且语音质量未受影响:
- 输入:$10/百万 tokens,输出:$20/百万 tokens。
- 缓存音频:统一定价 $0.30/百万 tokens。
3. 灵活的功能控制:
- 并发后台任务:支持在不中断语音互动的情况下进行后台任务(如内容审核)。
- 自定义上下文输入:灵活选择要输入的内容,如审核最后一句话或重用历史响应。
- 精准响应控制:通过语音活动检测(VAD),开发者可以控制响应时机和会话时长,提升交互体验。
这些更新将推动语音交互技术在更多场景中广泛应用,带来更低成本和更高质量的语音服务。
03. AI 更懂你的需求:偏好微调
OpenAI 最新推出的偏好微调(Preference Fine-Tuning)功能,简化了 AI 模型的个性化定制。这项创新技术采用了"直接偏好优化"(DPO)方法,让模型通过对比不同回答,学习识别符合用户偏好的回答方式。
传统微调与偏好微调的对比:
- 传统微调:依赖监督式学习,训练模型遵循固定答案。
- 偏好微调:根据用户的偏好优化模型,让 AI 更懂得理解个性化需求,特别适合无标准答案的场景,如写作风格、对话语气等。
成功案例:
Rogo AI 开发的金融助手在处理复杂查询时,通过偏好微调,模型准确率提升至 80% 以上,远超传统微调的 75%。
偏好微调功能将于今天正式上线,支持 GPT-4O 2024-08-06 版本,未来将扩展至 GPT-4O mini。
04. Go 和 Java SDK 测试版发布
为了便于开发者快速接入 OpenAI 服务,OpenAI 正式发布了 Go 和 Java 语言的 SDK 测试版,扩展了支持的编程语言。与已有的 Python、Node.js 和 .NET SDK 一同,开发者可以选择最适合自己的工具来开发 AI 应用。
Go SDK:
- 适用于高性能场景,特别是在并发任务处理中表现出色,特别适合构建需要快速响应的在线服务。通过这个 SDK,开发者可以轻松地将 AI 功能集成到 Go 项目中,简化配置过程,提升开发效率。