OpenAI 12天完整回顾
文章目录[隐藏]
过去 12 个工作日,OpenAI 每天发布新产品或展示 AI 功能,这场活动被命名为“OpenAI 的 12 天”。虽然我们已经报道了主要公告,为了帮助大家全面了解,这里将详细回顾每天的进展。
在 Google 推出竞品的背景下,这些密集发布展示了 AI 领域竞争的激烈程度。原本可能需要数月完成的发布被压缩到短短 12 个工作日,让用户和开发者在迎接 2025 年时面临大量信息的消化。
有趣的是,当我们询问 ChatGPT 对这一系列发布的看法时,它对活动本身的真实性表示了怀疑。ChatGPT-4o 写道:“12 天内密集发布看似合理,但如果没有更详细的解释,特别是这些功能的复杂性安排,这可能让人质疑其可信度。”
然而这一切确实发生了。以下是每天的重要进展。
第 1 天:12 月 5 日,周四
OpenAI 面向全球 ChatGPT Plus 和 Team 用户发布完整版 o1 模型。据称该模型运行速度更快,在解决复杂实际问题时错误率降低了 34%。此外,o1 模型新增了图像分析功能,用户可以上传图片并获得详细内容解释。OpenAI 宣布未来将为 ChatGPT 添加网页浏览、文件上传功能,并开放 API 接口,支持视觉任务、函数调用和结构化输出。
同时,OpenAI 推出了月费 200 美元的 ChatGPT Pro 订阅,提供无限使用 o1、GPT-4o 和 Advanced Voice 功能的权限。公司还宣布将为知名机构的 10 位医学研究人员免费提供 Pro 订阅,并计划扩展到其他领域。
第 2 天:12 月 6 日,周五
第二天,OpenAI 推出强化微调 (RFT) 技术,这是一种通过强化学习提升推理能力的新 AI 训练方法。据悉,Berkeley Lab 研究员 Justin Reese 使用 RFT 技术研究罕见遗传疾病,而 Thomson Reuters 则利用它开发 CoCounsel AI 法律助手。开发者仅需提供数据集和评估标准,其余流程由 OpenAI 平台自动完成。
第 3 天:12 月 9 日,周一
第三天,OpenAI 将文本转视频模型 Sora 打造成独立产品并上线 sora.com,现已面向 ChatGPT Plus 和 Pro 用户开放。新版 Sora 的运行速度更快,标志着 OpenAI 正式进军视频合成市场。这是从研究到产品转化的里程碑式更新。
第 4 天:12 月 10 日,周二
第四天,Canvas 功能结束测试阶段并向所有用户开放,包括免费用户。Canvas 为处理超长文本和编程项目提供了专用界面,并与 GPT-4o 完美整合。更新后的 Canvas 支持 Python 代码运行、文本导入、自定义 GPT 兼容性以及“显示更改”功能,可追踪内容修改记录。
第 5 天:12 月 11 日,周三
第五天,OpenAI 宣布 ChatGPT 与苹果设备智能助手的整合,支持 iPhone 16 系列、配备 A17 Pro 或 M1 及以上芯片的 iPad,以及搭载 M1 或更高版本处理器的 Mac。这项功能允许用户通过系统级智能功能访问 ChatGPT 的文本、图像和文档分析功能,极大提升了易用性。
第 6 天:12 月 12 日,周四
第六天,ChatGPT 语音功能新增“视频通话”模式和圣诞老人语音功能。视频通话支持屏幕共享并通过移动应用实现,圣诞老人语音选项提供了趣味交互,但不保留对话历史。这项功能已向大多数国家开放,部分地区将在稍后上线。
第 7 天:12 月 13 日,周五
OpenAI 发布了新的组织功能“Projects”,让用户可以将对话和文件分类整理。这一功能基于 GPT-4o 模型,为特定任务和主题管理提供了更高效的平台。未来计划包括支持更多文件格式和接入 Google Drive、OneDrive 等云存储。
第 8 天:12 月 16 日,周一
ChatGPT 的搜索功能向所有免费用户开放,并优化了速度和移动端体验。用户现在可以像使用传统搜索引擎一样进行查询,同时新增的地图界面和语音搜索功能提升了实用性。
第 9 天:12 月 17 日,周二
OpenAI 推出 o1 模型 API,新增函数调用、视觉处理和开发者消息功能。此外,大幅降低 GPT-4o 音频处理价格,同时推出更经济的 GPT-4o mini 版本。Go 和 Java 工具包测试版的发布为开发者提供了更多便利。
第 10 天:12 月 18 日,周三
第十天,OpenAI 推出通过免费电话号码和 WhatsApp 使用 ChatGPT 的新服务。美国用户可拨打 1-800-CHATGPT 进行每月不超过 15 分钟的电话通话,而全球用户可通过 WhatsApp 使用相同号码进行交互。这项服务旨在覆盖网络不稳定的用户,提供了一种创新的 AI 接入方式。
第 11 天:12 月 19 日,周四
第十一天,OpenAI 扩展了 ChatGPT 与桌面软件的集成范围,包括 JetBrains 系列 IDE、VS Code 及其变体等工具,同时新增了与 Apple Notes、Notion 和 Quip 的集成。这些功能大幅提升了生产力工具的整合能力,但需付费订阅用户才能访问。
第 12 天:12 月 20 日,周五
最后一天,OpenAI 预告了新一代推理模型 o3 和 o3-mini,并开放测试申请。o3 模型在多项高级评估中创下记录,如 Codeforces 编程竞赛和 AIME 数学竞赛。这表明 OpenAI 正在继续突破生成式 AI 的技术边界,推动前沿研究。
总结
OpenAI 的“12 天”活动展现了其对多模态能力的深入布局,以及构建完整开发者生态系统的战略。从 o1 模型的全能升级,到 Sora 的正式上线,再到 API 的扩展,这些举措表明 OpenAI 正在推动生成式 AI 的应用向更多领域渗透,为未来的科技格局铺路。
从强化微调技术到 o3 的前沿能力,OpenAI 正在为 2025 年的 AI 技术发展进行全方位的准备。可以预见,未来生成式 AI 的影响将远远超出当前的文本聊天和图像生成领域。