OpenAI 12天发布会:从“哇”到“哎呦”,AI的进化史就像过山车!导语:OpenAI年末的12天连续发布会刚刚落幕。每一天的更新就像打开一个AI版的“巧克力盲盒”,令人既兴奋又充满期待。虽然前11天有些平淡,但在最后一天,OpenAI推出的“GPT-03”一举打破了业界对AI瓶颈的质疑,展现了强大的AGI潜力。那么,这12天的发布到底有哪些值得关注的亮点呢?让我们一起来回顾这场AI界的“过山车”之旅。

第一天:12月5日,OpenAI 推出 o1 推理模型与 ChatGPT Pro 订阅服务

活动的第一天,OpenAI便展现出强大的技术实力,发布了完整版的 o1 推理模型。这个新模型不仅大幅提升了AI的计算能力与表现,也为用户提供了更加快速、精准的AI体验。尤其值得注意的是,o1 推理模型已开放给每月20美元的 Plus订阅用户,尽管由于需求量大,使用量有限制。但同时,OpenAI还推出了 ChatGPT Pro 订阅计划,价格为每月200美元,用户不仅可以享受到o1模型的强大功能,还能获得无限制的高级语音模式、优先体验新功能等多项特权。

这一发布展示了OpenAI在推理能力上的巨大突破,标志着AI的计算能力和效能进入了一个全新的阶段。对开发者和企业用户来说,这无疑是一项值得关注的重磅技术。

第二天:12月6日,OpenAI 扩展强化微调(RFT)计划

第二天,OpenAI宣布扩大其 强化微调(Reinforcement Fine-Tuning,RFT)研究计划。该计划旨在帮助开发者将OpenAI的模型训练成特定领域的专家,以便其能够在复杂任务中提供更加精准的解决方案。通过强化微调技术,开发者可以通过提供任务和对模型输出进行评分来引导AI的学习过程,提升其在特定领域的表现。

目前,该计划已面向科研机构、大学和企业用户开放,并计划在2024年初向大众开放API接口。这一举措的推出,将使更多开发者能够利用OpenAI的技术进行定制化的深度学习和精细调优,进一步推动AI在行业应用中的普及和深入。

第三天:12月9日,OpenAI 发布 Sora 视频生成模型

到了活动的第三天,OpenAI发布了备受期待的 Sora 视频生成模型。这个模型可以从文本生成视频,并且支持多种创新功能,包括视频间的生成与编辑。Sora Turbo 是该模型的升级版,具备更高的智能水平,且价格相对更加亲民。

值得注意的是,Sora目前仅对 ChatGPT Plus 和 Pro 用户开放,Plus用户每月可以生成50个480p分辨率的视频,Pro用户的使用量是Plus用户的10倍。Sora的发布标志着OpenAI在视觉内容生成领域迈出了重要一步,为创作者和企业提供了全新的生产力工具。

此外,OpenAI还推出了 Storyboard工具,使用户可以为视频的每一帧生成输入,从而更加精细地控制视频的创作过程。

第四天:12月10日,Canvas功能重大更新

第四天,OpenAI对其 Canvas功能 进行了重大升级。Canvas现已集成至GPT-4o模型中,并且对所有用户开放。Canvas不仅支持生成艺术作品,还新增了Python代码运行功能,极大增强了开发者和数据科学家的使用体验。

Canvas界面经过优化,用户可以直接在模型选择器中操作,同时也能在创建自定义GPT时自动启用Canvas功能。这一更新使得Canvas不仅仅是艺术创作的工具,它还将为更多的编码、数据分析和AI开发任务提供便捷支持。

第五天:12月11日,ChatGPT 与 Apple Intelligence 集成

12月11日,OpenAI与 苹果 进行了深度合作。苹果在发布 iOS 18.2 版本时,新增了与 Siri、写作工具 和 Visual Intelligence(视觉智能) 深度集成的 ChatGPT功能。Siri现可智能识别无法回答的问题,并将其交给ChatGPT处理。此外,苹果手机的相机也新增了视觉智能功能,允许用户通过相机识别物体,并获取相关信息。

这一集成让用户在使用Apple产品时,能更加高效地获取答案,提升了语音助手的实用性和AI的应用场景。

第六天:12月12日,高级语音模式新增屏幕共享和视觉功能

12月12日,OpenAI宣布其 高级语音模式(Advanced Voice Mode)迎来了一项颠覆性的升级——视觉功能。这意味着,用户现在可以通过手机摄像头或屏幕共享,向AI提问周围环境的细节。例如,你可以直接询问AI某个物体是什么,或者获取周围环境的信息,而无需手动描述场景或上传照片。

这一更新让AI的交互方式更加自然,也使得用户在进行复杂任务时能够更加直观和便捷地与AI互动。

第七天:12月13日,推出 Projects 功能

在第七天,OpenAI推出了 Projects功能,这一功能旨在帮助用户更高效地管理和分类自己的聊天记录及上传文档。无论是工作项目、学习资料,还是日常记录,Projects 可以让用户按照不同主题进行整理,使得信息查找更加便捷,提升了工作和生活中的生产力。

第八天:12月16日,ChatGPT 搜索正式向所有人开放

在第八天的发布中,OpenAI宣布, ChatGPT的搜索功能 现在对所有用户开放,无论是免费用户还是付费用户,都可以通过这个功能获取实时的互联网搜索结果。AI会实时抓取网页信息,并以对话的形式直接回答问题,让信息获取变得更加快捷高效。

但需要注意的是,这一功能仍然存在一定误差,用户在使用时需要具备一定的判断力,尤其是当答案影响到重要决策时。

第九天:12月17日,o1模型API 完全开放

12月17日,OpenAI宣布,部分开发者现在可以通过 API接口 访问 o1推理模型。此外,OpenAI还发布了一些新工具,例如 偏好微调 技术,允许开发者根据自己的需求进行AI模型的深度定制。

第十天:12月18日,推出1-800-ChatGPT 热线

12月18日,OpenAI推出了 1-800-ChatGPT 热线。这项新服务让用户即使没有互联网连接,也可以通过拨打电话直接使用ChatGPT。每个月提供15分钟的免费通话时间,为没有智能设备或互联网连接的用户提供便捷的AI服务。

第十一天:12月19日,ChatGPT MacOS版增强应用兼容性

12月19日,OpenAI发布了 ChatGPT MacOS版,这款桌面应用支持与更多编码和文本处理工具的协作,极大提高了用户的工作效率。它支持与多款流行的编码工具和文本编辑工具的无缝集成,包括 BBEdit、MatLab、Android Studio 等,同时还引入了高级语音模式。

第十二天:12月20日,预告 o3 和 o3-mini 推理模型

在“OpenAI 12天”活动的最后一天,OpenAI发布了其全新推出的 o3系列模型,包括标准版的 o3 和精简版的 o3 mini。虽然目前o3模型还未对外公开,但OpenAI透露,o3在多个基准测试中已远超其前代模型o1。例如,在 AIME 2024(数学竞赛基准测试)和 GPQA(博士级科学测试,涵盖生物学、物理学和化学)中,o3展示了出色的问题解决能力。它还在 ARC-AGI 基准测试中取得了创纪录的成绩,进一步证明了o3朝着 AGI(通用人工智能) 方向发展的潜力。尽管如此,OpenAI强调,o3距离完全实现AGI仍有一定的距离。

o3 mini 作为o3系列的精简版,提供了三个不同的推理模式:低、中、高三个等级,性能与计算需求相对应。在低推理模式下,o3 mini的表现与 o1 mini 相当,而在中、高推理模式下,其性能明显超越o1,并在一些特定的基准测试中表现优异,例如 Codeforces 竞赛的代码编写任务。

为了确保o3模型的安全性,OpenAI不仅在内部进行了严格的测试,还首次允许外部安全研究人员参与到模型的安全性评估中。感兴趣的研究人员可以通过OpenAI的官网申请访问权限,申请通道将开放至2024年1月10日。

在发布会的最后,OpenAI CEO Sam Altman 宣布,o3 mini将于1月底正式推出,而完整版本的o3将在随后上线。此外,OpenAI还介绍了一项新的训练方法——审议性协调(Reflective Coordination)。这种新方法通过教授语言模型(LLM)人类编写的安全性规范,模型在回答问题时会先根据这些规范进行推理,从而提高模型的安全性和可解释性。

总的来说,o3系列的发布不仅在性能上带来了显著提升,也表明了OpenAI在追求技术突破的同时,注重提升AI的安全性和可控性。此次发布的o3系列为未来的AI技术树立了更高的标准,也为实现AGI目标提供了新的动力。


总结:这12天的发布会让我们见证了OpenAI从o1的强大功能到GPT-o3的震撼登场,OpenAI在AI领域的创新脚步从未停歇。虽然有些产品还处于优化阶段,但它们无疑为未来的AI应用铺平了道路。正如OpenAI科学家Noam Brown所说,“2024年是实验年,而2025年才是全速前进的一年。”可以预见,OpenAI的AI技术将在未来几年继续引领潮流,带给我们更多惊喜。