界面新闻记者 | 崔鹏
界面新闻编辑 | 文姝琪
一年前的百度世界大会,李彦宏在现场「手把手」教用户做AI原生应用,号召行业不要继续卷大模型,而是将精力投入到应用开发上。
但在过去的十二个月时间里,大家期待的超级应用并没有出现。反而有越来越多的人开始讨论,这轮全球性的大模型狂热到底是一场新的技术革命,还是新一轮泡沫。
李彦宏显然是听到了这些质疑声,11月12日,他在百度世界大会上说:「作为中国人工智能的扛旗者,我想我们有资格回答这个问题。」
他给出了文心大模型的最新调用数据,目前文心大模型日均调用量已经超过15亿,在不到半年时间里增长至7.5倍。
在6月份这个数据刚到2亿时,李彦宏曾经和百度高管们讨论,大模型的未来「怎么叫成了」,当时的结论是 这个 调用量 能在 一年内涨10倍。
而如今半年过去,百度已经接近这个增幅,李彦宏认为这说明用户真的需要大模型,从业者完全可以对此放心。
为了 将 开发者 加入自家大模型生态的 门槛 降到 最低 , 百度 宣布 将 在 明年 1 月 推出 多智能体 协作 工具 「 秒哒 」 , 李彦宏 声称 , 这款产品可以让完全 不懂代码的人 也能 开发出 一款 应用 产品 。
「我们将迎来一个 前所未有的 , 只靠想法就能赚钱的 时代 」 , 李彦宏 在 舞台 中央 做出了 他的 大胆预测 。
消除幻觉是首要前提
百度想要 说服开发者们都 来 基于文心大模型做应用,消除幻觉是首要前提。
「如果大模型总是一本正经的胡说八道,就不会有人信你,也不会有应用,就不是智能而是智障」,李彦宏表示,过去24个月大模型行业最大的变化是基本消除了幻觉。
在他看来,大模型作为一个概率模型,生成的内容本就具有不确定性,在采用RAG(检索增强手段, Retrieval-augmented Generation)技术后,极大提高了大模型的内容质量和准确性。
今年头部大模型厂商的竞争阵地都在从文生文转向文生图和文生视频领域,最知名的产品无疑是OpenAI发布的文生视频工具Sora,它也带动了国内一大批公司向多模态领域发力,并且向OpenAI进行对标。
李彦宏对此尤为自信,他说「在整个中文互联网都为Sora顿足捶胸的时候,我们决定去解决图像生成的幻觉问题,不解决它就不会有应用。」
百度推出的这项文生图新技术,被称为iRAG(检索增强的文生图技术,image based RAG)。
它的基本原理是,将百度搜索的图片资源库跟百度的基础魔性能力结合,用来生成「机器味儿」比较少的图片,官方称其效果远远超过文生图的原生系统。
李彦宏说,目前市面上基于大语言模型的文生图系统,生成的图片通常是「一眼假」,甚至毫无逻辑,而iRAG没有幻觉、超真实且成本低,对于企业客户来说商业价值很高。
从现场展示的大众汽车与百度的合作案例看,用AI生成海报图片,成本能从传统的几十万元一组,降低到接近于0,并且生成的车型与大众现实中的车型保持一致。
这项技术的潜在应用场景目前主要集中在影视作品、动漫作品和海报制作等领域。
AI到哪里去:智能体和产业应用
在过去一年中,李彦宏在内部和外部的多次讲话中,都在强调智能体的重要性,称全球范围内像百度这样把智能体作为重要战略方向的科技公司并不多。
在今天的百度世界大会上,他对这种观点进行了补充解释。
李彦宏认为,智能体将变成AI原生时代内容、信息和服务的新载体,在AI时代做智能体,就像在PC时代做网站,以及在移动时代做自媒体账号,不同之处在于智能体更像一个真人。
一方面 , 做 它 的 门槛足够低,李彦宏甚至认为谁都能上手做 智能体 。在百度文心智能体平台上,已经有11岁的小学生在制作智能体,并成功通过搜索等渠道实现了分发。
另一方面,智能体的天花板又非常高,足以支持开发者做出功能非常强大的应用。尤其是多智能体的协作,能解决更加复杂的问题。
李彦宏在 现场 主要展示了四类智能体的 应用 :公司类智能体、角色类智能体、工具类智能体和行业类智能体。
公司类智能体主要取代传统官网的功能,提供公司介绍、产品图片和一对一服务等能力;角色类智能体主要指数字人(基于大模型)产品,应用于直播、咨询和教育等领域;工具类智能体目前更多集中在写作助手和设计助手等工具层面;行业类智能体主要针对法律、医疗健康、金融和旅行等垂直领域。
从分类上看,李彦宏为百度描绘的智能体应用场景基本都是现实需求比较多的领域,但关键在于如何说服开发者参与进来,并给与他们足够的回报。
在 产业 应用 层面 ,目前百度的客户主要集中在金融、能源、教育和公共服务领域 。 在百度智能云的千帆大模型平台上,累计有3.3万个精调大模型以及77万个企业级应用。
在 行业案例 介绍中 , 百度 拿出的 是 与 百胜中国 的 合作 案例 。 双方的 合作范围 从 门店选址 、 智能客服 再到 内部大模型 服务 产品 都有所 涉及 , 百度 也 提供 了 千帆平台 和 基础 算力服务 给 百胜 , 未来 两家 公司 还将 严重 在 点餐屏上 用 大模型 点餐 的 技术 可行性 。
毫无疑问 , 百胜中国 这种 知名 品牌 是 百度 推广 自家 大模型 服务 急需 的 标杆 客户 。 在 今年的 世界大会上 , 大众汽车 、 比亚迪 、 百胜中国和智联招聘 等头部公司 的 案例 被李彦宏重点介绍 , 百度 明显 希望 用它们 来 吸引 更多 中小 开发者 , 一同 加入 百度 的 大模型 生态 。
为此 ,百度还搞起了官方推荐的策略,专门 发布了 一个 」产业应用 T O P 1 0 0 「 的 榜单 , 向 外界 推荐 这些 基于 文心大模型 开发的 优质 行业应用 。
李彦宏说 , 百度 并不是要 推出 一个 「 超级 应用 」 , 而是 想要 让 更多 企业 打造出 百万 「 超级 有用 」 的 应用 。
秒哒想要淘汰程序员 ?
无论是 推广智能体 还是 行业应用 , 降低门槛 都是 百度 急需 解决 的 问题 。
李彦宏 在 现场 模仿 苹果 公司 , 也推出了 一个 「 O ne M o r e T h i n g 」 产品 , 也就是 「 秒哒 」 。 在 官方 定位中 , 这是 一款 不需要 写 代码 就能 做出 应用 的 软件 , 由 基础大模型 和 智能体 组成 。
「 它是 迄今为止 人类历史上 最复杂的 多智能体 协作工具 」 , 李彦宏说 , 这款产品 能让 一个 完全不懂 代码 的 人 , 具备 程序员的 能力 , 将 任何 想法 都 快速 低成本 变为 应用 产品 。
虽然 并没有 多少 同行 在做 这类产品 , 让 这个 「 人类 之最 」 有些 定语过多 , 但 百度在这个产品上的尝试 思路 非常明确 。
当 一个 普通 用户 对它 提出 需求 后 , 秒哒 的 0 号 智能体 会 分析 指令 并 下达 调度 规划 , 将 任务 拆分成 需求 确定 、 内容生产 和 工程开发 三个 步骤 , 并 召唤 多个 智能体 来 协作 完成 全部开发任务 , 并最终 输出 用户 需要的 应用 产品 。
在 现场演示中 , 一个 发布会的 邀请系统 从 用户 发出 需求 到 产品 开发结束 , 全程 只需要 3 分钟 , 而 用户 不需要 写 任何一行代码 。
李彦宏 表示 , 秒哒 具备无代码编程 、 多智能体协作 和 多工具调用的优势 , 用户 借助于 自然语言 交互 , 就能 完成 一整套 系统 搭建 。
这款产品 在 现场演示中 引发了 很多 参会 者 的 明显 兴趣 , 界面新闻 遇到 的 几位 企业开发者 都想 知道 它 的 能力 范围 有多大 ,是不是真的能取代普通程序员, 可惜 现场 并未 进行 过多 详细的 展示 。
秒哒将于明年 1 月正式发布 , 李彦宏 称 随着 基础模型 能力 的 提升 , 秒哒 将 能够 做 更复杂的 事情 , 未来 企业 可能不需要招聘 项目经理 、 设计人员 、开发人员 和 测试人员 , 就能 独立 指挥 多个 智能体 来 协同 开发 应用 。