文心一言初体验：让这颗“子弹”再飞一会

千呼万唤始出来，文心一言终于正式发布。

3月16日，背负着整个国内科技圈子的期待，百度的压力不小。李彦宏也相当少有地亲自走上舞台，在聚光灯下聊起了产品，和百度的初心。

为什么是今天？

“最近一段时间，很多朋友问我：‘为什么是今天，你们真的ready了吗？’”

刚一开场，李彦宏就直面这个最受人关注的问题——讲到这里，如常穿着白色衬衣的李彦宏目光直视人群，并没盯着提词器，似乎是临时有感而发。

诚然，不过几天前，GPT-4强势登场。前代ChatGPT本就如同一道高墙，令人仰止；GPT-4则是在理解能力上更进一步，又有多模态如虎添翼——珠玉在前，百度的文心一言，将不可避免地被与GPT对标。

对于GPT，李彦宏不仅没有豪气干云的姿态，相反态度都相当保守，话只说七分满。

“不能说我们完全ready了……我自己测试感觉还是有很多不完美的地方。”李彦宏如是说道。

但文心一言的发布，在今天是势在必行。市场上已经有了太多的需求，呼唤着这样一款AI的生产力产品。李彦宏说：

“短短一个月的时间，就有超过650家合作伙伴宣布加入文心一言生态……百度希望和大家一起……让所有人都能够使用最先进的生产力工具，让所有人都能从中受益。”

随后在会上，李彦宏带头展示了文心一言文学创作、商业文案创作、数理推算、中文理解、多模态生成。在视频演示里，文心一言展现出了不错的检索、文本生成、归纳总结和逻辑推理能力，还能完成音频、图像、视频的生成，结合百度在NLP时代积累的知识图谱，甚至让文心一言表演了一段四川话，也算是饶有趣味。

作为一家AI公司，百度有近水楼台的智能云、充裕且体系健全的算力、运行平稳的深度学习框架、一群具有多年AI开发经验的人才，最重要的，还有一个日活数十亿搜索引擎来提供中文的本地化数据——某种程度上，距离大模型的完成形态，具备了大多数的硬条件。

透过文心一言，看整个市场可能的未来，李彦宏表示，一方面，新型的云计算公司，会通过MaaS（模型即服务）的方式，改变云计算行业的游戏规则；

另一方面，在模型重要性急剧上升的环境下，大模型的行业化、客制化就相当重要，有能力做模型精调的公司也会随之崛起；

不仅如此，基于大模型底座的应用开发，也会逐渐成为主流，李彦宏判断，不少新巨头会从中诞生，大模型如同金矿一样，为行业带来的无限可能性，还静静地等待着有人发掘。

“我们相信，人工智能会彻底改变我们今天的每一个行业，”李彦宏说道，“AI的长期价值，对各行各业的颠覆性改变，才刚刚开始。”

文心一言背后有哪些技术支持？

要以文心一言突破行业，百度AI有哪些技术在背后支持？百度CTO王海峰随后上台，对技术问题做了简单的讲解。

王海峰表示，全栈的AI能力，是新一代人工智能产品背后坚实的技术支持。底层有昆仑芯的芯片支持，提供稳定可靠的算力和硬件基础；中间有飞桨产业级深度学习开源开放平台，提供核心框架、开发套件、工具组件等；再上一层，则是与各个场景深度接合的行业模型；最顶层则是产品层，依托AI模型的赋能，在显示的场景中提供各异的服务。

文心一言的技术模块上，一方面，是传统的SFT、RLHF和Prompt；另一方面，则是具有百度特色的知识增强、搜索增强和对话增强。

前三者，对于大模型构建来说，是老生常谈的基础操作；而后三者，则是通过百度长期积累下来的知识图谱、搜索引擎以及NLP对话技术，对大模型范式发展的创新之举。

知识增强，是指使用知识图谱，用更少的参数完成对大模型的高效训练，以实现降本增效；

搜索增强，则是利用了百度有过多年积累的搜索技术，通过语义理解和匹配，完成一个双塔模型，对生成模型进行联合优化，“这样我们可以把检索里面有价值的结果——比如一些精准的信息——带进生成里去，使生成效果更好”；

而对话增强，是依托在百度过去的对话AI——PLATO，以在PLATO上积累的经验，完成AI对语境的记忆，并提升AI的对话规划能力。

测试版发布，文心一言体验如何？

这次发布，百度令不少人诟病的，是李彦宏在谈到文心一言的能力时，并没有实际使用，而是放出了一个演示视频，并且似乎完全没有掩饰的意图，被人评价：就如同歌手假唱，而且连话筒干脆都不拿了。加之李彦宏、王海峰在会上的谨慎态度，不由得更加令人浮想联翩。

有人把这解读为，百度高层自己对文心一言，都没有百分之百的信任。

这样的声音，一定程度上也同样反映了在资本市场上：发布会开始不久，百度在港股的股价就开始急剧下跌，尽管后来有所波动，最终收盘跌幅8.50%。

当然，这并不是百度今日唯一被诟病的地方，差强人意的录播Demo、听上去并不“性感”的技术路径，更别提如同一片阴云笼罩在文心一言上空的GPT-4——文心一言似乎并非在众人的祝福下“出生”，而是从一开始，就被质疑和唱衰所包围。

而在会后，百度就放出了文心一言的邀请内测码，本着“是骡子是马拉出来遛遛”的精神，AI科技评论也加入了测试。测试的队伍一度十分火爆，甚至进入测试页面都有困难。

而在测试之后，AI科技评论发现，李彦宏和王海峰的谨慎不无道理：文心一言的不少能力，目前似乎还并没能达到及格线。

先以数学问题解决作为开始，首先是一则二元一次方程组：

一眼看上去似乎格式似乎还有些工整，但结果却驴唇不对马嘴：文心一言似乎完全无法理解方程组的解法，不仅如此，它还顽固地相信305-150=105。

可能二元一次方程对它来说太难了，第二个问题难度有所降低，是一个一元一次方程：

不必看，结果更是完全错误。

那在发布会上展示的鸡兔同笼问题呢？首先，如同在发布会上的场景类似，AI科技评论特地输入了一条错误的问题：

文心一言扳回一城，完成了发布会上实现过的操作，于是AI科技评论修改了问题：

终于，在鸡兔同笼问题上，文心一言不辱使命，给出了一个正确的答案。

再看看信息检索、归纳总结的能力：

在这个问题的回答下面，文心一言则是展示了两个ChatGPT的“传统艺能”——胡说八道和知错能改。

于是，下面为了“难为”文心一言，AI科技评论又要求他以电影的情节作诗一首：

从诗词创作的角度上，押韵到位，但平仄外行；从电影情节理解的角度上，虽然没有严丝合缝，但也相差不远。

往下，我们又提出了一个问题：

本来以为是个相当简单而常规的问题，文心一言又开始“胡说八道”，《勇敢的心》不仅被“翻译”成了“勇往直前”，故事的情节也被“篡改”成了父亲保护家人的故事；同时，语料“不惜一切代价”的出镜率也相当高，高得堪称离奇。

而在被李彦宏基于极高希望的To B领域，文心一言的分析能力如何？AI科技评论又一次向文心一言抛出了问题：

除了“老龄化会对环境造成影响”这点值得商榷以外，其他方面分析得中规中矩。AI科技评论又跟进问出了一个问题：

经历了之前的几轮问答，这次文心一言给出的答案相当令人信服，甚至让人有些喜出望外——至少在商业和产业领域，文心一言还是显得相当稳重，能提出一些靠谱的观点和建言。

再给文心一言一点时间

测试过后，文心一言最后的一层面纱也被揭露，对于外界再也没了神秘可言。

AI科技评论看到，有网友在社交媒体上直言：这下不用担心AI取代了。下面配的图则是他与文心一言的测试问答。

对比港股昨天在信心低落中惨淡收盘，百度在纳斯达克的股价则是一路走高，截止收盘涨幅5.06%。

昨天为什么相比港股，华尔街对于百度的信心更足？

或许因为：时至今日，文心一言仍然是国内唯一一个，由大厂发布的类ChatGPT产品。

当下，除非客观条件出现重大改变，GPT系列在国内的地位相当尴尬——就算OpenAI把技术做出了花，但在国内如果没有合法地位，对于中国用户和开发者，GPT就只能是可望不可及的“白月光”。

而在这个背景下，文心一言的面前拥有着大量的市场真空。

抛开落地应用，单拼技术强度，这种言论某种程度上有些强词夺理。

在生成式AI的赛道竞逐中，作为最早一批“在雪地上留下脚印”的人，百度给人的态度并不争强斗狠，在技术上要和对手争个你死我活；反而更谦卑、更落地，更在意如何利用现有的技术和产品，让文心一言发挥实际作用，给市场带来更多创造价值的可能。

让文心一言这颗“子弹”再飞一会，这个判断并非基于盲目的乐观和信任，而是看好务实的商业模式下，可能形成的“数据飞轮”。

当下据披露，已有超过650家企业，宣布加入文心一言的生态。本着“先让产品被用起来”的务实思路，有更多人使用，就势必产生更多直接的高质量数据，也就越能让产品实现进化和完善——这样“以用带研”的思路，就是AI工程化相当使用的一种路径。

Quick and dirty，敏捷、“土味十足”，却行之有效。

在商业之路上，相对领先者与追赶者采取不同的发展战略，是理所应当。

作为行业先头的OpenAI，就应当一马当先，以强大的科研实力铸造竞争壁垒，巩固自己的先头地位；

而后进者，如果固执高举高打，技不惊人死不休，反而会错过最好的超车时机。

放下身段，反而能降低阻力，以求得更快速的前进。

“整体而言，这类大语言模型还远未到发展完善的阶段，它们有时候会有很惊艳的表现，但不少场景下，细究起来还有明显的bug，进步空间很大。未来这段时间它一定会飞速发展，日新月异。”李彦宏对文心一言如此展望道。

文心一言初体验：让这颗“子弹”再飞一会

为什么是今天？

文心一言背后有哪些技术支持？

测试版发布，文心一言体验如何？

再给文心一言一点时间

作者信息

文章信息

上一篇

下一篇