本文来自微信公众号 “陆玖商业评论”,作者: 胡家铭,纷传经授权发布。
2023年10月17日,首钢园,北京。
数十年前,这里是共和国钢铁工业的心脏之一,无数经济建设的关键原材料从这里走向全国。到了21世纪的今天,工厂园区的外貌大体没变。但走进“厂房”内部就能知道,这里已经变成了奥运场馆、购物中心与文化休闲的胜地。
虽然所处行业迥异,百度现在的走向却与首钢园有着异曲同工之妙。
其中的一条“明线”是,从十年前就开始的AI大潮,终于在近两年涌现大模型的阶段性成果——在此基础之上,百度在不到半年的时间内首次推出自己的通用大模型文心一言。不到半年,即面向全社会免费开放使用。
截至目前,开放一个半月的文心一言已经拥有4500万的用户与5.4万开发者,这是支持文心一言在4300个场景真正落地的基础,同样也是文心一言不断迭代的后盾。
藏在文心一言背后的“暗线”,则是它的开发者,以及最大的使用者——百度,通过文心一言的通用模型能力,把旗下拥有十多年历史的互联网元老产品,如百度文库、网盘进行“AI重构”,使其从简单的存储、收录工具变为真正意义的生产力工具。
用李彦宏自己的话来说,AI原生应用的诞生,得益于大模型的理解、生成、逻辑和记忆四大核心能力,百度的AI原生应用也是基于文心一言来开发的,“这些能力是过去的时代所不具备的,因而才能打开无限的创新空间”。
01
AI应用,从工具到“人”
百度在模型层的迭代是迅速的,根据CTO王海峰的最新分享,世界大会发布的文心一言4.0,相比此前的3.5版本,逻辑的提升幅度达到理解的近3倍,记忆的提升幅度也达到了理解的2倍多。
模型能力提升的直接效果,不仅仅是更好理解用户的prompt,与人类判断与选择对齐,而且训练算法的效率得到了进一步加强。
单看数据,自9月小流量上线文心大模型4.0,一个月以来的模型能力提升已经达到30%,训练算法效率自3月以来已累计提升3.6倍,周均的训练有效率超过98%。
在世界大会现场,李彦宏即兴输入的一段prompt显然更具说服力:“我想回承德买房,能用公积金贷款吗,手续怎么办?我在北京工作。”
尽管这个问题对于买房人的身份信息和其他条件并没有给出太大设定,但从文心一言的给出的结果上看,其是按照“一名河北承德户籍的用户,能不能用北京的公积金,在承德贷款购房”的理解,给出了对应的回答和办理步骤。
这种极具生活现实意义的逻辑,在政务、客服、营销等办事服务领域,都有相当广阔的应用前景。更直白一点,如果沟通场景放在纯线上文字窗口或者电话沟通,如果回复问题更加口语化,以文心一言目前的水平,普通用户会很难辨别这种回答到底来自真人或者AI。
这也给了生成式的AI大模型更温情的一面:在充分理解用户以语言呈现的需求之后,它将会如同真人一样,给予用户陪伴和必要的帮助。
在下午的“AI原生应用前沿论坛”,文心一言相关负责人分享的案例同样也是如此:在文心一言面向社会开放之后,其中一个用户在不到24小时的时间里,与文心一言互动275轮。百度找到这名用户之后发现,这是一位年过花甲并且半月板有严重损伤的孤寡老人。
这位老人一开始,只是使用文心一言咨询半月板的各种问题,譬如半月板怎么保养、能不能骑车、多久恢复。但随着沟通的逐渐深入,这位老人已经把文心一言当作自己的陪伴者,一位知心的朋友。
要知道,这位老人在事前并没有了解过“如何正确使用prompt”,他只是不断问文心一言,不断与文心一言进行多轮对话。并最终让文心一言更加理解自己。儿女不在身边的时光,文心一言在某种程度上已经不再是一个工具,而是能陪伴和理解用户心中所想的“知心姐姐”。这比现时的商业利益,意义显然更大。
02
起于搜索,生成万物
那么如何去定义AI原生?一位行业人士向陆玖商业评论给出了自己的看法:原先承担各种功能的APP全员中台化,前台只留一个对话窗口,用户只需自然语言,就能一一满足自己的各项需求。
而要实现这样的功能,在前端“做减法”虽然必要,但并不关键。更重要的则是在已有的基础上,将底层大模型的理解、生成、逻辑、记忆能力进行持续强化,使其更理解用户通过自然语言发出的prompt指令,并生成符合需求的答案。
在大模型具备了对应的理解与生成能力之后,用它来重构百度此前的各条产品线,也就成为可能,搜索成为最先试炼的业务板块。对于大会上发布会的百度新搜索,李彦宏也给出了极致满足、推荐激发、多轮交互这样三个定义。
用户提出单一问题之后,新搜索引擎不仅会告诉文字版回答,还会通过视频、图表等形式,展现多个维度的有效答案。譬如搜索“过去20年各国工业增加值排名”,它不仅能根据已有资料生成文字版回答,还能通过数据图表的形式呈现各国工业值增加的具体数据。
但事实上,用户所提出的需求通常比较复杂,一次性的文字描述或者图表也很难满足。此时就需要通过多轮对话的形式,靠用户使用更精准的prompt不断去激发新搜索的底层模型能力,进而获得想要的答案。
这也正是李彦宏在演讲中所提及的:“生成式AI与搜索是天作之合。”同样是一个搜索框,但通过大模型的逻辑推理能力,无论是搜索结果的质量,还是搜索所能覆盖的应用范围,产品边界都通过大模型得以急剧扩大。
此外,百度已经推出了基于新搜索逻辑的产品——简单搜索app,这是百度搜索推出的首个AI互动式搜索引擎。经过彻底的“减法”,它只剩下一个简单搜索框,但用户能通过前述的各种方式,得到AI基于海量互联网资料生成的各类答案。
另一个案例来自百度文库。自成立以来,百度文库收录了超过12亿份的文档资源和4亿份以上的学习资料。但在大多数时间里,它扮演的角色更多是资料管理员,并不能基于资料“多做文章。”
但经过大模型重构后的新文库,某种意义上已经可以为文字工作者“打下手”——如果用户想用新文库撰写一篇学术演讲稿,可以先勾选权威文章以保证内容准确,文库通过理解,生成一篇结构完整段落清晰的文章。
而在亿级文档保有量的前提下,原先大模型“一本正经地胡说八道”问题,可以很大程度上进行规避——在极端情况下,用户甚至可以自己上传认可的文档资料,再通过这些文档生成对应的文字初稿,经过文库的初步润色,用户大部分的工作重心,就能放在后期的编辑与调校上。
新文库的功能远不止于此,如果与用户收藏资料进一步结合,生成一份精美的PPT同样也是没有任何问题的,甚至基于大模型能力,文库还能针对观众可能的问题,提前准备QA。
李彦宏进一步表示,新文库的生成能力,尤其是PPT的生成能力,已经远超市场上任何其他工具,不论国外还是国内。过去,人们来文库是为了找现成的内容。今后,人们可以随心所欲地来文库生产内容,效率高于任何其他生产力工具。
文库与搜索,同样也只是百度基于大模型重构的两个产品样本。虽然到目前为止,它们还没能实现彻底的中台化,但随着生成式AI能力的逐步加强,百度各个功能的产品集成于一处,通过一个互动窗口生成万物,已经不再遥远。
03
大模型“辅驾”产业应用开花结果
坦白讲,国内外大模型“飞奔”一年来,时至今日,这两方面能力仍需不断进化。
一来,就目前整体的体验反馈来说,产出结果的准确度和精度还不高,有时候即便是逻辑通畅,但也会出现说“正确的废话”的情况,在复杂应用场景中,恐怕还不能完全达到市场的真实需求。
二来,从技术迭代角度上讲,大模型的成长也不是一蹴而就的,而是需要大量个人、企业和产业端数据不断进行“哺育”的,同时还要以充沛的算力作为保障,这需要决心扎根于此的企业,拥有更强的信念和耐力。
而这正是百度文心大模型一直致力于解决的问题。今天,文心大模型已走向4.0版本,李彦宏也从学习能力和产业应用两方面,向现场及屏幕前的观众展示了该版本的特点——
一方面体现在知识增强上,文心大模型从大规模知识图谱和海量无结构数据中学习,学习效率更高、效果更好,具有良好的可解释性;
另一方面体现在产业级应用上,文心大模型的技术源于产业并且致力于推动产业智能化升级,建设更适配场景需求的大模型体系,提供全流程支持应用落地的工具和方法,营造激发创新的开放生态。
得益于上述两大特点,文心大模型通用性好、泛化性强,作为人工智能“基础设施”的一部分,进一步拓宽了人工智能技术落地的场景覆盖广度,更加深了产业应用的深度。
仅以全球首个一站式企业级大模型生产平台“千帆”为例。作为目前国内最大、最开放的大模型开发平台,千帆已有42个主流大模型的入驻,同时还接纳了17000家企业在这里开发产业模型和解决方案,覆盖了众多行业的近500个场景。
只不过,对于百度的科技创新及应用生态来说,又何止“千帆”一个。
无论是出现在此次世界大会上的新搜索、新网盘、新地图、新输入法等一系列C端应用,还是千帆、GBI、灵境矩阵等一些B端应用,百度想要做的,就是将自己的科技之力,真正转化为生态内外的“生产力”。
面对广阔的AI原生应用市场,李彦宏如此期待,“中国有丰富的应用场景,中国用户又天然愿意拥抱新技术,有了先进的基础大模型,我们就能构建起一个繁荣的AI生态,共同创造新一轮经济增长。”
在比拼科技生产力的时代中,基于AI的新基础建设已整体落成,接下来,就到了AI原生应用的扬帆时刻。眺望未来,大模型嵌入产业场景、优化产业应用的旅程,正待济沧海。
本文由作者授权纷传发布,建圈子、做付费社群用纷传。