8月 30 日,由创业邦主办的“2023 AIGC 技术应用大会”在深圳举行。昆仑万维(300418)CEO方汉在大会上发表了主题为《昆仑万维大模型商业化之AI搜索》的演讲。
(资料图)
他认为,随着AIGC浪潮的到来,大模型领域或在近两年诞生出伟大的公司。搜索的下半场是AI,昆仑万维在AI大模型坚实的底座基础上,推出了国内第一款融入大语言模型的搜索引擎。面向C端用户,革新传统搜索体验。大潮将起,落地为王,昆仑万维正在全面拥抱AI浪潮。
以下为方总演讲精华:
前瞻布局天工智能六大AI业务矩阵
我自1994年开始从事互联网工作,是上一波互联网和移动互联网大潮兴起的见证者,目测也将是未来这一波AI大潮兴起的见证者。
众所周知,第一波最伟大的互联网公司诞生于1997-2000年,第一波最伟大的移动互联网公司成立于十年前,我坚信这一波AI大模型浪潮中的伟大公司肯定是在这两年诞生。在座的创业者都有机会成就下一个十年最伟大的公司。
昆仑万维作为一家A股上市公司,目前旗下包括AGI与AIGC、海外信息分发与元宇宙、投资等三大业务板块。目前海外收入占比达83%,全球平均的月活用户近4亿,我们是一家典型的以C端为主的出海企业。
作为一家出海企业,昆仑万维为何会投身到大模型的赛道?
首先,我们是一家典型的中型互联网公司,一直在努力地寻找第二曲线,我们在海外孵化了大量的千万DAU级别的产品,从Grindr到StarMaker,从Opera到GX Browser,我们在海外拥有极其丰富的孵化UGC平台的经验。
其次,2020年GPT3发布时我们深刻地认识到GPT3在文本生成领域绝对是当时最领先的产品,所以就立刻组织团队投身于GPT3大模型研发。2021年我们大概拥有200张A100卡,也已经训出了140亿参数的中文大模型。去年12月15日,我们把前期的工作基本都开源了;今年4月17号,我们就正式发布了国产大模型“天工”。8月25日,我们也正式发布了我们的第一个C端产品——天工AI搜索。目前我们天工智能有六大AI业务矩阵。
AI大模型是我们整个AI业务矩阵的基石,在 AI大模型基础上我们面向B端和C端,布局了五大业务板块。AI搜索,它将AI底座大模型与搜索引擎相结合,通过高频应用切入;AI音乐、AI动漫以及AI游戏,是我们给创作者提供端到端的内容生成工具,让用户在没有任何技术背景跟前序专业知识的情况下,都可以使用端到端的生成工具来生成普通用户最终可消费的内容。
AI游戏与AI社交,我们认为它们本质上需要一个智能的NPC作为技术底座。我们都知道游戏无外乎世界观、人物、剧情,人物这一块是重中之重,AI介入之后,我们可以创造出比以前所有策划的NPC更加智能的NPC。这一点我认为与3D引擎一样,必然重塑整个AI游戏领域。
AI社交则是另外一个逻辑。当前绝大多数免费用户是无法在社交产品里享受到应有的服务,因为1V1社交服务的成本相当高。一旦AI介入,我们可以极大地降低社交上的情绪供给成本。我们认为这也是一个极佳的发展方向。
我们“天工”大模型的技术底座非常坚实,目前支持万字以上的文本对话,也能实现20轮以上的问答交互。我们采用双千亿参数的大规模结构,具有智能涌现能力。
我们在大模型的三要素(算力、算法、数据)上有长期并且深厚的积累,以我们开展大模型的经验看,大模型落地最难的是什么?其实是数据。
我们需要把万物以及所有问题转化成大模型可以理解的数据,才能让其具备智能涌现能力。各行各业要落地大模型,本质上是把各行各业的非标数据转成大模型可理解的数据。如果某个行业已经具备了这种数据的话,那么大模型在这个行业的落地就会非常快;如果没有,我们必须花很大的精力去重新整理数据,所以数据的清洗能力以及转换能力非常重要。
用AI重塑传统搜索体验
国内搜索引擎市场份额可能已经有十几年没有发生任何变化,我们为何还要研发AI搜索产品?
就如同AI支持的新闻分发平台今日头条颠覆传统的新闻门户新浪新闻的逻辑一样,AI搜索实际上对于现有的搜索是另外一个维度的产品,我们认为搜索的下半场一定是AI。
首先,传统搜索提供的是海量信息,如果用户没有掌握大量的搜索技巧,比如使用搜索引擎的格式化语言,将无法使用搜索引擎达到个性化目的。
例如,我用传统搜索时会使用到一些独特的技巧,输入的关键词要比一般人多,会用file这个函数来指定文件类型,会用site这个关键词去指定单独的网站进行搜索;我会想方设法把一个关键词用英文翻译成七八个同义词去搜索。
用户如果不会使用这些特殊的搜索技巧,其结果如何?大多数用户用传统搜索得到的信息质量很差,并且广告多、信源复杂、真假难辨。但在ChatGPT出现之后,我们认为传统搜索的技术奇点时刻已经到来。程序员的最大的问答社区Stack Overflow,在ChatGPT出现之后整个流量急速下跌,背后的原因是用户都改去使用ChatGPT了。目前美国90%以上的大中学生使用ChatGPT做作业,而不去谷歌搜索上去搜作业的答案。这就是我们认为传统搜索在很大程度上一定会被 AI搜索所取代的原因。
微软在接入ChatGPT的时候做了一件很重要的事情,就是把AI嵌入它的搜索引擎,给用户提供服务。而我们天工AI搜索是国内第一款融入大语言模型的搜索引擎。
我相信在座的诸位懂得用file、site这样关键词搜索的人非常少,但是当你在使用ChatGPT时,完全可以用任何自然语言甚至语音直接去交互,它一定能够很轻松地告诉用户答案,不需要用户再想方设法的去搜关键词,或者是想方设法把它转换成英文的提问。
天工AI搜索实际上是一种深层次搜索,用户可以获得有效的组织和提炼后的答案,不再为冗余信息浪费个人时间,直接获得有效信息。比如,“笔记本要不要一直插电用?”之类的问题,天工AI搜索会直接给用户一个相对可靠和信服的答案;
针对“电车会比油车省钱吗?”的问题,天工AI搜索也会把所有的答案都搜索出来,并且在总结我们认为靠谱的答案之后会生成一个最终答案。
传统搜索提供的是海量的信息,AI搜索为用户提供的是精准的知识,而且天工AI搜索具有“追问”的功能,让用户可以就一个问题不断地追问20轮以上,例如,在提问“核污水会变核污雨吗?”之后,天工AI搜索除了给出答案,还会提供3个追问,其中包括“核污水的处理跟处置方法有哪些?”,让用户继续获得答案。
如此用户可能在一开始并不知道自己想要什么,但通过这种追问,能够更轻松地获得所需的知识。
此外,天工AI搜索能够为用户提供更个性化的答案。例如,用传统搜索引擎搜“9月份去西双版纳玩4天,规划路线”,一般如果是在网页上去搜索,如果此前没有相关信息沉淀的话,用户无法获得直接、有效的答案,但天工AI搜索可以总结出来个性化答案,假如把9月份换成8月份、7月份、6月份,AI搜索都能给出相应的个性化答案。
我们还实现了追溯、可考证、可信赖,所有答案的信源都有复杂的算法和相对可靠的验证,所有答案每一个重要条目之后都有相应的引用,信源的权重还不一样,这一点有助于用户去索引信源,保证答案可追溯、可考证、可信赖,对于用户而言这一点非常有价值。
天工AI搜索还实现了可查阅回溯以及可分享的功能。我们把用户的每轮次的搜索结果都保存在天工的应用内,便于随时查阅回溯,还可以一键分享给他人。
这是我们天工大模型在国内第一个面向C端的商业化产品,而我们的AI音乐和AI游戏、AI动漫的产品也在海外市场测试中,应该在今年和明年初都会逐步推出。
大潮将起,落地为王。对于所有创业者而言,我个人认为最难的不是构想出一个新的产品模式,或者研发出一个独一无二的技术,而是寻找到一个合适的市场切入点让公司更加健康的活下去,也就是所谓的“落地为王”。
最后,祝愿所有的创业者十年后都能做出一家伟大的公司。