大模型的“百模大战”,腾讯终于下场。
从6月19日发布自己的行业大模型,到7月16日召开的世界人工智能大会,腾讯云行业大模型率先登场,越来越清晰的事实背后,凸显着腾讯对于大模型领域的思考。
尤其是跟BAT其他两家的选择不同,腾讯上来首先端出的是行业大模型,而不是通用大模型。这意味着腾讯其实找到了在这个领域放大自身优势的方式。
因为是国内互联网企业最早点出要推动数字融合,推进产业互联网发展的平台,腾讯从一开始接触到大模型,想到的就是如何与产业相结合。
关键,让人意想不到的是,秉持这个逻辑下场,腾讯其实直奔解决大模型研发方一直纠结的一个问题:那就是大模型该如何保证长期可持续发展。
只有做到这一点,任何大模型才能谈得上有未来。
大模型是用来解决问题的
腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生,在世界互联网大会产业发展论坛做主题演讲时表示,通用大模型有很强的能力,但并不能解决很多企业的具体问题。“企业的大模型应用需要综合考虑行业专业性、数据安全、持续迭代和综合成本等因素。基于行业大模型,构建自己的专属模型,也许是企业更优的选项”。
这恰恰说出了当下大模型产业发展的一个现实。
从Open AI发布ChatGPT3.5开始,浮躁成为这个行业的外显标签之一。越来越多的企业开始在这个领域炫技。
高峰时期,美国硅谷每天会产生几十个大模型相关的论文,上百个与大模型相关的创业产品DEMO视频。“每个视频让人看得血脉贲张,我们纷纷表示太酷炫了,但是静下心来,我们对于技术该怎么用一般都没有答案。”大模型知名研究者,计算机工程硕士李莉认为,现在很多模型的研究者和应用的制作者,考虑的是如何让别人记住自己,所以效果特别视觉化。“如果真正放到经济中,你会发现根本用不上。”
在她看来,这已成为行业通病。
同样国内大模型的纷至沓来,相关的事情也没少做。例如让大模型直接作诗或者用方言将相关的内容读出来,甚至做成视频之类,频繁出现在模型研发方发布会的现场。
这其实是一种市场推广行为,但并不意味着大模型真正要在这个方面实现应用。
最近Newsweek有一个商业调查显示,ChatGPT的用户数量已经比一二月份高峰时期下降了近95%。在统计原因中,“感觉ChatGPT对工作的促进能力没有想象那么强”,是用户选择最多的一个结果。
“从技术看这个是一个特别正常的结果”,李莉表示类似ChatGPT这样的通用大模式,其训练数据来自互联网所有能找到的相关数据,无论对错全部输给模型学习,只在输出的时候由人工来核实部分结果并标注结果输出的边界。“因此,通用大模型往往变成那种看起来像专家的答案,但真正被行业内人士分析就发现似是而非。”
在她看来,未来大模型发展最快的肯定不是ChatGpt这类通用模型,“产业模型或者细分行业模型有很大机会,因为只有在专业领域由专业的人员辅助大模型学习专业知识,才能真正为行业提供需要的人工智能辅助”。
对此,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生也表示,通用大模型一般是基于广泛的公开文献与网络信息来训练的,许多专业知识与行业数据积累不足,导致回答的行业针对性与精准度不够。“通用大模型可以在100个场景中,解决70%-80%的问题,但未必能100%满足企业某个场景的需求。”但用户对企业提供的专业服务,要求高、容错性低,企业一旦向公众提供了错误信息,可能引起严重后果。
TO B才是大模型未来发展核心
其实ChatGPT也不是没想过要进入行业应用市场,但在理想与现实之间有了一个巨大的鸿沟。
众所周知,通用大模型是利用互联网知识进行培训的,即所谓通用数据。其中既要花费大量的数据和资金进行训练,可能效果还不是很好;另一方面又要维持日常运营,相关投入也非常大,让一般的通用大模型压力很大。
OpenAI的创始人在接受硅谷媒体的访谈时,也曾就ChatGPT3.5的逻辑和思维展现能力进行过阐述,然而他并不清楚ChatGPT3.5是如何实现这一功能的。事实上,他们在训练ChatGPT的过程中,一直在不断地将微软必应搜索中的结果和用户的对话数据输入其中。
在访谈的最后,他也承认ChatGPT的出现只是一个美丽的误会,但他们所能做的就是不断为这样的大模型提供资源,无论是软件还是硬件都在此列。据观看了这场访谈的李莉了解,OpenAI在短短三年内就已经烧掉了180亿美元,现在又紧急融资了100亿美元。这一事实恰恰印证了这一点。
但由于他们在行业上数据搜集能力不强,造成通用模型对于行业应用适用程度较低,没有想象的好用。
另一方面,自2018年腾讯启动930变革以来,中美互联网技术的发展出现了明显的路线差异。
各家互联网企业以数实融合为开发产品和技术的基本思路,这体现了中国互联网企业在满足制造业和实际生产需求方面更为紧密的联系。
从这一角度来看,中国互联网企业将在推动社会经济发展方面具有更清晰明确的角色。
有趣的是,大模型的成长和训练需要大量数据的支持。ChatGPT和谷歌Bard等领先的模型都是在通用大模型领域进行训练的,它们的背后都有搜索引擎带来的庞大数据支持。然而,尽管这些数据量庞大,但在特定行业的数据量和数据活跃度上,尚未完全满足用户的需求。
这实际上为中国企业提供了弯道超车的机会。中国庞大的人口基数使其在各个行业拥有比美国甚至世界其他国家更丰富的数据积累。无论是医疗、法律、物流还是细分行业的生产。在国家数据安全法的指导下,这些数据天然地与海外大模型隔离,保证了数据安全。
因此,这些B端数据被认为是中国大模型企业的巨大优势。
比如,中国已荣升为全球最大的工业机器人生产国和消费国,全球机器人市场中的75%是由中国的企业所购买。这些购买机器人的企业,通常都将其机器人应用于核心工艺和核心流程中。
这一现象意味着,如果这些企业希望通过引入人工智能模型以提高管理效率,它们就必须部署自己的私有人工智能模型。他们需要通过训练自己生产中的数据,以满足企业的发展需求。
如果能从中国一线企业采集到绝大多数机器人使用的参数和对应的数据,就能以最快的速度帮助这些企业建立和训练属于自己的人工智能模型。
在这一点上,中国企业具有天然的优势。
为什么是腾讯先落子
专属行业大模型,目前国内腾讯是首先落子的领军者之一。
在所有人都开始关注行业大模型的时候,在百度、阿里、科大讯飞等国内大模型开发方都开始转型行业大模型的时候,为什么腾讯能最先发布自己的行业大模型呢?
这可能跟腾讯在国内率先提出互联网平台要跟产业相结合有关。
一方面,这几年腾讯利用互联网技术和AI技术,在实体经济和生产一线做了很多尝试,推动了很多新模式的落地,这已经成为中国数实融合的样板。腾讯在其中积累了很多面对行业企业的服务经验和数据,同时也对行业企业的需求非常清楚,这为其建立行业大模型提供了良好的基础。
另一方面,腾讯专门为行业大模型打造了自己的技术平台。
这里面首先是星脉网络,这是腾讯云正式发布新一代HCC高性能计算集群。该集群采用腾讯云星星海自研服务器,服务器之间采用业界最高的3.2T超高互联带宽,为大模型训练、自动驾驶、科学计算等提供高性能、高带宽和低延迟的集群算力。实测显示,腾讯云新一代集群的算力性能较前代提升高达3倍,是国内性能最强的大模型计算集群。
其次是腾讯云专门为行业大模型打造的AI 原生(AI Native)向量数据库。该数据库能够被广泛应用于大模型的训练、推理和知识库补充等场景,是国内首个从接入层、计算层、到存储层提供全生命周期AI化的向量数据库。
正是有了这样的技术基础,加上腾讯这些年服务行业客户的经验和获得的数据,让腾讯有了率先推出行业大模型的底气。
腾讯云副总裁、腾讯云智能负责人、优图实验室负责人吴运声在人工智能大会期间接受媒体专访时表示,腾讯希望在每个特定场景里面100%解决客户的问题,“而不是找100个产品解决70%到80%的问题”。
在他看来,腾讯会聚焦找一些特定的行业跟客户深入打磨解决行业的问题,“比如说文旅行业跟客户做一些深入探讨,比如说OTA领域的客户在业务流程里面用大模型的技术,结合自身的业务场景,还有数据相关的东西对大模型进行精调,解决他的问题”。
关键,腾讯云从产业客户需求场景出发,基于大模型高性能计算集群,依托腾讯云TI平台打造模型精选商店,为客户提供MaaS一站式服务和“量体裁衣、普惠适用”的行业模型解决方案,全面降低落地门槛,助力客户构建专属大模型及智能应用。
腾讯云TI平台行业精调解决方案,支持客户用自己的数据一站式训练精调,构建自己的专属大模型。具备五大优势:提供高质量的行业大模型、完善的平台工具、成熟的流程服务、全面的配套服务、领先的安全能力保障。
比如腾讯云升级行业大模型应用场景,行业大模型加持的金融风控解决方案,相比之前有了10倍效率提升。腾讯云风控大模型融合了腾讯过去20多年黑灰产对抗经验,和上千个真实业务场景,整体反欺诈效果比传统模式有20%左右的提升。企业可以基于prompt模式,迭代风控能力,从样本收集、模型训练到部署上线,实现全流程零人工参与,建模时间也从2周减少到仅需2天。
再比如过去的同传技术,往往需要大量样本数据进行训练,尤其涉及一些特别专业领域的翻译,也需要人工加持进行调优,才能保障翻译效果。基于行业大模型技术,不再需要百万级的训练数据,使用小样本训练便也可以获得不错的翻译结果,让每一次交互翻译,都对下句的翻译提升发挥实时作用……
换句话说,腾讯既准备好自己的技术基础,又有行业数据知道行业想要什么,还做了一整套帮助企业落地大模型在自身业务应用的产品,形成了一整套推动大模型行业化的能力。
当然,腾讯对行业大模型是持开放态度的,他们觉得大模型是需要多分共同努力的结果。吴运声就表示,大模型时代开放是非常重要的一个特点,“底层的技术变化太快,技术的这些外延的能力会非常广,这种情况下发挥最大的价值只有开放,通过开放提升让更多人加入进来,更多行业的专家,各类的角色人员加入进来,我们才能让这个生态,整个体系更加的健康,产生更多的可能性”。
对此,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生也认为,伴随着大语言模型的发展,产业和社会也将从数字化、网络化,走向智能化。“在这个过程中,腾讯始终认为,人工智能发展的根本目标是落地于产业,服务于人”。
因为,只有能真正解决用户需求、距离场景和数据更近的企业,才能拥有大模型的未来。
文丨BT财经张津京