人工智能AI领域,大模型热会洗牌吗?


大模型技术在近年来成为了人工智能领域的热点,它被视为全球科技竞争的新高地、未来产业的新赛道、经济发展的新引擎。
我国政府高度重视人工智能的发展,发布多项支持政策,推动AI大模型产业的持续发展。
AI大模型按照部署方式主要分为云侧大模型和端侧大模型两类。
云侧大模型分为通用大模型和行业大模型;端侧大模型主要有手机大模型、PC大模型。多家科技厂商推出的AI大模型已在金融、医疗、政务等领域取得显著成果。
大模型热促进了芯片行业的发展,大模型也被认为可能是第四次AI革命的“导火索”,推动AGI时代的到来。
大模型的应用场景包括内容生成、文本摘要、图片生成等,对个人生活、企业运营、社会发展可能带来影响和革新。
当下,大模型处于火热阶段,百家争鸣,未来,是否会面临重新洗牌的可能?这一问题在知乎网站上引发讨论。

零一万物 CEO、创新工场董事长李开复就“由 GPT 引发的这波「大模型热」将会如何洗牌?”这一问题结合零一万物大模型进行回复,领域相关专业人士傅聪等回复互动,本文整理相关高赞回复,以供讨论思考。


未来不应该是怎样


想象一下,未来每个人都能拥有一个IQ超过300的智能助理,Ta知道你是谁、你想要什么,并且会精准地给到你想要的信息,并作为你的私人助理与你一起执行任务。
这无疑会为人类社会各个领域带来新变革。
很显然,大模型是这场技术革命的先导,也是新一轮产业变革的催化剂。
2022 年底,GPT-3.5 在 MMLU 上的准确率还仅仅在七成左右,但是不到两年的时间,OpenAI 便在 Scaling Law 的加持下相继推出 GPT-4、GPT-4o、OpenAI o1——OpenAI o1 在 MMLU 的准确率已经逼近了100%。
技术的迭代如此之快。
尤其是 OpenAI o1 为 Scaling Law 带来新探索方向的当下,如果一个人说自己能够百分之百预测未来的 AI 走向,这毫无疑问是过于自大了。
关于“未来会如何发展”这个问题,确实很难给出确切的答案。
不过,我想我们可以聊聊“未来不应该是怎样”
Scaling Law 的持续影响下,无论是硅谷还是国内,大模型赛道正在掀起一场 AI Infra 的“军备竞赛”。
OpenAI 与微软合作打造 AI 数据中心;由 xAI 也在和英伟达合力打造训练集群。
放眼国内,GPU更是一度价格疯涨,“一卡难求”。
这是一场由 OpenAI、xAI、Google、Meta 等硅谷巨头引发的巨大赌局。
以巨额计算资源为赌注,去赌 Scaling Law 的收益递减未来能够得到解决。
这里我们暂且不论 Scaling Law 是否是通往 AGI 的正确路线,现在已经发生的事实是,这一竞争格局引导着大量资金流入芯片和数据建设等领域。
然而,这是一个健康的科技创新生态吗?
我们不妨把生成式 AI 生态看成一个金字塔结构,从下到上分别是芯片、AI Infra 、应用。
梳理近代几波技术革命,从 PC 时代到移动互联网,我们可以看到,在创新生态中,只有当最终应用爆发,取得更多收入时,才能形成健康的良性循环——应用吸引用户(客户),推动基础设施改进,随后基础设施的改进支撑应用不断迭代,吸引更多用户(客户)加入,促使良性循环的产生。
直观地说,这个金字塔应该是“倒三角”。
然而,当前的大模型生成式 AI 生态系统中,过多资金和利润被芯片层和 AI Infra 层分去了,特别是芯片层吸引并创造了巨大的市场价值,而大模型的应用层不论中外都还在持续地探索验证。
如今的生成式 AI 生态更像是单纯追求 AGI ,真正能提高企业和个人生产力的应用层只是一个“副产品”。
这显然是不合理的。
追求 AGI 与让模型能力落地并不矛盾,甚至应该说是相辅相成的。
从行业角度来看,只有应用层的繁荣才能引导整个生态走向良性循环;从公司自身的角度来看,成功的应用能够带来稳定的经营现金流,成为支撑 AGI 探索的商业基础。
这就决定了,大模型公司本身不仅要关注基座模型的性能,不仅要关注算力储备,更重要的是 Make AI Work,让模型能力能够真正落地,形成 ToB/ToC 应用,产生商业价值。
那么,如何才能在模型、AI Infra 与应用之间把握平衡呢?
我想,在这里我们可以尝试回看苹果的发展历程。
在 iPhone 推出的时候,很多底层技术都已经存在了,但是为什么诺基亚、黑莓都没能做出 iPhone?就是因为乔布斯看到了未来,苹果一家就把软件、触屏等等技术全部垂直整合在了一起。
从 IOS 1 到 IOS 17,从 iPhone、iTunes 再到 iPad,苹果最终构建起了一个伟大的生态系统。
但是不要忘记它的第一步不是在“坐等风来”,而是做了 “垂直整合”。
从成立的第一天起,零一万物就是模型、AI Infra、应用三端同步启用,构筑自身的垂直整合能力。 
垂直整合的优势就在于,基于模型、 AI Infra、应用等多方面的能力,零一万物无需等待其他环节准备就绪,就可以基于国际一流模型构建出优秀的应用,并且迅速推向市场。
这种“多位一体”的垂直整合能力还会让应用速度更快、性能更优、成本更低。ToC 方面的应用矩阵探索,零一万物自成立开始就在不断推进。
之前我曾讲过,做大模型时代 ToC 应用的一个堵点在于人才,找到一个既懂大模型又懂产品的 PM 很难;模型能力在 ToB 方面的落地同样如此,模型能力与行业 Know-how 缺一不可。
我们都知道,大模型的泛化性使得 AI 2.0 的大模型公司能够一定程度上摆脱 AI 1.0 时代面向特定场景、采用特定算法、解决特定问题”的交付窘境,但是面对复杂应用场景时,只靠裸模是无法满足客户需求的,相关的工具链条和训模方法论必不可少。
定制模型需要结合企业数据做继续训练的,但是大部分企业内部的数据是不能直接拿来训练模型的,需要经过复杂的数据处理工作,好在我们有自研向量数据库可以进行高效的数据索引,有成熟的数据处理、配比等管线来支持模型的继续训练。
与此同时,零一万物在 ToC 与 ToB 两个方向上所积累的交付能力已经实现了内部打通。
如在海外已经取得阶段性成果的 ToC 产品的能力,就可以丝滑复用到企业端专业产品矩阵里。
目前已经与我们达成合作的企业客户中,不乏世界 500 强企业。
近期,我们还会正式对外公布 Yi 系列新的旗舰模型,它采用了创新的 MoE 架构,模型性能更上一层楼,推理成本却逼近行业最低。
后续它会上线我们的 Yi 大模型开放平台,也会接入我们的数字人方案和全行业 ToB 解决方案中。
在这款新模型的加持下,零一万物会在“Make AI Work”之路上走得更快、走得更远,让千行百业用得上 AI。
通过这些努力,我们希望能够将生成式 AI 当前的“三角形”生态转正,由半导体行业分得的利润应当回归到应用层,让整个行业生态回归到健康的良性循环。
未来,当你告诉 AI,我妻子的生日快到了,它不仅能帮你选出附近最好的花店、蛋糕店,甚至可能十分贴心地直接帮你准备好了鲜花、蛋糕和生日礼物。
到那时,我们将会更加接近 AGI 的目标,原本只存在于科幻小说中的智能机器人也将真正融入并直接影响我们的生活。

大模型还未普及


说到“洗牌”,计算机科学领域的专业人士,算法专家傅聪有自己的看法。

洗牌,这个词可能只适用于行业内部,很难影响到行业外的更广的领域和更泛的行业。

如果连“影响”都没有办法做到,那么何来的“洗牌”呢?

我甚至想大胆一点预测,“大模型热”,并未普及,也未到来,更未“洗牌”。

理由如下:

1、大模型技术,还没有打造出一个具有广泛使用价值的产品。

2、大模型技术,在个人和企业中普及率并不高。

3、大模型技术,也许是一个“超前时代”的技术。

4、大量历史经验表明,某一种增量式的技术创新,并不能带来“洗牌”。

下面展开讲一讲这4个理由:

理由一:能够“洗牌”整个行业的技术产品,具有广泛使用价值。

历史上最鲜明的那几个例子都写进了小初高的课本,比如瓦特发明蒸汽机,预示着人类进入蒸汽时代,别说行业洗牌,世界格局都被直接洗牌了,大国之间的实力很快拉大,满清也是在那个时期开始落后于欧美。

像蒸汽机、发电机,这类技术产品的特点是什么呢?就是哪里需要,就可以往哪里搬,火车需要了那就是蒸汽火车,煤气灯换了电就变成电灯,得益于此类技术,大量的行业,大量的产品升级换代,生产效率指数级提升。

就拿最近的一次——第三次工业革命,信息革命来说,计算机和互联网的出现,小到每一个普通人的社交通讯、休闲娱乐方式,再到每一个企业都在用的各种财务系统、员工管理系统,大到一个国家的国防军事的卫星导弹、航空航天等等,可以说是彻彻底底的改变了人类社会的方方面面。

反观大模型,GPT确实是一个非常耀眼的明星产品。

但是,它也仅仅不过是一个在第三次技术革命时期里出现的一个里程碑产品。

此类技术有一个共同的特点,就是在没有底层基础学科的重大突破的前提下,在这个范畴内进行的任何新技术创新,它们带来的生产力增益正在边际递减,从之前的可以替换掉成倍的提高生产效率,到现在的可能只能优化百分之几十甚至于百分之几。

理由二:大模型技术,在个人和企业中普及率并不高。

GPT可以应用到各行各业吗?GPT可以对各行各业产生正向化的效果吗?有多少人在使用GPT呢?GPT在使用时可以替代多少劳动?可以优化多少流程?不使用GPT的人是否出现了被替代的倾向呢?

GPT目前还只是一个具备有限推理能力、庞大知识储量的数据库,只不过它的“交互界面”部分,让它看起来更像是一个拥有智慧的工作助手。

从现阶段来看,GPT的角色,就类似于一个“机器版的”、“人人可使用的”廉价版小助理,让“私人助理”从大公司的老板,普及到了每个打工人。

但是,这位“智能小助理”有多给力呢?可以完全替代人类助理吗?可以自主查资料翻译文件吗?可以出席会议、接待客户、布置会议室吗?

不可以!!!

因为根深蒂固的幻觉让GPT可以处理的问题的边界被牢牢限制住(也就是表现为泛化能力差)。

因此想要替代一个人类助理的功能,远远不够。

从直观的数据来看,在今年6月,牛津大学和路透社研究所的一项研究调查显示,在英国、美国、法国、日本等国家中,日本只有 1% 的人每天使用 ChatGPT,法国和英国为 2%,美国为 7%。

注意,我在这里说的是“替代”,而不是“修修补补”,各种引导性的聊天之后,勉勉强强完成的工作。

这是一个很现实的问题,GPT这类产品的幻觉问题,以及推理成本问题,在现阶段仍然限制了它的应用场景。

即便已经有部分企业愿意为GPT付费,但因为GPT的使用,而出现的对应岗位的人力减少、替换、裁员、降本增效等等情形,并没有如媒体鼓吹的那样出现。

理由三:大模型技术,是一个“超前时代”的技术。

2023年,大模型技术非常的火热,在技术圈的我,直接地体会到了这股“热浪”。

但是,随着时间推进到今天,2024年的年尾,这股热潮似乎远不如当初。

究其原因,我个人认为是“投入产出比”的问题,大模型的投入过大,动辄数十亿美元,买设备、买人力、买数据、买电力等等,而大量投入的训练成本带来的,并不是随之而来远超成本的收益,反倒是卖设备的英伟达赚的盆满钵满。

此外,大模型带来的价值难以进行社会量化,人们可以体感到的增量空间和区间,没有十分明显,这也导致很多的投资方望而却步。

大模型,或许是一个“超前时代”的技术。

假设大模型技术,出现在了可控核聚变大面积投入使用的时代,General AI可能就真的很快降临了!假设大模型的底层逻辑——scaling law可以无限有效,这就意味着投入更多的“算力”,就能产出更大的价值。

从这个意义上来看,唯有在小型化、安全、可存储、但有无限能源的时代,GPT范式下的AI才能发挥出最大效用。

理由四:大量历史经验表明,某一种增量式的技术创新,并不能带来“洗牌”。

大家都知道,我们现在正处于以万维网(World Wide Web)为里程碑的第三次信息技术革命。

这次技术革命,从20世纪末开始,持续到今天,已经处于一个生产力的发展的成熟期或是平台期。

而以GPT为代表的大模型,本质上是人工智能深度学习技术的一个发展阶段的应用。

但是,深度学习这个技术,早在2012年的成功应用,就已经成为第四次科技革命的其中一个转折点。

而在工业4.0时代(4.0时代指的是利用信息化技术促进产业变革的时代,也就是智能化时代),与人工智能技术同时代的技术发明,还有2000年的云计算,2008年的区块链等等。

可以想一想,20年前,如火如荼的云计算、区块链技术,也曾被认为是可以“洗牌”行业的技术热,但最后好像只是“悄悄”改变了部分人的生活,或特定领域的生产效率。

GPT好比什么呢?在我看来,有点像20世纪中期出现的“现代机械自动化”。

“现代机械自动化”,就是机器或者装置通过机械方式来实现自动化控制的过程,从数控机床,到自动化生产线,这些都是代表。

这个技术,深入地革新了整个现代制造业,提高了制造业的生产效率。

但归根结底,它只是一个技术,20世纪60年代,福特汽车公司因为使用了这个技术,脱颖而出成为万众瞩目的明星公司,正如今天的OpenAI。

OpenAI有GPT系列,谷歌有Gemini系列,Meta有llama系列。

再拿基于万维网的技术——“区块链技术”为例,来讲一讲“历史经验”。

相信就算不了解区块链的同学,也肯定听说过“比特币”。

有人因此一夜暴富,有人因此倾家荡产。

区块链,作为一种去中心化的加密技术,最早的、最出名的应用就是比特币。

在比特币之后,大量的其他加密数字货币也如井喷式涌现。

但是,我们今天的货币体系因此洗牌了吗?

美金依然坚挺,即使美联储十分任性的加息、降息;人民币在世界范围的影响力逐步攀升,币值稳固。

我们再来看看与货币关系最密切的行业——金融,它因此洗牌了吗?

似乎没有,老牌的投行、证券公司依然是头部。

这类的“技术热”带来的变革甚至都不一定比得过某些商业模式的创新带来的“洗牌效应”,比如我淘宝、拼多多、京东,似乎已经成功的把每一个中国人的消费方式、每一个品牌的售卖方式从单一的线下,转到了线上线下有机结合。


大模型才刚开始


大模型的故事才刚刚开始,何谈洗牌?
聊及AI的时候,很多人并没有这么乐观,比如产品找不到 PMF,投资进入寒冬,基础模型进展放缓。几家投入巨大的头部基础模型公司烧钱烧不动了,被反向收购。在他们看来,这一波 AI 创业的热潮就要结束了。
和OpenAI这些世界顶级的 AI 公司多交流交流,就会乐观了。
大模型是第四次工业革命级别的机会,绝对不仅仅是移动互联网级别的。
现在产品找不到 PMF,是因为大模型还处于 iPhone 1 的阶段,基础模型还有很大的进步空间,而且基础模型和应用的进展都非常快。
国民级应用也许两三年后才出现,需要大多数人一定的时间来接受。
应用方面,AI 生成代码而非纯文本,给用户呈现可视化结果,是一个很大的机会。
Karpathy说的有可能是ChatGPT之后最大的AI产品范式转变。
最近 Google 的 NotebookLM,OpenAI Canvas,Claude Artifacts,Perplexity Explore 做的 AI 今日头条,国内 Kimi的图表生成,阿里的 PPT 生成,Figma AI、Polymet AI 和 Motiff 的设计稿生成,还有很多小 app 都说明了这个趋势。
在这种新的应用范式中,AI 生成的不再是纯文本内容,而是多模态容,可以由带格式的文本、图片、视频甚至交互小游戏按照一定的页面布局组合而成。
用户对这种多模态内容的消费意愿将远远超过纯文字或者纯语音的传统 chatbot。
有数据统计,目前全球人工智能大模型有1300多个,国内大模型的数量已经超过了300个。

大模型热将会对科技行业产生深远的影响,不仅会推动技术的发展,也会对商业模式、伦理法规、教育研究等多个领域产生深远的影响。

我们需要以科学为方法,理性地看待这一趋势,既要充分利用大模型带来的机会,也要防范可能出现的风险。


摘自人人都是产品经理