市场活动
2024-01-23 18:56:23
作者:科技蓝
阅读量:1426
文章目录
在以《大模型加速智能时代到来,企业如何抓住新机遇》为议题的圆桌对话环节,主持人中国信通院南京新一代人工智能研究院高级业务主管张学强,与清华大学计算机科学与技术系教授、清华大学人工智能研究院常务副院长、欧洲科学院外籍院士孙茂松,中关村科金技术副总裁张杰,诺亚控股数据管理部总经理孙甜,智谱AI总裁王绍兰,围绕自身视角下对大模型时代机遇与挑战的认识,以及对应的发展路径展开探讨。
本文对圆桌对话分享内容进行了编辑整理。
主持人:各位好,我是中国信通院的张学强。很荣幸今天邀请到了产学研用各方学者和专家,跟我们一起谈谈大模型是如何加速智能时代的到来,以及企业如何抓住这一重要机遇。为此我准备了几个问题,话题一,现在“百模大战”已经过了上半场,大家在上半场是怎样围绕大模型进行业务布局或开展产业研究的?大模型对企业的业务创新与发展究竟有哪些价值?
清华大学计算机科学与技术系教授、清华大学人工智能研究院常务副院长、欧洲科学院外籍院士 孙茂松
孙茂松:大模型是一个新的信息处理基础软设施,企业过去的业务都应该在新的平台上重新打造一遍,效果肯定比过去好,但好多少是未知数。大模型提供了企业业务升级换代的可能性,而且可能性的空间很大,值得一试,对行业头部企业更为重要,因为如果主线产品不是基于新的平台,若干年后头部地位可能会被改变。
中关村科金技术副总裁 张杰
张杰:大模型是一种技术,技术就是工具,没有改变工具性的本质。对于企业来讲,企业始终关心成本、效率和用户体验问题,只不过大模型技术更进一步把技术降本增效的工具性发挥到了极致。原本基于大数据和AI的产品都值得用大模型重新考虑一遍,大模型是一种大趋势,每个企业中的每位员工,或多或少、或早或晚都会涉足其中,所以尽早考虑比晚点考虑要好。
诺亚控股数据管理部总经理 孙甜
孙甜:大模型在诺亚控股最大的价值是“诺Chat”的上线,节约了70%的人工问答工作量。大模型火热之时我问工程师团队,为什么提的需求排期还是这么靠后?有了大模型后排期是否应该缩减一半?后来我发现,大模型工程提效虽然是一个大方向,但此时此刻还没有达到这么高的降本增效效果。不过有了大模型代码辅助能力后,工程师学习新东西的速度变得非常快,比如AI交互式新模型的开发等。
智谱AI总裁 王绍兰
王绍兰:从整个产业来说,当前大模型竞争的是基础能力的提升,下一步重点是在行业、产业的落地,不仅涉及到IT产业,也会扩展到非IT产业。据麦肯锡预测,生成式人工智能每年可为全球经济增加 2.6 万亿至 4.4 万亿美元,所以大模型未来在产业中的落地是必然的。作为产业应用,尤其是对于中小企业和创新企业,大模型是一个巨大的机会,大企业往往会看方向、看发展,有成熟应用再跟进。恰恰是中小企业,大模型是一个非常成功的上位机会。
主持人:正如王总所说大模型是机遇也是挑战。第二个话题,大模型产业发展竞争逐渐白热化,企业该如何建立竞争壁垒以及找到新的增长点呢?请各位专家做一个简单的分享。
王绍兰:分成两类,大模型企业建议提升基础模型和多模态能力,下一步的挑战是多模态更强的推理以及Agent能力;应用模型企业的核心竞争力在于行业Know-How,包括企业对行业业务的理解和行业数据的沉淀,缺一不可。人工智能是由数据算力、算法决定的,所以行业数据的沉淀是核心竞争力的一部分,另一部分是对行业业务的理解。
我们希望有既理解大数据又理解人工智能的服务团队。中关村科金深耕金融行业多年,熟悉金融业务流程中的各种问题,具备核心竞争力的重要两点。同时下一个独角兽应该出现在为实体经济、为金融行业提供服务的公司,下一个投资热点应该在生产服务业中,并且是生产服务业中为第一、第二产业提供服务的科技公司。
孙甜:诺亚控股的核心是为企业带来业务价值。过去数据偏小的企业发展机会不大,因为大数据赋能的企业会发展得比较好,但是在大模型时代,反倒有很大的希望。在大数据时代,大数据等同于知识经验的沉淀,因模型理解力不够需要海量的数据训练,现在诺亚控股反倒强在行业的Know-How。过去Know-How的载体等同于大数据,现在的载体则非常多,对我们来讲PaLM工厂也是很好的载体,至于如何把Know-How变成更高的智能,还需要突破传统。
张杰:科技公司在大模型时代要建立竞争优势有三点,一是数据、二是知识、三是经验。无论基础大模型还是领域大模型,一定的数据量是起码的。中关村科金过去几年在各式各样的对话式场景下,积攒了大量数据,服务了九百多家客户,两百多个场景,每天人工拨打的电话大概有两百万,积累了大量的数据。
但仅有海量数据仍然不够,因为数据相当于铁矿石,喂到模型里的需要是精炼知识,所以知识是更宝贵的一类数据。打个比方,如果原始数据是过去一百年太阳系九大行星的运行轨迹,这个数据量的价值不够直接给一个牛顿万有引力这样的知识。
现在的大模型时代和原来的AI手段也不一样。原来的AI手段各种各样,有基于数、矩阵、神经网络的,现在的大模型时代,数据、算法都趋同,把一个高级凝练的知识灌进去之后,提升会更加明显。这种知识是指行业提炼出来的高纯度的、高知识密度的Know-How,而且还避免了数据泄露、安全、隐私方面的问题。
第三是经验,包括场景经验、微调领域的经验,有了知识和数据也不能保证一定能有一个更好的领域大模型。算法工程师知道怎么微调领域大模型,也知道不同层级的NLP任务如何拆解,这种微调经验是非常宝贵的。所以算法工程师在核心壁垒里是非常宝贵的一类资产,只不过现在我们的资产负债表没有把算法工程师加到里面。
孙茂松:知识密集型企业树立大模型的意识非常重要。大模型不是万能的,但没有大模型对知识密集型企业是万万不能的。大模型是一个有力的工具,在工具的支撑下,过去所有的东西可能都要重新设计。比如冷兵器时代,即使神勇如关云长到热兵器时代也不堪一击。大模型就是最锐利的工具,工具会重构生产关系,这点值得企业重视。不要太指望这个工具一出来就有奇迹发生,但如果跟竞争企业相比,效率永远比对方低20%,可能就没有机会了。所以企业要树立大模型意识,是或不是,结果可能差得很远。
主持人:好的,接下来聊第三个话题,目前大模型的参数越来越高,随之而来的训练成本也越来越贵,那么低成本这件事情还成立吗?或者说在当今的大模型时代需要如何重新定义什么是低成本?
孙茂松:构造通用基础大模型的成本是比较重的,但一般企业不用操心,这是少数大模型头部企业操心的事。基础大模型训练之后,现在有一套办法,叫真流程、小模型。小模型对企业来讲压力不是特别大,完全可以承受,另外相对头部企业发展,成本不是最重要的考量因素,小型企业更重要的是可能性,跟头部企业相比是否占据优势。成本有摩尔定律,很快会降下来,所以成本不会是太大的问题。
张杰:完全赞同孙院士的说法。其实企业,尤其是甲方,完全没必要从零到一训练一个基础大模型,这样成本确实非常高,而且很多场景也完全没必要用到千亿级参数的大模型。只要场景需求确定,这种任务交给中关村科金去做就可以了,我们提供一个成本完全可以负担的微调领域小模型就可以,所谓小模型有个几十亿B、上百亿数据就可以了。
孙甜:我跟前面嘉宾的观点一样。为什么我们不买GPU?因为这不是甲方企业考虑的事。一开始我们就决定能找到专业团队就不自研,规避了大模型最重要的成本。对于甲方企业来说,最大的成本有两个,第一机会成本,我们自己落地成本不高,但如果丧失了机会,对我们是重大的打击,所以大模型出来后我们一直在跟进这个方向。第二是落地和应用成本,也就是怕反复试错以后企业用不起来,为了规避这个成本,我们紧抓企业场景。
目前在智能客服方面是有一些确定性的应用,但远远不够,还要在其他领域快速试。试的过程中要发动一线员工不停地应用,从一线员工的角度找一些场景。如果视汽车为更快的马,认知就局限在了落地场景的挖掘上;如果视汽车为汽车,那落地场景会有很多。找不到场景的一个原因是终端用户对大模型的认知不够,所以我们的策略是不停推广,让大家无论如何先用起来。
王绍兰:同意孙老师的观点。大家对成本是有误解的,大模型一出来大家就说模型很大、很花钱,其实指的是训练。智谱AI研发130B大模型的时候,就有做普惠大模型的目标。什么叫普惠大模型?分享几个数字。训练130B的千亿级参数大模型需要什么成本?四张3090显卡;60B的大模型需要1张3090的显卡,家用就可以跑起来;15B参数的模型手机就可以跑,所以成本其实很低。
从应用的角度看,企业使用大模型需要生产服务业的企业一起努力才可以。企业面对的其实不是成本的问题,是投入产出比的问题。简单说一个数字,我们现在用CodeGeeX编码模型帮助软件开发企业单人提升50%的效率,团队提升30%的效率,投入产出比大概是十几倍。大模型真正带来的是生产力的提升,生产力的提升会改变生产关系。如果这两件事都做到,真正智能带来的是工业革命。所以成本不是问题,真正的赋能和提效才是大模型未来看到的东西、生产力的东西。
主持人:是的,真正的赋能和提效才是生产力最后的要求。最后一个问题,请各位嘉宾用一句话总结下对智能时代的前景展望、商业机遇或企业发展建议。
孙茂松:第一不用去研发大模型,第二琢磨怎么用好大模型。
张杰:大模型怎么应用不只是一个技术问题,也是管理和组织能力问题。
孙甜:想要用好大模型,请考虑一下中关村科金。
王绍兰:用好大模型,每天少工作一小时。
主持人:至此,2023大模型产业前沿论坛的所有环节已经结束,感谢参会嘉宾的支持。中国信通院、中关村科金愿与各位专家、企业代表们携手共推大模型工程化落地、共筑大模型可信生态,谢谢各位!
点击免费试用,助力企业服务营销数字化升级>>
通过引入得助全渠道在线客服系统,欧派家居成功构建了一个全天候、快响应、好体验客户服务体系,不仅显著提...
得助智能电销凭借其强大的技术实力和灵活的应用场景,在零售、教育等多个行业中展现出适应能力。在零售行业...
随着大模型技术的发展和应用的深入,中关村科金逐渐形成全新的大模型应用理念:围绕知识平权、决策平权和体...
中关村科金得助打造的智能知识助手,凭借其领域大模型、多模态文档解析、大数据智能搜索等技术,为企业提供...
中关村科金于2023年底正式推出企业知识大模型、大模型AI应用开发平台,以及“超级员工”系列AIGC...
基于AI底层能力,中关村科金Instadesk打造了“全球智能联络中心”解决方案,针对企业出海客户服...