ChatGPT冷观察 没大模型的土壤 开不出ChatBot的花
发布时间:2023-02-17 10:00:37 所属栏目:站长资讯 来源:互联网
导读:谁在跟风,谁又有真本事能做出中国版的对标产品来? 这恐怕是ChatGPT这股热潮以来,关心中国AI发展的业界人士最想问的问题。 IDC刚刚发布的一个关于大模型的报告,却某种程度上附带解决了这个问题。 在《2022中国大模型发展白皮书》中,面向大模型的发展,IDC
谁在跟风,谁又有真本事能做出中国版的对标产品来? 这恐怕是ChatGPT这股热潮以来,关心中国AI发展的业界人士最想问的问题。 IDC刚刚发布的一个关于大模型的报告,却某种程度上“附带”解决了这个问题。 在《2022中国大模型发展白皮书》中,面向大模型的发展,IDC在行业首次提出大模型评估框架,通过多维度标准,对行业主要大模型的发展状况进行了系统化的判断和评分。 当大模型能力的判断有了较为权威的行业标准后,谁能做出真正的ChatGPT类产品,其实已经有了答案。 ChatGPT OpenAI 人工智能 (1) 1 ChatGPT是AI的一大步, 但只是大模型的一小步 在问能不能之前,先要问是什么。 虽然ChatGPT的问世已经有数个月的时间,但对多数人尤其是行业外的“吃瓜群众”而言,除了知道这是AI领域的一大突破外,对它究竟是什么并没有深入地了解。 实际上,ChatGPT就是一种大规模语言模型(LLM Large Language Model),是大模型在NLP领域不断发展的一种结果。 从技术角度看,目前大模型已经深入各个AI领域,如NLP、CV、科学计算等,但它最早发端于NLP,以谷歌的BERT、OpenAI的GPT和百度文心大模型为代表,参数规模逐步提升至千亿、万亿,同时用于训练的数据量级也显著提升。 随着“大本营”NLP领域大模型的不断进化,最终OpenAI的GPT率先开出了ChatGPT这朵花。 所谓GPT,即Generative Pre-Trained Transformer,就是通过Transformer为基础模型,使用预训练技术得到通用的文本模型。 GPT家族已经先后拥有GPT-1,GPT-2,GPT-3,以及图像预训练iGPT等模型,ChatGPT本质就是GPT-3.5,只不过因为强大的对话能力突然爆火起来。不同的是,ChatGPT采用了新的指示学习(Instruction Learning)和人工反馈的强化学习(Reinforcement Learning from Human Feedback,RLHF)来指导模型的训练,前者带来了理解能力,后者增强了模型效果。 无论如何,大模型良好的通用性、泛化性,以及显著降低人工智能应用门槛的优势,在ChatGPT上得到了淋漓尽致的展示。 从这个列表可以看出两件事: 1、所有成型的ChatBot都只能是大模型发展的一种产品化结果,国外Google的Bard、国内百度的文心一言(ERNIE Bot)都是如此,其本质都是前期大模型家族的最新产品。 2、不管哪个ChatBot,能做得怎么样,几乎都取决于前期大模型家族的发展情况。 对大多数缺乏优秀大模型基础的厂商而言,要么必须花长周期重走一遍类似从“文心”到“文心一言”的路径,要么就绕过大模型直接做ChatBot——其质量可想而知。 而判断大模型家族的基础究竟如何,IDC的报告刚好就起到了作用。 此次IDC为了充分评估大模型技术能力、功能丰富度与底层深度学习平台开发能力,以及对各行业赋能的实际效果,并考虑到大模型的未来商业化前景,搭建起了大模型评估框架V1.0: 目前,被IDC高度评价的文心大模型已经建设了包括基础大模型(NLP、CV、跨模态)、任务大模型、行业大模型三大类在内的36个大模型。IDC认为,百度文心大模型在产品能力上呈现出较强技术实力和平台积累,“文心大模型+深度学习平台”创新了人工智能研发应用范式,满足市场大规模落地需求,达到行业前端水平。 IDC中国副总裁兼首席分析师武连峰表示,“大模型的背后蕴藏着一场人工智能落地模式的变革。如今火爆全球的ChatGPT背后的技术支撑正是大模型。没有对大模型的长期投入,就不会诞生ChatGPT这样的应用。在IDC提出的大模型评估框架下,百度文心大模型在本次评估中表现非常突出,是其打造文心一言的坚实基础。” 因此,国内已经宣布要做ChatGPT类产品的科技大厂中,能够最终做出类ChatGPT产品的,可能还是只有拥有中国科技企业最成熟的大模型开发工具和产品体系的百度。 当然,这个结果并不意外,国内长期坚持在大模型领域投入的,百度就是其中一。 2 到了2021年,ERNIE3.0大模型即拥有千亿参数,后来ERNIE3.0Titan更是达到了2600亿。 这个发展过程,百度也逐渐构建起一套包括文心大模型层、工具平台层、产品与社区的三层体系,这就是IDC在报告中强调的,“模型+工具平台+生态”三级协同加速产业智能化。 说白了,百度从一开始就在想着怎么让文心大模型进产业、怎么落地获得商业价值,也是按照这个“总纲”在走、在设计其整个体系。 最典型如,文心已累计发布11个行业大模型,在金融、能源、制造、城市、传媒、互联网等行业拥有实际落地的标杆案例,盯住的是解决客户的实际痛点,把大模型能力应用到客户业务流程关键环节中,求技术效果突破、求产品创新、求生产流程变革、求降本增效,等等。 在这些行业大模型往下,还有任务大模型、基础大模型的全力支撑;再往上,又有工具、产品的落地转化。 这种体系化面向产业的做法,一方面源于中国独特的产业智能化需求的大背景,另一方面与百度将AI的发展更多地转向现实产业价值有关。 如果说这种做法有什么后果,那就是集中B端落地、晦涩的技术和产品带来的技术认知不足。 现在,大洋彼岸的ChatGPT突然搞出了“大新闻”,举起了旗帜,文心基于此前的能力积累也能做出类ChatGPT的面向C端大众的ChatBot产品文心一言,于是,这就成了百度彰显自身技术能力的一个契机。 反过来看,ChatGPT则先面向C端做出了老少咸宜的大众化可触达产品,相似的技术底子下,声量自然就更高。 毫无意外的是,在OpenAI的布局中,ChatGPT接下来也会尝试走入更多垂直产业中发挥价值。 最终,两种路径都将殊途同归,实现B、C的全覆盖,只是所处阶段不同而已。 3 技术层不可跟风也跟不了风, 但ChatBot产业应用却值得广泛尝试 做ChatBot,在技术层面不应该跟风上马,它只能是LLM的一种自然的结果。 用更直接的话说,如果认为ChatBot真的有用,想要造福自身业务或者惠及伙伴、客户,更多缺乏基础的科技大厂应该沉下心来做这件事,而不是大干快上、急着表态。 跟风哄抬股价、刺激关注并不可取,最终欺骗的是投资者和关心企业的人。 不过,在这股风潮中,于产业方而言,却并不存在什么跟风不跟风。 作为AI领域好不容易等来的确确实实可能改变价值认知的产品,ChatBot在任何产业都值得尝试,只要有益于业务都可以探索这股AI的全新力量。 之前,在ChatGPT被归入的AIGC(生成式AI)场景下,百度文心已经有大量的产业实践。 最近,百度方面还宣布,未来会推出生态合作计划,要吸引和支持更多伙伴加入进来,一起拓展覆盖范围更广的商业市场。 在热烈的预期之下,真实的产业成果正在被探索、走向落地。 值得一提的是,作为基于百度智能云技术打造出来的大模型,文心一言未来也将通过百度智能云对外提供服务,为产业带来真正的AI普惠,这也将根本性地改变云市场的游戏规则。之前选择云厂商更多看算力、存储等基础云服务,以后用户对云厂商的需求更加聚焦智能服务,会更多关注模型、框架、芯片以及应用,这四层架构之间的协同。云服务正从数字时代跃迁到智能时代,智能化对各行各业效率的提升将显著显现。 (编辑:甘南站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |