ChatGPT引发数字化改革
发布时间:2023-02-20 12:45:35 所属栏目:大数据 来源:互联网
导读:ChatGPT是由美国顶尖AI实验室OpenAI开发的一个基于大语言模型的聊天机器人。与之前的大语言模型相比,ChatGPT实现了两个跨越:从玩具到工具的跨越,从学术研究到生产力赋能的跨越。未来五到十年,ChatGPT会像电脑和手机一样成为大众的随身工具,成为人人必备
ChatGPT是由美国顶尖AI实验室OpenAI开发的一个基于大语言模型的聊天机器人。与之前的大语言模型相比,ChatGPT实现了两个跨越:从“玩具”到“工具”的跨越,从学术研究到生产力赋能的跨越。未来五到十年,ChatGPT会像电脑和手机一样成为大众的随身工具,成为人人必备的智能助手。 一、ChatGPT的诞生当引起重视 1.ChatGPT简介 ChatGPT是由美国顶尖AI实验室OpenAI开发的一个基于大语言模型的聊天机器人,代表了当前人机对话和文本生成领域的最高水平。 ChatGPT实现了两个跨越,即从“玩具”到“工具”的跨越,从学术研究到生产力赋能的跨越。相较于传统大模型,ChatGPT具备更丰富的专业领域知识、更强的数学运算能力与信息整合能力,可以输出更准确和类人的答案。ChatGPT甚至能够一定程度上解决复杂的专业问题,让机器大规模涉足知识类和创造性的工作。 ChatGPT极大降低了AI 的使用门槛,其问世是AI产业发展的里程碑事件。未来五到十年,ChatGPT会像手机一样成为大众的随身工具,成为人人必备的功能强大的智能助手。 2.ChatGPT性能飞跃的关键是技术升级 ChatGPT创新地融合多种 AI 技术,包括人类反馈强化学习、指令微调和代码训练,使得模型表现有了质的提升。从效果上看,ChatGPT在人机对话中取得惊艳表现,是由于充分解锁了大模型的四个潜力:(1)充分理解人类的意图并响应指令;(2)利用思维链进行多步推理,可以一定程度上解决复杂的专业性问题;(3)建模超长历史对话,充分利用上下文信息;(4)应对用户的新指令。 3.为什么中国没有率先推出类ChatGPT产品? 中国虽已推出多个大模型,但与 ChatGPT 存在较大差距,短时间内难以诞生能与ChatGPT比肩的大模型。整体来看,中美在 AI 基础技术,尤其是超大规模模型领域的技术差距在增大。 差距主要体现在三个方面:(1)工程化能力。大模型调优周期长、难度大,国内相关工程化经验欠缺,难以实现大模型对数据的充分吸收与利用;(2)数据积累。ChatGPT的成功建立在海量数据集和专业语料库的基础上,持续吸收真实用户对话反馈,形成用户调用和模型迭代的飞轮,国内公司鲜有这方面的积累;(3)AI芯片与算力。国外高端AI 芯片的限供和国内在AI芯片领域与美国的差距,共同限制着国内大模型的发展空间和速度。 二、ChatGPT将引发产业数字化革命 1.ChatGPT背后的大模型将成为AI新型基础设施 ChatGPT使AI能力成为标准化、规模化、流程化、低成本的产物,有望作为AI 能力的共用底座使用,成为 AI 新型基础设施:(1)ChatGPT展现出更高的通用性,可灵活、稳定地提供多种AI能力;(2)ChatGPT降低了 AI 能力获取的成本,基于其进行二次开发的性价比远高于从零开始搭建专用模型;(3)ChatGPT激活了大量潜在需求,未来使用 ChatGPT的从业者将迅速增长,规模应用前景乐观。 2.带动商业模式创新,大模型“中间件”存在广泛机会 ChatGPT作为底层基础模型,可以直接为普通用户提供具备一定专业水平的内容,但与专业用户的诉求仍存在差距,带来中间件的广泛机会。ChatGPT中间件的开发商以实际应用场景为目标,挖掘大模型的潜力、优化大模型的产出,使其能够提供更专业的AI能力。大模型中间件已探索出类SaaS的商业模式,如 Jasper.AI基于 GPT-3提供付费服务,可实现75%的毛利率。 3.ChatGPT并不万能,大模型安全使用需加强监管 受训练语料的时效限制,ChatGPT无法回答2021年6月后的问题;另外,ChatGPT无法验证自身答案的正确性,回答专业问题时仍需人类专家协同。 ChatGPT的滥用也会引发对其安全性的担忧,主要集中在三个方面:知识产权方面,ChatGPT被广泛用于生成专业文档和代码,引发知识产权侵犯及归属争议;信息安全方面,用户隐私可能在交互中被模型捕获,泄露给其他使用者;非法使用方面,ChatGPT可能被用于辅助编写网络钓鱼代码、勒索软件等非法用途。因此,ChatGPT的安全、合法使用需要加强监管。 三、ChatGPT的启示与建议 1. ChatGPT 将对产业数字化产生重大影响 ChatGPT以及类似大模型的不断发展,预计将对产业数字化的发展产生重大影响: 大模型将进一步激活对高质量数据、大规模算力的需求。为了训练和ChatGPT体量相当的模型将需要45TB的高质量专业数据,占用3.5TB内存,至少44块H100 GPU才能满足基本需求,这些需求的爆发将为电信运营商云网服务提供机遇。 2.运营商发展大模型的策略建议 抓住人工智能大模型给产业数字化带来的转型机遇,并妥善应对由大模型带来的核心技术卡脖子、数据隐私、安全监管等挑战。 借鉴通用大模型思路,面向呼叫中心领域率先进行突破性试点。打造智能客服GPT系统,可分三个阶段具体实施:(1)利用客服对话数据和知识库对已有开源大模型进行参数调优,满足基本的问答和知识检索需求;(2)通过引入专家监督训练,优化模型,达到拟人水平;(3)通过强化学习,优化策略,使其具备一定的理解力和自适应能力。智能客服GPT系统可大幅度降低人工成本,并提升交互体验。 (编辑:甘南站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |