Gartner张桐:真正做大模型的企业不会超过10家

探索2024-05-02 18:11:521986

    日前,张正Gartner推出2023年中国数据分析和人工智能技术成熟度曲线(下称“成熟度曲线”)。大模,企业此次推出的成熟度曲线:包括数据分析和人工智能两个部分,以及与其相关的超过四个基本主题。,张正四个基本主题分别是:业务成果优先的中国数据战略、区域数据与分析和人工智能生态系统、大模数据中台的企业崩塌、以及人工智能成为新的超过国力象征。,张正,(来源:资料图),根据本次曲线,Gartner推测到2026年,大模中国超过30%的企业白领岗位会被重新定义,使用和管理生成式AI的超过技能将大受欢迎。,张正据了解,本次曲线的大模调研样本主要选自技术提供商和自有客户。对此,企业Gartner高级研究总监张桐解释说,前者很关注这个市场,其所拥有的很多资料比我们的颗粒度更细,后者则包括金融业、制造业、政府机构等行业的客户。“我们实际上是通过这两方面去采纳他们的想法,来组装成这样一种曲线。”他表示。,可以看出,在该曲线中,即将进入期望膨胀期的技术数量最多;大模型和生成AI技术则成为诸多技术中的重中之重。,大模型和生成式AI位居曲线顶端,对于大模型来说,它们主要借助大规模的数据集,并通过自监督的方式训练而成,其中大多数都是基于Transformer架构或扩散型深度神经网络架构。目前,大模型已经成为自然语言处理的首选架构,并在计算机视觉、化学、软件工程、金融等领域得到广泛应用,而其也因对多种下游使用场景的重要性和所具备的广泛适配性被命名为大模型。,张桐表示:“大模型有潜力为各类自然语言用例中的应用提供增强效果,因此将在垂直行业和业务职能中产生深远影响。它们可以提高员工生产力、实现客户体验自动化和增强,并能以经济高效的方式创建新产品和服务,从而加速数字化转型。”,近两年来,有关大模型和生成式AI的讨论始终不绝于耳。在很多人看来,两者属于同一类事物。那么,Gartner为何在本次发布的成熟度曲线中,将其分成两部分技术来讨论?,实际上,从整体上看,生成式AI涵盖的范围非常广泛,只要是基于大模型(Foundational Model)产出的应用,都属于生成式AI。基础模型可以分为GPT和Stable Diffusion等类别,前者专注文本,后者聚焦图像。,,(来源:资料图),张桐表示:“大模型才是真正产生生成式AI变革的基础,所以我们要把它单独拿出来。现在有两个维度,比如有一些厂商,他们做的东西是大模型,也就是底座和基础;而其他做的是某一个细分领域,或者某一个应用系统,是在大模型基础之上的。”,目前,国内企业仍在持续推动大模型的发展那么,本次成熟度曲线的推出,又能给这些企业带来哪些指导意义?,张桐说:“我认为,大模型和生成式AI在成熟度曲线的顶端,就意味着其有很多泡沫。”,因此,企业首先应该清醒地认识到,在发展的过程中不一定能够短期内真正收获什么结果。并且,开发大模型的门槛很高,并非所有的企业都有条件参与其中。没有足够的算力和海量数据是很难构建大模型的。,张桐认为,虽然国内企业已经推出许多大模型,但其中真正称得上是在做大模型的不会超过10家。另外,对于初创公司来说,更适合基于大模型开发应用,而非围绕大模型底层下功夫。,如何真正实现数据驱动?,在成熟度曲线中,除了大模型和生成式AI,还有许多值得关注的重要技术。比如,数据资产管理、数据编织、组装式数据和分析、数据中台、数据素养、知识图谱等。,先来谈谈数据资产管理。由于具有描述事实、快速、多样等优势特点,如今数据已经成为公认的生产要素。为了创造更多价值,在业务运营的过程中,企业需要对具有资产价值的数据进行良好的管理、处理和利用。张桐表示:“企业机构必须谨慎管理数据资产,避免监管违规和数据意外泄露。”而在这个过程中,需要用到数据资产管理的方法和技术。目前,该技术已经可以用于多种数据形态,包括系统中的资料和交易数据、图像、文件、视频等。并且,能覆盖从获取数据到销毁数据的数据全生命周期。Gartner认为相较于海外,中国政府更重视对于数据产生价值的推动,因此其预测数据资产管理技术会在两年之内真正实现。,再来谈谈数据编织。随着数据的发展,中国数据管理存在着较大的复杂性和不确定性。数据编织技术的出现,颠覆了现有数据管理主流方法。作为一种设计框架,数据编织以元数据为基础,并有机器学习、知识图谱、数据分类等技术的加成,能够用来获得灵活且可以复用的数据管道、服务和语义。该技术不仅能够充分利用沉没成本,也能提供成本控制指导和优先级排序等功能。不过,需要说明的是,数据编织的实现相对困难,距离生产成熟期至少还有十年的跨度。另外,经济活跃度的加强,让业务环境呈现瞬息万变的发展态势,这也给企业提出了新的要求,比如,提高敏感性、加快洞察产出速度等。,接下来谈谈组装式数据和分析技术。该技术能够基于容器或业务微服务的架构和数据编织理念,把现有数据资产组装为具备灵活、模块化、用户友好等优点的数据分析和人工智能能力,帮助企业用于不同的使用场景。具体来说,它能把数据管理和分析应用,转变为数据分析、AI组件以及其他应用模块,且支持自适应和智能决策。,再来谈谈数据中台。为了减少数据和分析架构产生的冗余,很多企业还会采用数据中台这项技术。基于该技术,不同业务线的用户,能够根据单一事实源,对企业数据进行决策。但是,因为该技术在许多情况下存在局限性,所以其地位在市场中也出现了一定的削弱。,接下来谈谈数据素养。在成熟度曲线中,数据素养也至关重要。它指的是企业主是否拥有根据角色利用数据的能力。例如,对于企业领导者来说,是否能够基于数据讲故事、做智能决策等;对于企业业务人员来说,能不能从数据中发现洞察。张桐指出:“现在一些企业领导者可能还是60后或70年代初的人,由于其拥有自己的成功经验,因而不太容易改变自身思维定式并将数据决策方式真正落地企业。数据素养之所以在曲线的炒作顶峰,是因为大家都知道‘我们想要利用数据’,但由于技术和思维的落差,我觉得现在还很难真正实现所谓数据驱动。”,再来谈谈知识图谱。在生成式AI迎来发展之前,知识图谱技术也被诸多企业重点关注。采用图谱的方式表达知识,能够更好地将数据整合在一起。不过,该技术也存在缺点,即做起来比较难,需要考虑诸多问题,包括如何在结构化数据中找到实体并基于此构建知识图谱,以及如何根据新数据更新图谱等。依据成熟度曲线的预测,知识图谱技术距离生产成熟期还需5至10年时间。那么,为何该技术没能真正实现井喷式的发展呢?张桐表示:“我认为主要原因是其门槛比较高。”就大语言模型而言,其天然具有实体识别、找到关系的功能,因而可以助推知识图谱的发展。“不过,知识图谱能够给出知识的确定性正好弥补了大语言模型无法保证确定性的缺陷,因此我认为这两者结合,才是未来AI更进一步的主要方式。”他说。,另据悉,要想发展生成式AI和大模型,有三个要素必不可少:数据、算法和算力。而对于提升算力来说,芯片的作用是至关重要的。因此,芯片也处于成熟度曲线的顶端。不过,当下中国正面临着严峻的芯片问题,靠堆芯片、堆算力的方式来发展大模型的模式,可能在不久的未来发生变革。目前,相关领域正在探索各种变革路径,比如,寻找新的芯片架构、降低能耗等。期待在不久的未来,上述技术能更好地助力我们社会的发展前进。

本文地址:http://www.jiemengs.com/html/741c998328.html
版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

全站热门

2024年五一假期梦幻聊斋客服部放假通知

《江海渔童》发“好拍档”海报 打造“最中国”动画

一男子自导自演谎称支付宝被盗40万 涉嫌骗保已被抓

江南大部周日雨水暂歇 北方气温继续攀升

《超进化物语2》1.4版本明日上线,起源裂变,策略升级!

哈工大漠河极地模拟实验基地揭牌 将为研究北极气候提供支撑

应急管理部:不断加大无人灭火、远程灭火等装备配备力度

恒大发布亚冠迎战三箭海报 “斩箭”显示必胜决心

友情链接