作为一项新兴技术,AI凭借 ChatGPT让大众认识到了IT未来的方向,但是如何将其真正应用在企业应用当中,让产业发展从中受益,至今依然没有一个明确的落地实践模式,因此存在诸多的探索空间。
「我觉得AI不能仅仅是技术,AI也不能仅仅只有训练,也不能仅仅是打磨工具……我们还是要去发现和解决现实中最真实的需求,要解决最实际的问题,它才能产生真正的效益。」林源,青云科技CEO日前青云科技2024 AI 算力发布会上强调:对于新兴技术的应用,一方面是要降低其应用门槛,让更多的人有机会拥抱新兴技术,另一方面,则是要加速应用场景的落地,在现实应用当中,寻求对新兴技术应用「最后一公里」的突破。
事实上,对于整个IT产业而言,在过去的两年时间里,都在需求各种将「AI技术」落地为「AI应用」的模式:有些是在自身的产品当中融入更多的AI应用;有些是为企业提供应用AI的基本能力……虽然所有的努力都在很大程度上推进了AI企业级应用的步伐,但是对于企业用户而言,这些支持都是碎片化的、彼此割裂的,需要企业自己去将这些能力「缝补」起来,才有机会构建属于自己的AI能力——这实际上就再次让企业用户陷入到了IT应用的固有窠臼:技术门槛过高,信心很难建立。
事实上,AI作为一项必将被应用于企业级的IT新兴技术,从技术角度讲,应用其将为企业来带诸多已知和未知的改变,如:AI应用需要GPU芯片,因此芯片的架构改变了;芯片的改变又带来了整个服务器架构的改变、网络连接方式的改变、数据存储方式的改变……直至整个IT基础设施的改变。更重要的是,企业开放应用的方式也会发生改变:以往基于操作系统、中间件、数据库、大数据等进行的开放模式,将被各种模型代替。
「这是一场巨大的冲突,是一场拥抱新应用市场的驱动力与使用新技术之间产生的冲突。」在林源看来,要解决这样一个矛盾,就需要一个从根本上降低技术门槛的方式。「PC时代我们有Windows,它帮我们管理我们不熟悉的CPU、闪存、网卡、屏幕,屏蔽我们不熟悉的硬件,同时向上支撑我们的应用;移动互联网时代,我们有iOS、安卓,让老人、小孩也能使用。那么,到了AI时代,我们也需要有这样的基石平台,这就是青云的使命。」林源说。
一年前,青云科技发布了智算产品的1.0:一个AI算力调度平台、AI Cloud和AI生态同盟,将以往几年时间内所积累的与AI相关的技术、产品、服务和生态进行了重新的排列组合。「一年过去,我们在产品的平台,生态、以及解决方案上都有了很大的进展。」林源说:「我们现在核心要解决两方面的问题:一方面连接算力的供给方,同时也连接算力的需求方,就像操作系统一样,一边向下管理硬件,一边向上支撑应用,从而为企业用户提供一个应用AI的技术基座——青云自创业至今已经17年,我们最擅长做的就是为企业用户提供基座、平台和基础软件。」
在本次青云科技的发布会上,在产品和平台层面推出了更新的AI智算平台、AI算力云服务,以及AI智算一体机产品。
「纯软件的AI 智算平台是一个大而全、覆盖从底层设备管理、上架、监控、性能,到上层的AI算法优化等能力的平台。」苗慧,青云科技智算产品经理:「青云去年9月份发布了1.0产品,以全新容器架构的形式提供了底层算力基础设施调度管理到业务运营的功能,在过去的一年中,青云又陆续推出了几个产品来解决其他问题。」她说,在计算产品上,青云提供统一集群架构来管理不同型号、不同厂商的计算卡,服务于不同的网络;在数据这一块,青云发现不同的业务场景下,如自动驾驶,自动驾驶是大量图片、数据需要回传,但是它只有部分数据需要计算,所以需要建设多地区、多中心的数据存储服务,因此青云提供内部的数据流转服务,流转到计算存储产品上,通过GPU读写得到计算数据,然后再进行数据的删除、备份等。同时,青云还是为了降低算法工程师管理数据的难度,将底层所有的数据基础设施全部通过青云AI数据平台服务化管理。网络层面上,青云主要是提供高性能计算网络,一个是IB网络,一个是RoCE网,整体上还是RDMA通信的调优。「作为纯软平台能力,青云AI智算平台还提供AI开发与训练平台、模型广场、模型服务平台,以及运营与管理平台。同时,这一平台还可以进行算力中心的私有化交付、分布式云的交付,以及边缘云的交付。」
如果有些客户不想对自己的IT基础设施大动干戈,那么青云提供了AI算力云服务将成为另外一种选择。「青云科技的AI算李云以GPU算力为主,现在已经上线了西北1区、西北2区,华北1区,华北2区,为用户提供一个在线的方式来并行获取英伟达H系列、A系列、RTX系列以及曙光和昇腾相关的卡,用户可以在线申请、使用,进行在线分布式任务,通过使用AI 算力云,算法工程师可以立即得到算力服务及模型。」苗慧说。
与前两者相比,青云科技此次推出的AI智算一体机产品开箱即用、软硬一体化的模式,获取更加容易,私密性更容易得到保障,对于中小型科研单位、中小型研发团队、中小型传统企业更加适用。「通过AI智算一体机,用户可以根据自己的需要得到自己的算法产品和模型产品,因此从整体上来说,青云对于算法工程师和AI基础设施之间要做到无界算力,为整个科研创新提供服务。」苗慧还强盗说,AI智算平台、AI算力云服务整体背靠青云技术专家,尤其是青云有多年传统云计算基础、虚拟化基础、容器基础实战经验。在此基础上,青云科技有能力为企业用户提供咨询服务与规划,提供可行性分析、面向不同场景的架构设计。「同时青云还有7x24小时非常专业的技术专家团队为大家服务。」她说。
然而在IT技术向应用转化的过程中,单纯依靠技术和产品的进阶是完全不够的。「基座是必需的,但是它不够:因为太多的行业、太多的场景要落地时,有大量最后一公里的问题要解决,所以仅有平台不够,我们需要生态,最终服务于各个场景,这是我们在落地我们企业数字化,包括服务智算中心过程中的核心思路,非常开放。」林源说。
在本次发布会上,青云科技副总裁沈鸥详细解读了青云科技关于AI生态圈建设的规划和战略部署。
「在算力方面,我们最主要做的工作是基于我们要往下承接、对接很多的算力设备供应商。到目前为止,AI智算平台已经能支持英伟达的全线产品。我们也跟英特尔合作做了相关的课题,如何在他们CPU加速器上实现AI的场景加速。同时,我们也在跟国内的一些CPU、GPU、DCU、MPU的一些厂商进行很多技术对接和验证工作,包括有华为昇腾、曙光等公司——可以说,青云科技正广泛展开跟国产的GPU、DCU厂家的合作让设备发挥更好的效能,在降低成本的同时,能够获得所需要的智算支持、开发和运行的整套能力,更好发挥国产智算的能力。」沈鸥说:在模型服务方面,青云正在与包括智谱、百川等在内的大模型厂商合作,在MaaS平台上,为企业用户提供多种相关的大模型服务。与此同时,青云科技还与「国内一些数据要素的厂商、AI开发链的厂商一起合作,希望能够打造全面的数据服务和应用开发服务。」
沈鸥还强调说,青云科技从2018年做云原生底座的自主开发起,就强调项目的开源属性,基于其开源项目KubeSphere和云原生开源社区,现在青云科技提供的AI基座同样可以更容易地对接第三方的AI能力,「我们在整个AI智算平台上会提供技术底座,还用到LuBan应用框架、Whizard可观测性平台等能力,使我们跟第三方的生态合作对接和验证过程中变得非常容易,同时保障整个平台的监测、故障诊断等——在与客户保持同频的基础认知上,更容易在企业的实际应用中落地。」他总结说:「在过去这一年,我们推出了算力共赢计划、算力加速计划,模型市场共建等计划,完成了整个生态适配138项,我们现有AI生态合作伙伴超过200+,这样的合作伙伴给了我们很大的能力,让我们能服务于各种行业的各种场景。在这些场景里,也离不开合作伙伴的帮助。」
结合新发布的技术和产品,和更全面完整的生态体系,此次青云科技还针对不同类型、不同应用场景需求的企业,提供了具有针对性的十大应用场景。
「行业场景分为两类:第一类,大家比较熟知的互联网、人工智能、自动驾驶,这种叫做新兴的行业,他们肯定需要拥抱AI,同时他们也有很强的技术能力;但请大家不要忽略了,有需求的不仅仅是他们,还有大量的传统行业,包括金融、医疗、生物制药、高校、政务等。」对于此次提出的十大应用场景,林源强调这些「传统行业」对于AI应用同样具有一定的「迫切性」:「这类型企业用户首先真实的需求;其次他们有大量的沉没数据需要被激活;最后,这些传统企业更需要技术合作伙伴,因为他们在业务上非常的专业,但他们在技术上需要帮助。」
青云科技智算解决方案总监 傅帅在介绍十大应用场景时强调:「AI的三要素就是算力、算法和数据,在这里面我想加一个维度:规模。」他认为,企业用户应用AI的规模可大可小,可以是中心端,也可以是边缘端,只有从这个维度考量,才会涉及到AI基础设施。「所以我们的基础设施是从中心到边缘,从小规模到大规模,实现AI全领域、全覆盖的能力。我们所做的工作是覆盖青云上层的行业和领域,为中国百行千业的客户提供AI的支持和服务能力。」
写在最后
一项新兴技术如何才能真正发挥作用?也许需要考量的因素会有很多,但是归根结底,在于是否能够从全局把握解决问题的关键,并为用户建立起尝试的信心。AI的企业级应用才刚刚开始,一切都还存在无限可能。