摩登3主管554258:_全球最大AI算力市场 “国产替代”第一站?

金秋九月,推迟两月的2022世界人工智能大会(WAIC)在上海举行。在美国刚刚对华限售英伟达和AMD高端GPU(图形处理器)的背景下,AI/GPU成为本届大会除元宇宙之外的另一大“流量密码”。

芯片是AI的基石。在“WAIC 2022”评选出来的八大“镇馆之宝”中,上海天数智芯的“智铠100”和壁仞科技的通用GPU芯片BR100系列入选其中,成为业界关注的焦点。《中国经营报》记者注意到,不只寒武纪、壁仞科技、燧原科技、瀚博半导体等这些AI芯片公司展示了最新的芯片产品,百度、华为等科技大佬也展示出了AI相关的硬件。

另外,在全民关“芯”的背景下,记者在一些AI芯片论坛上注意到,国内AI芯片公司已不止于对外宣扬算力理论峰值和未来愿景了,而把重点更多地放在了算力密度、能源效率、生态合作等话题上。

资深产业分析师黄烨锋表示:“从今年的新品和生态更新中,能看到国产GPU/AI芯片企业在走向成熟。发布POD(智算机)、集群,强调系统和软件生态的重要性,并将其落地转化为生产力,无一不体现着现在的国产AI芯片企业已经脱离了过去讲故事、卖情怀、谈愿景的初期阶段,朝着更具切实意义的方向迈进。”

据了解,壁仞科技通用GPU芯片BR100采用了台积电7nm制程,单芯片峰值算力可达每秒千万亿次浮点运算,打破了全球通用GPU算力纪录;同样采用7nm工艺的天数智芯首款云端推理通用GPU产品——“智铠100”,于今年5月成功点亮,经后续测试修正后即可量产;成立于2018年的瀚博半导体则展示了国产云端7nm GPU芯片SG100,据悉该芯片是集渲染、AI于一体的全功能GPU,而云游戏、云手机、云桌面、云计算等元宇宙关键性应用场景正是其所要发力的重点领域。值得一提的是,专注云端算力的人工智能公司燧原科技发布了高性能AI加速集群服务器产品云燧智算机(CloudBlazer POD),里面内置了云端AI训练芯片“邃思1.0”和“邃思2.0”,云燧智算机及集群方案的诞生,也让燧原完成了芯片、板卡、服务器、集群算力中心解决方案的覆盖。

燧原科技创始人兼COO张亚林对记者表示,从前些年开始,AI模型参数规模就以每3个月提高一倍的速度在发展,如今模型参数已经发展到了千亿,甚至万亿级规模了。“大规模集群是AI计算的必需品。”他指出,“算力底座不仅是芯片,还有板卡、软件,更重要的是系统一体化。而这块除了美国友商之外,中国国内能实现的还非常罕见。”

张亚林还指出,如何通过集群和系统的方式使AI大模型达成更高的生产力,已经成为一个关键问题。“我国东数西算工程的落地,不仅对能效、算力密度有要求,还在部署、运维、集成等方面提出了非常高的交钥匙一体化需求。”他说,这是云燧智算机和集群诞生的背景。

“在AI技术、AI芯片发展到一定阶段后,有越来越多的芯片企业开始强调有效算力、算力效率、算力密度之类的概念,且从端到云的不同企业都在谈这些事。”黄烨锋注意到,今年WAIC不止一家企业用PUE(Power Usage Effectiveness,数据中心总能耗/IT设备能耗)来衡量能源效率,这是一个更偏系统层面的指标。而在单个AI芯片层面,瀚博半导体创始人兼CEO钱军则在人工智能大芯片产业落地论坛上指出“评价算力,不能只看它的绝对值”,并提出了“算力密度”的概念,该概念可用来衡量一家芯片企业的实力。

继2800亿《芯片法案》威逼利诱芯片巨头在中美之间“二选一”、对EDA软件实行出口管控后,美国又对华断供英伟达等高端GPU芯片,恐影响超算中心、AI训练、云计算服务器等场景,这一纸公告引发人工智能和芯片半导体两个行业的双重地震,“国产替代”已成大势。

“昆仑芯3代将于2024年初量产,将成为国内高端芯片的替代产品。”9月6日,百度集团执行副总裁、智能云事业群总裁沈抖透露,截至目前,百度“云智一体3.0”的AI IaaS层核心的昆仑芯已量产数万片,实现大规模商业化落地。

全球最大AI算力市场 “国产替代”第一站?

近五年,中国算力产业规模平均增速超过30%,算力总规模位居全球第二。而且,中国是全球最大的AI算力市场,但90%左右的AI算力市场被海外主流厂商瓜分。

算力中心最核心的是高效率的通用计算芯片,据昆仑芯科技CEO欧阳剑观察,每年的市场增长率在40%——50%之间,需求量将越来越大。

今年以来,昆仑芯密集地拿下多个大单。

近日,百度智能云-昆仑芯(盐城)智算中心在江苏盐城上线,算力规模达200P,这一智算中心以昆仑芯为算力底座,为盐城建设百度百舸异构计算平台、人工智能算法平台、视觉引擎平台、人工智能应用等四大功能平台,辐射长三角地区,面向AI应用场景提供算力、数据和算法服务。

大模型已是当下AI的趋势,百度文心、华为升腾AI等纷纷推进大模型,AI模型研发从手工作坊走向工业化。今年3月,昆仑芯就拿下了北京市实验室服务保障中心的千万级AI大单,搭载昆仑芯2代产品的AI服务器上岗后,就为北京重点支持的新型研发机构“训练”起了大模型。

当前,检察机关也要构建超级算力底座来完善其检察工作,算力国产化、部署经验、算力性能、算法适配能力都是其重要考量。去年10月,昆仑芯拿下某省级司法体系千万级智慧检务综合平台项目。

此前,湖北省宜昌市点军区的一台“超级电脑”走进普通民众的视野中,实时保障虎年元宵节焰火晚会观赏区的群众安全,在60公里长江干流上时刻监视非法钓鱼。“超级电脑”每秒最大51200万亿次计算能力,相当于50万台电脑同时运行,它的“大脑”便是昆仑芯。

在今年的世界人工智能大会上,燧原科技在其主办的 “算尽其用 ·AI 算力中心新实践” 云端 AI 算力产业论坛暨 2022 年燧原科技新产品发布会上,邀请了来自产、学、研的专家和业界领袖,共同探讨算力中心建设的新实践。在东数西算、新基建等一系列国家政策的支持下,国内掀起了智算中心建设潮。建设大型人工智能计算中心有着多方面的意义:一是为了推进算力资源的普适普惠,赋能各行各业的数字化经济转型;二是通过算力中心的建设,实现产、学、研、用多位一体,打造 AI 产业集群,拉动城市科技产业及经济的双向发展。根据工信部数据显示,截至 2022 年 6 月底,我国在用数据中心机架总规模超过 590 万标准机架,服务器规模近 2000 万台,正不断夯实我国数字经济发展基础。

在这波热潮兴起的过程中,算力的重要性日益凸显。算力作为人工智能时代的核心“引擎”,是推动整个产业发展的关键因素,也是 AI 时代的通用刚需资源。但当前国内 AI 算力中心建设面临的痛点也随着这波热潮浮出水面,重点表现:顶层制度建设和标准体系亟待统一。目前国内尚未有较为统一的相关行业标准和政策出台,各地围绕着算力基础设施的建设拥有各自的标准体系,对后期进行跨区域算力资源调度、整合提出了较高的挑战。建设方向和建设需求错位。目前大多数计算中心在建设思路上采取了算力性能发展优先,再拉动应用发展的策略,忽视了上层应用迁移及兼容程度,导致算力系统的初期应用效率偏低,无法完全支撑全面的智能化应用场景需求。

解决上述行业发展问题的关键因素之一在于中国人工智能行业应从应用场景中获取实践经验,优化行业解决方案,推动人工智能产业的全面健康发展。当大部分企业还在埋头产品研发的时候,燧原科技已领先一步实现云端训练和推理产品的二次迭代,并着力拓展其商用落地版图,加速为人工智能产业赋能。国产 AI 芯片厂商如何以实践出新招?燧原科技是一家定位于人工智能训练及推理解决方案,并专注研发针对云端数据中心的人工智能高端芯片的硬科技企业,也是国内首家云端人工智能训练和推理产品迭代到第二代的科技企业。凭借其明确的技术规划路线、强大的研发实力和精准的工程交付能力,燧原科技已成为人工智能基础设施商用落地的先行者。

自 2018 年成立至今,仅四年的时间,燧原科技已推出了基于邃思 2.0 芯片的第二代云端 AI 训练产品 “云燧 T20/T21” 和基于邃思 2.5 芯片打造的 AI 推理产品”云燧 i20”,以及配套的 “驭算” 软件平台。并在产品迭代中,不断探索商业落地,创造丰富的行业应用实践。