芯片资讯
- 发布日期:2024-01-05 12:31 点击次数:134
华为开发者大会 2023(Cloud)在东莞召开。华为发布盘古大模型 3.0,将围绕行业重塑、技术扎根、开放同飞三大创新方向,为行业客户、伙伴及开发者提供更好的服务。
(一)分层解耦:盘古大模型 3.0 是一个面向行业的大模型系列,包括“5+N+X”三层架构。盘古大模型采用完全的分层解耦设计,可以快速适配、快速满足行业的多变需求。
(二)全栈自主:盘古大模型实现了以鲲鹏和昇腾为基础的 AI算力云平台,以及异构计算架构 CANN、全场景 AI 框架昇思 MindSpore、AI 开发生产线 ModelArts 的全栈自主创新,盘古大模型训练效率达到业界主流 GPU的 1.1 倍。
(三)国际领先:根据华为云官网,国际顶级学术期刊《自然》(Nature)杂志正刊发表了华为云盘古大模型研发团队研究成果——《三维神经网络用于精准中期全球天气预报》。
(一)分层解耦
未来盘古大模型能成为每个行业、企业和个人都有自己的专家助手,让工作更轻松。盘古大模型 3.0 是一个面向行业的大模型系列,包括“5+N+X”三层架构:
L0 层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型,提供满足行业场景中的多种技能需求。盘古 3.0 为客户提供 100 亿参数、380 亿参数、710 参数和 1000 亿参数的系列化基础大模型,匹配客户不同场景、不同时延、不同响应速度的行业多样化需求。同时提供全新能力集,包括 NLP 大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力,这些技能都可以供客户和伙伴企业直接调用。无论多大参数规模的大模型,盘古提供一致的能力集。
L1 层是 N 个行业大模型,华为云既可以提供使用行业公开数据训练的行业通用大模型,包括政务、金融、制造、矿山、气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的 L0 和 L1 层上,为客户训练自己的专有大模型。
L2 层为客户提供了更多细化场景的模型,更加专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景,为客户提供“开箱即用”的模型服务。
盘古大模型采用完全的分层解耦设计,可以快速适配、快速满足行业的多变需求。客户既可以为自己的大模型加载独立的数据集,也可以单独升级基础模型,也可以单独升级能力集。在 L0 和 L1 大模型的基础上,华为云还为客户提供了大模型行业开发套件,通过对客户自有数据的二次训练, 芯片采购平台客户就可以拥有自己的专属行业大模型。
(二)全栈自主
大模型的创新不仅仅是模型自身的创新,而是需要全栈的创新,对算力,算子,计算框架及平台进行全面优化。根据中国经济网报道,通过持续研发,目前盘古大模型在性能、深度、架构及数据增强方面均进行了升级。盘古大模型实现了以鲲鹏和昇腾为基础的 AI 算力云平台,以及异构计算架构 CANN、全场景 AI 框架昇思MindSpore、AI 开发生产线 ModelArts 的全栈自主创新,实现极致效能,打造世界 AI另一极。
此外,端到端的技术优化为大模型开发和运行提供分布式并行加速,算子和编译优化、集群级通信优化等关键能力,使盘古大模型训练效率达到业界主流 GPU 的 1.1倍。
同时,昇腾 AI 云服务除了支持华为全场景 AI 框架昇思 MindSpore 外,还支持Pytorch、Tensorflow 等主流 AI 框架。这些框架中 90%的算子,都可以通过华为端到端的迁移工具平滑迁移到昇腾平台。
盘古大模型要帮助每个企业、每个人都拥有自己的专家助手。华为云提供易用可靠的大模型工具套件、汇聚海量多行业场景 API 的开天 aPaaS,以及包含丰富优质课程和技术认证的大模型专属社区,将与开发者及伙伴一起,共同探索盘古大模型与行业结合的创新路径。
(三)国际领先
根据华为云官网,近日国际顶级学术期刊《自然》(Nature)杂志正刊发表了华为云盘古大模型研发团队研究成果——《三维神经网络用于精准中期全球天气预报》。根据华为云官网,这是近年来中国科技公司首篇作为唯一署名单位发表的《自然》正刊论文。《自然》审稿人对该成果给予高度评价:“华为云盘古气象大模型让人们重新审视气象预报模型的未来,模型的开放将推动该领域的发展。”
华为云盘古气象大模型是首个精度超过传统数值预报方法的 AI 模型,速度相比传统数值预报提速 10000 倍以上。目前,盘古气象大模型能够提供全球气象秒级预报,其气象预测结果包括位势、湿度、风速、温度、海平面气压等,可以直接应用于多个气象研究细分场景,欧洲中期预报中心和中央气象台等都在实测中发现盘古预测的优越性。
- 东风岚图与华为达成战略合作2024-01-23
- “存算一体”是大模型AI芯片的破局关键?2024-01-16