网站介绍
华为的盘古ai大模型是华为云推出的一项人工智能技术。该大模型以"AI for industries"为核心理念,包含了多个领域的大型模型,包括自然语言处理(NLP)大模型、计算机视觉(CV)大模型、多模态大模型、预测大模型和科学计算大模型。
华为盘古AI大模型的目标是建立一个通用且易用的人工智能开发工作流,以赋能更多的行业和开发者,实现人工智能的工业化开发。它已经在煤矿、铁路、气象、金融、代码开发、数字内容生成等领域发挥作用,提升生产效率并降低研发成本。
华为盘古AI大模型的具体细节和技术实现可能需要进一步了解华为云的相关资料和文档。
华为开发者大会2023(HDC.Cloud 2023:华为开发者大会2023_HDC.Cloud2023-华为云 (huaweicloud.com)
一、盘古大模型是干什么的?
3.0 版的盘古大模型是一个面向行业的大模型系列,具有「5+N+X」三层架构:从 AI 能力的基础层,到行业的第二层,再到应用层面向场景的各个接口,华为围绕深耕行业面向开发者持续打造了新的竞争力。
华为盘古大模型
第一层 L0 层:是盘古的 5 个基础大模型,包括自然语言大模型、视觉大模型、多模态大模型、预测大模型、科学计算大模型,它们提供满足行业场景的多种技能。
第二层 L1 层:是 N 个行业大模型,既可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等;也可以基于行业客户的自有数据,在盘古的 L0 和 L1 上,为客户训练自己的专有大模型。
第三层 L2 层:是为客户提供更多细化场景的模型,它更加专注于某个具体的应用场景或特定业务,为客户提供开箱即用的模型服务。
二、盘古大模型申请入口:
盘古大模型申请已经开放,用户可以进入盘古大模型官网申请体验,下面是申请入口:https://pangu.huaweicloud.com/
盘古大模型3.0申请地址:https://pangu.huaweicloud.com/
三、盘古AI大模型主要模型:
1、盘古NLP大模型
盘古NLP大模型可用于内容生成、内容理解等方面,并首次使用Encoder-Decoder架构,兼顾NLP大模型的理解能力和生成能力,保证了模型在不同系统中的嵌入灵活性。在下游应用中,仅需少量样本和可学习参数即可完成千亿规模大模型的快速微调和下游适配。2019年权威的中文语言理解评测基准CLUE榜单中,盘古NLP大模型在总排行榜及分类、阅读理解单项均排名第一,刷新三项榜单世界历史纪录;总排行榜得分83.046,多项子任务得分业界领先,是目前最接近人类理解水平(85.61)的预训练模型。
2、盘古CV大模型
盘古CV大模型可用于分类、分割、检测方面,也是首次实现模型按需抽取的业界最大CV大模型,首次实现兼顾判别与生成能力。基于模型大小和运行速度需求,自适应抽取不同规模模型,AI应用开发快速落地。使用层次化语义对齐和语义调整算法,在浅层特征上获得了更好的可分离性,使小样本学习的能力获得了显著提升,达到业界第一。
3、盘古多模态大模型
盘古多模态大模型融合语言和视觉跨模态信息,实现图像生成、图像理解、3D生成和视频生成等应用。优势在于原生支持中文,拥有更佳中文理解能力。
4、盘古预测大模型
面向结构化数据,基于神经网络Transformer架构,可用于工艺指标预测、销售预测、财务异常检测等应用场景。
5、盘古科学计算大模型
面向气象、医药、水务、机械、航天航空等领域,使用AI模型更快更准的解决科学计算问题。
6、盘古气象大模型
盘古气象大模型实现气象预报精度首次超过传统数值方法,速度提升1000倍,提供秒级天气预报,例如重力势、湿度、风速、温度,气压等变量的1小时-7天预测。国际顶级学术期刊《Nature》正刊北京时间7月6日发表了华为云盘古大模型研发团队独立研究成果——《三维神经网络用于精准中期全球天气预报》
7、盘古药物分子大模型
华为云盘古药物分子大模型,赋能药物研发的全链条任务,旨在帮助医药企业机构显著提升药物研发的效率。
四、盘古大模型有什么用?
华为云盘古大模型3.0已在煤矿、铁路、气象、金融、代码开发、数字内容生成等领域发挥作用,提升生产效率、降低研发成本。
华为云盘古大模型的核心定位是为各行各业进行赋能,分为三个层级:L0、L1、L2。不同的层级对应着人工智能深入到行业中的不同阶段,而在未来,一定是AI为垂直行业带来新的变革。
盘古大模型本质是解决传统AI开发的难题,包括作坊式开发、样本标注、代价大、模型维护困难、模型泛化不足、行业人短缺等难题。数据显示,2022年华为云盘古大模型主要在做AI for Industries(AI 赋能产业),例如视觉大模型已经在工业质检、缺陷检测、电力巡检等100多个场景得到验证。
相关资讯:
华为宣布在4月推出“盘古大模型”AI人工智能
流量统计
- 7天
- 30天
- 90天
- 365天
猜你喜欢
AGI-Eval
AGI-Eval是什么AGI-Eval是上海交通大学、同济大学、华东师范大学、DataWhale等高校和机构合作发布的大...PubMedQA
PubMedQA是什么PubMedQA是专门用在生物医学研究问题回答的数据集。PubMedQA通过文献摘要回答“是/否/...LLMEval3
LLMEval是由复旦大学NLP实验室推出的大模型评测基准,最新的LLMEval-3聚焦于专业知识能力评测,涵盖哲学、经...HELM
HELM是什么HELM全称Holistic Evaluation of Language Models(语言模型整体评估...H2O EvalGPT
H2O EvalGPT 是 H2O.ai 用于评估和比较 LLM 大模型的开放工具,它提供了一个平台来了解模型在大量任务...MMBench
MMBench是什么MMBench是多模态基准测试,由上海人工智能实验室、南洋理工大学、香港中文大学、新加坡国立大学和浙...OpenCompass
OpenCompass是什么OpenCompass是上海人工智能实验室(上海AI实验室)于2023年8月正式推出的大模型...FlagEval
FlagEval是什么FlagEval(天秤)是北京智源人工智能研究院(BAAI)推出的科学、公正、开放的大模型评测体系...SuperCLUE
SuperCLUE是什么SuperCLUE 是针对中文大模型的综合性评测基准,能全面评估模型在多个维度上的性能表现。Su...CMMLU
CMMLU是什么CMMLU是综合性的中文评估基准,专门用在评估语言模型在中文语境下的知识和推理能力,涵盖从基础学科到高级...Open LLM Leaderboard
Open LLM Leaderboard是什么Open LLM Leaderboard 是最大的大模型和数据集社区 Hu...MMLU
MMLU 全称 Massive Multitask Language Understanding,是一种针对大模型的语言...
- 关注我们
-
扫一扫二维码关注我们的微信公众号
- 网址推荐
- 热门标签
-
- 游戏(4428)
- 街机游戏合集(4329)
- 街机游戏(4329)
- 在线游戏集合(4329)
- 街机在线(4329)
- nes合集游戏(4328)
- 在线小游戏网站(4328)
- 游戏榜(4328)
- 红白机游戏盒(4328)
- 小霸王游戏(4328)
- GBA(1796)
- 街机(555)
- 动作冒险(400)
- 青檬花园(374)
- 角色扮演(354)
- 动作(341)
- 汉化(332)
- SFC(328)
- 运动比赛(321)
- 深度导航(309)
- 小游戏(302)
- 射击(292)
- AIGC导航(277)
- 国内精选服务商(255)
- 中文(245)
- 冒险(239)
- 工具达人(239)
- AI写作工具(232)
- 平台(219)
- 格斗(212)
- 视频(198)
- 翻译(186)
- 人工智能(172)
- 动漫(159)
- 的(153)
- Video(152)
- 数字人(151)
- ppt(137)
- 数据分析(137)
- 文生图(134)
- logo(133)
- 飞行射击(128)
- AI智能体(126)
- 赛车(124)
- 一起用AI(123)
- 电商(119)
- 其他(119)
- 思维导图(113)
- OpenI(113)
- Code(105)