(资料图)
当前,国内大模型进展不断。7月7日,在华为开发者大会2023(Cloud)上,华为常务董事、华为云CEO张平安发布了盘古大模型3.0。据他介绍,盘古大模型3.0是一个面向行业的大模型系列,包括“5+N+X”三层架构。
传统的AI开发模式下,一个场景对应一个模型,数据质量差、样本少,模型精度差,并且应用场景相对单一。不同行业、不同场景对AI的需求既复杂且碎片化,每个痛点都需要进行定制化地开发和改造;另一方面,AI算法从理论上能够极大提升产品及服务的价值量,但由于开发过程中存在大量的碎片化因素,不同的应用场景往往需要独立的架构设计与调参,效率相对较低。“小作坊式”的AI开发模式在一定程度上限制了生产力。
从华为盘古大模型的进化路径可以看出,主要分为L0、L1、L2三个阶段。L0指基础大模型,L1是在L0基础上导入行业数据进行训练后衍生出的行业大模型,L2是在L1基础上结合行业细分场景得到的推理模型,上层是在下层的基础上演化而来,层层递进。国金证券认为,华为盘古大模型是一种工业化AI开发的新模式,可以解决小模型的定制化难题,使一个模型应用到多个场景中。
具体来看,其中,L0层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型,包括NLP(自然语言处理)大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力。
L1层是指N个行业大模型,华为云既可以提供使用行业公开数据训练的行业通用大模型,包括政务、金融、制造、矿山、气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的L0和L1层上,为客户训练自己的专有大模型。L2层则提供面向各行业中更细化场景的模型,如先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景等。
公开资料显示,华为盘古大模型于2020年启动研发。2021年4月,华为发布了NLP大模型、视觉大模型和科学计算大模型。此后,盘古大模型在性能、深度、架构方面及数据增强方面持续升级。当前,盘古大模型的核心定位是为各行各业赋能。
会上,张平安分别介绍了盘古大模型在金融、金融、制造、医药研发、煤矿、铁路等诸多行业发挥的价值。
例如,在煤矿领域,盘古矿山大模型已经在全国8个矿井规模使用,一个大模型可以覆盖煤矿的采、掘、机、运、通、洗选等业务流程下的1000多个细分场景,让更多的煤矿工人能够在地面上作业,减少安全事故;在气象领域,原来预测一个台风未来10天的路径,需要在3000台服务器的高性能计算机集群上花费5小时进行仿真。现在基于预训练的盘古气象大模型,10秒内就可以获得更精确的预测结果。
张平安表示,华为的盘古大模型不会写诗,只会做事。它要帮助各行各业,在各个领域都要让AI来赋予它们价值。比如金融、矿山、政务,有很多工作小组都派下去。“我们一直坚持的方向就是‘AI for Industries’”
(文章来源:每日经济新闻)
X 关闭
X 关闭
5月20日,在建的广西最长跨海大桥——龙门大桥东主塔顺利封顶。至此,龙门大桥东、西两岸主塔全部实现封顶,标志着该桥进入缆索系统施工阶
中新网上海3月30日电 (记者 陈静)上海正面临常态化防控以来疫情形势最严峻复杂的挑战,单日新增阳性感染者数量不断刷新纪录。记者30日获
中新网3月30日电 据国家地震台网官方微博消息,中国地震台网正式测定:3月30日18时14分在新疆和田地区皮山县(北纬36 01度,东经77 89度)发
上海市委常委会今天上午(3月30日)举行会议,听取当前疫情应急处置和核酸筛查相关工作汇报,研究部署下一步疫情防控重点工作。市委书记
(抗击新冠肺炎)江苏无锡一男子隐匿行程轨迹被警方立案侦查 中新网无锡3月30日电 (记者 孙权)3月30日,无锡市在“应检尽检”人员核
(抗击新冠肺炎)官方称吉林市疫情扩散势头得到遏制 中新网吉林3月30日电 (记者 石洪宇)记者30日从吉林市政府新闻办召开的疫情防控
中新网唐山3月30日电 (白云水 孟潮)3月30日,河北省唐山市召开新冠肺炎疫情防控工作新闻发布会通报称,3月29日0时至24时,唐山市新增
浙江省嘉兴市秀洲区新型冠状病毒感染肺炎疫情防控指挥部办公室发布通告: 3月30日上午,秀洲区发现1例新冠肺炎阳性感染者,该感染者
今天(3月30日)下午,新疆乌鲁木齐市人民政府新闻办公室召开疫情防控新闻发布会,通报乌鲁木齐市新冠肺炎疫情和疫情防控最新情况。会上
中新网天津3月30日电 (记者 王君妍)记者30日从天津市水务局获悉,为充分发挥河湖长制优势,近日,天津市将南水北调中线天津干线(天津