中国冶金报 中国钢铁新闻
记者 樊三彩 报道
今年初,南钢启动“人工智能百景千模”三年专项行动;4月28日,湖南钢铁集团、湖南移动、华为联合打造的钢铁行业盘古大模型应用全球首发;5月10日,宝钢股份与华为公司成立“钢铁+AI”联合创新中心,此前4月26日,宝钢股份发布AI转型战略……
以大模型为代表的AI技术风起云涌,成为此轮新科技革命的核心推手。钢铁行业也躬身入局,积极拥抱AI大模型有望带来的无限可能。我们不由得思考以下问题:钢铁“AI进化”是盲目跟风,还是确有需要?钢铁企业如何掌握通往未来世界的秘钥?
(樊三彩/策划 郭艺伟/绘)
赋能潜力:
将打造人机协同新模式
斯坦福大学的一项研究表明,在一些专项任务上,人工智能技术的进步已经达到甚至超过人的能力。具体到为钢铁赋能,AI大模型究竟有哪些潜力?
中国钢研科技集团有限公司绿色化智能化技术中心主任张云贵认为,AI大模型可为钢铁行业带来三大层面的改变:一是感知层面。炼、铸、轧各工序在工况感知上都存在一些难题,如高炉等环节还存在“黑箱”,有望通过引入大模型预测技术,在“机理+数据”融合建模方向上取得突破,实现复杂工况感知的“解码”。二是认知层面。虽然现代冶金技术在钢铁生产规律的认知上已经建立了较为完整的理论体系,但仍存在一系列的认知缺陷,如对流程整体运行规律、在亚工序级别上存在一些隐性认知等。“大模型技术的核心特点就是通过学习发现‘隐含的规律’,因此,在流程认知的宏观与微观各层面都可以对大模型抱有期待。”他说道。三是决策层面。“大模型可通过学习实现决策知识和决策流程的某种固化和标准化。更有可能的是,大模型可能从‘模拟决策’最终走向‘自主优化决策’,就像在围棋领域里已经发生的事情一样。”张云贵表示。
在决策层面,国家制造强国战略咨询委员会智能制造专家委员会委员、宝武技术业务专家丛力群同样认为,生成式大模型应用具有巨大的潜在可能性,目前的大模型可以生成文本、图、视频形式的内容,未来也能够以同样或更多样的形式生成具有钢铁特定业务内涵的内容,如一组铁矿石原料配方,针对特定钢种的热轧板坯最佳升温曲线,一组冷轧带钢轧制的设定参数,一个最佳的钢材集批、剪切方案,考虑最佳库存成本和最佳交期约束的余材充当合同计划,一个新钢种的成分配方等。
“大模型对参与钢铁制造的人的帮助可能是最直接有效的。”张云贵表示,目前的大模型技术,可将行业通用知识、企业特定知识、岗位技能知识相结合,帮助员工快速实现技能跃升,实现类似“一人多岗”的目标,这在行业近几年热捧的集控上有很好的结合点。更极限的情况下,可以打造数字员工、超级职工。
在丛力群看来,重构人工岗位功能是智能制造的应有之义,大模型技术的巨大进步提高了人们的期望值。随着AI技术的演进,将有3种不同的人机协同模式:一是嵌入式模式,人类完成绝大部分工作,AI承担点状的工作;二是副驾驶模式,人类和AI合作,共同参与到工作流程中;三是智能体模式,AI完成绝大部分工作。“未来,人类与AI合作的方法是:凡是能够交给AI的,让AI来做,人类只专注于当前AI无法胜任的工作。”他进一步阐释道。
“从企业角度而言,大模型最有用的一点,是通过‘学会’企业核心知识,将钢企从管理到运行层级的模式标准化,成为企业共性治理的基础。”张云贵表示。
拥抱趋势:
投资未来的可能性
钢铁行业积极拥抱AI大模型,是盲目跟风,还是确有需要?
丛力群告诉《中国冶金报》记者,任何技术都需要与实体经济相结合,这是大势、是必然,也是机会。“钢铁行业积极拥抱新趋势值得肯定,因为技术进步必将伴随着行业应用的深化,尤其是AI大模型这种划时代的突破性技术。”他说道。
大语言模型是伴随着数字化技术的迭代发展起来的。数字化技术始于20世纪50年代,先后掀起了10次产业级别的浪潮,本质上都是通过对底层创新的排列组合实现大规模商业化。目前,美国在通用人工智能(AGI)领域领先全球。“而在中国,AI工程化为工业赋能是优先方向。新质生产力发展的迫切需求和丰富的工业场景,使得我们更关注其应用和商业价值。”丛力群表示。
对于当前中国宝武、首钢、中信特钢等龙头钢企纷纷布局AI大模型的做法,丛力群认为:“龙头钢企不关心大模型是不科学的。头部企业往往对一些新概念、新技术理解得更深,也更需要‘从0到1’探索出应用路径,尔后,其他企业只需保持跟随姿态。”
“当前,如果哪家企业说已经用大模型解决了某些关键的问题,且创造了价值,那我们一定要持谨慎态度。”丛力群认为,当下,AI大模型技术本身并未完全成熟,应用至钢铁等垂直领域的路径、方法都处于探索阶段,得出成功应用并取得成果的结论为时尚早。“即使在一些特定的业务场景,如智能检测运维,一些企业已经尝试采用大模型的概念和技术,强化系统在数据中自主学习知识的权重,但仍然处于初级探索阶段。”他说道,“更准确地说,我们是在适应大模型发展的趋势,投资的是未来的可能性。”
正确路径:
场景为王道,数据是关键
通用AI大模型在技术上的进步及社会对大模型应用的高期待,使人们进入了又一个“亢奋期”。不拥抱AI的企业注定会被淘汰,但也不应过分迷信于通用AI。
“聚焦垂直场景、创造价值才是大模型发展的王道。”丛力群认为,目前,AI大模型还难以胜任千行百业的严肃决策类应用需求,从开放闲聊到复杂决策仍有漫漫长路。
当前,提到应用大模型,一些钢铁企业会首先想到要建设一个用于大模型训练的算力环境。其实,对大多数企业而言,自己建设用于大模型训练的算力环境是不现实的,也没有必要。丛力群认为,抛开高端GPU卡受限的因素不谈,建设一个训练足够大尺寸(例如7B参数规模)大模型的算力中心所需要的经费投入就是许多企业难以承受的,一般企业既没能力又无必要。
“钢铁行业发展大模型应坚持‘基础大模型—行业大模型—企业大模型’的分层次发展路径。”丛力群告诉《中国冶金报》记者,具体来说,基础大模型是国家产业发展基础设施的组成部分,可以借助国家“东数西算”工程布局,以国家级的产学研合作机构牵头推进,或由大型科技公司去做;行业大模型在基础大模型基础上,“投喂”行业专业数据进行训练,而汇聚行业的数据将成为模型质量的关键;有了行业大模型的基础,企业可以“喂”以自身特定数据,将其泛化为企业大模型,形成面向具体场景和工作任务的个性化的专有模型。“这是一个更加合理的路径,符合资源最优配置的经济学原理,也体现出我国的体制优势,大家术业有专攻,不会造成资源浪费,同时降低了企业训练大模型的资金成本。”他说道。
大模型的三要素是算力、算法和算料(数据),算力资源和算法技术可以通过合作或获取外部商业资源来解决,而企业自己的数据积累是数据的唯一来源。“不要忽视数据的重要性,数据质量是大模型应用的基础,这或许是当前的最大短板。”丛力群强调。
那么,如何获取高质量数据就成了重中之重。一方面,要全面采集数据。丛力群认为,根据特定任务目标选择性获取数据是传统思维,而训练AI大模型要秉持“大数据思维”,即尽可能采集完整的数据样本。不过,在数据采集完成之后,一般需要通过数据压缩、减量解析等方式提高数据的价值密度,减小数据规模。另一方面,除去通常所说的企业经营数据、设备运转数据等以外,更要注重专家经验数据的采集,我们可以将各领域专家经验视为一种高价值密度的数据,这些数据的采集对于大模型训练更加重要。
“当前,很多钢企恰恰更加需要采集这样完整、系统的数据做支撑,而不是盲目去训练大模型。”他说道。
当前,7B~13B(B=10亿)规模的模型架构已经越来越成熟稳定,这为大模型用于企业创造了必要的技术基础。在工业中应用大模型,企业需要重点关注数据可能存在的问题:一是AIGC(生成式人工智能)的幻觉现象是工业应用所不能接受的。如果用于训练大模型的数据存在问题,生成的虚幻结果将是不可预知、不可重复和不可控的。二是历史数据不完整。现场采集的设备数据存在断点(不连续)、制造管理和运营决策过程中诸多环节的人类经验数据等断续的数据流在工业制造中广泛存在。三是单一企业历史数据样本数量看似庞大,但未必能支撑大模型训练所需。“所有企业都将数据视为核心资产,目前企业间的数据封锁并不支持更广泛数据样本的获得,而单个企业的有限样本数量能否满足大模型训练的基本需求,也是一个有待验证的问题。”丛力群认为。
有业内专家向《中国冶金报》记者补充强调,充分认识数据的重要性是必要的,但与此同时,研发行业大模型还应破除“数据迷信”,即除了数据,大模型的架构设计、训练方法等也十分关键,需将规则、知识、机理等融入进去。