能源行业AI大模型工程化实践研究
王宇航 史翔 申一彤
(中电信数智科技有限公司,北京 100035)
摘要:随着全球能源转型加速,低碳化、智能化成为能源行业发展的核心方向。人工智能(Artificial Intelligence,AI)技术凭借强大的数据分析、预测优化和智能决策能力,正在深刻改变能源行业的生产、传输与消费模式。近年来,AI大模型(如GPT、BERT等)在自然语言处理、图像识别等领域取得突破性进展,在能源行业的应用潜力逐渐显现,然而其在工程化落地方面仍面临技术适配性、数据质量、算力成本等多重挑战。聚焦AI大模型在能源行业工程化落地关键环节,结合行业趋势、技术应用、典型案例等研判分析,提出系统化的实践路径解决方案。
关键词:能源行业;人工智能;大模型;工程化实践
0 引言
传统能源行业面临管理粗放、系统协同低效和新能源消纳不足等挑战,亟需技术创新推动全要素生产率跃升。以ChatGPT、DeepSeek为代表的人工智能(Artificial Intelligence,AI)大模型正重塑能源系统决策逻辑,为产业智能化转型提供新范式。构建能源领域垂直大模型,可整合地质勘探、设备运维和电网调度等多源数据,实现生产精准预测、故障智能诊断和供需动态优化等突破。然而,能源数据具有异构性强、实时性高和安全要求严等特点,现有大模型在适配性、可解释性和部署效率方面仍存在局限。当前,能源企业对AI大模型的应用能力差异显著,政策与市场支撑体系尚不完善,其工程化应用仍处于初期探索阶段。
1 政策引领及技术突破驱动AI发展演进
1.1 政策引领AI产业发展新征程
在国家战略层面,AI已成为驱动产业变革的核心引擎。中央经济工作会议将“人工智能+”行动纳入2025年重点任务,通过顶层设计推动产业深度转型。政策体系构建围绕三大维度展开。标准引领层面,计划到2026年制定50项以上国家/行业标准,参与20项国际标准制定,推动中国AI标准体系与国际接轨,并培育超1 000家标准实施示范企业[1];基础设施方面,深圳开放智算中心于2024年建成运营,具备4 000 PFLOPS算力规模及30 000 PFLOPS调度能力[2],为大规模AI研发提供算力支撑;场景落地方面,重点推进40个“城市+AI”示范项目,涵盖智能电网、智慧医疗等垂直领域,加速技术产业化进程。国务院国资委实施“双219”部署,要求央企将AI纳入“十五五”规划核心,2024年首批10家央企开放应用场景,2025年聚焦芯片、框架等“根技术”突破,强化算力基建与行业数据集建设。政策导向明确从“规模扩张”转向“价值创造”,重点赋能新能源、半导体等战略行业,推动AI从辅助工具升级为决策系统。
1.2 技术驱动AI场景融合新涌现
AI技术突破正重构产业生态格局,从“感知理解世界”向“感知理解世界”演进。第一次浪潮以符号主义和逻辑推理为标志,AI正式诞生,但受限于描述能力,实际应用乏力;第二次浪潮通过专家系统与机器学习步入产业化,却因泛化能力不足而遇瓶颈;第三次浪潮深度学习的突破显著提升泛化能力,推动AI技术爆发;第四次浪潮以AI内容生成为核心,AI从感知理解跃迁至生成创造,如ChatGPT展现的自然语言与多模态能力,2025年DeepSeek、Manus等技术产品的出现正引发新一轮的产业革命。在大模型性能跃升方面,DeepSeek凭借其低成本、高性能特点,在全球AI市场崭露头角,DeepSeek-R1开源模型综合性能比肩GPT-4,技术性任务准确率超人类水平,其训练和推理成本仅为GPT-4的1%和1/30[3],美国麻省理工学院(Massachusetts Institute of Technology,MIT)开源协议推动技术普惠化;智能体技术革新领域,Manus通过自主进化机制实现跨场景泛化,在多行业实现效率跃升与成本变革,根据投行季度财报数据,Manus可将分析响应效率提升至原来的36倍[4],例如在人机协同领域实现“决策-执行”闭环,汽车工厂生产线故障响应时间从3 h缩短至5 min[5];成本结构上,1个Manus年度成本相当于4.2名全职员工,但产出效率是其5倍,重构行业生产力体系,成为行业发展的核心辅助力量[6]。
2 AI大模型行业应用现状分析
当前,AI大模型已在金融、医疗、教育、交通等领域实现深度渗透,展现出显著的产业价值与技术潜力。如表1所示,在金融领域,智能客服与风控系统的高效运作体现了多模态整合与思维链技术的成熟应用,但核心决策仍依赖人工。医疗领域通过联邦学习等技术突破,在影像诊断、药物研发等方面取得成果,但数据隐私与模型可解释性仍是关键瓶颈。教育领域依托离线算力中心与多模态工具,实现教学效率跃升,而本地化算力需求成为规模化应用的制约因素。交通领域借助数字孪生技术显著提升运维效率,但全链路智能化整合仍需突破。
表1 AI大模型典型行业应用分析
能源行业AI大模型应用进入初步工程化落地实践探索阶段,主要聚焦生产优化、电网管理、勘探开发及客户服务四大方向,例如国家电网部署千亿级光明电力大模型优化电网调度与故障预测,中国石油700亿参数昆仑大模型覆盖勘探开发全流程。在实践路径上,企业普遍采用“AI大模型+场景”模式,但在探索过程中面临以下瓶颈:数据层面存在“跨企业孤岛”与高质量样本不足问题,约62%企业受限于数据治理能力[14];算力层面存在高性能图形处理单元(Graphic Processing Unit,GPU)短缺与能耗矛盾,单次AI大模型训练耗电达600 MWh[15];技术层面存在模型可解释性差与安全风险,能源交易等关键场景对决策透明度要求严苛。这些挑战阻碍AI大模型在能源系统的深度渗透,亟需通过关键技术支撑构建数据治理及共享机制、突破算力瓶颈、完善可信AI体系等,以深化推进AI大模型从扩展工具向核心应用的跨越式发展。
3 能源行业AI大模型工程化核心技术支撑
3.1 数据治理与预处理
在能源行业中,数据的多源异构特性尤为显著,这既为AI大模型的应用提供了丰富的信息资源,同时也带来了数据处理上的挑战。由于数据来源广泛,包括传感器网络、物联网设备、企业资源规划系统(Enterprise Resource Planning,ERP)等,数据的格式、质量和时效性差异巨大。因此,构建统一的数据标准和清洗机制成为确保AI大模型性能的关键步骤。通过数据标准化,可以实现不同数据源之间的互操作性,而数据清洗则能有效去除噪声、重复和错误数据,保证数据的准确性和完整性。此外,能源行业对数据隐私和安全的要求极高,因为数据泄露可能导致严重的安全事故或经济损失。采用多方计算、联邦学习等隐私计算技术可以在不直接共享数据的情况下进行模型训练,通过合理选择协议和冻结策略,联邦学习可在保证隐私的前提下提升模型性能,是保障分布式训练效率与模型收敛的关键,实际应用中可根据数据分布、资源限制等灵活调整。通过在本地设备上进行模型训练,然后将模型参数上传至中央服务器进行聚合,这样既保证了数据的隐私性,又实现了数据资源的有效利用[16]。
3.2 模型适配与优化
通用AI大模型虽然在许多领域表现出色,但在面对能源行业的特殊需求时,往往需要进行定制化改造。能源行业的数据特点和应用场景要求模型不仅要具备高精度的预测能力,还要能够在有限的计算资源下高效运行。因此,开发轻量化模型成为一种有效的解决方案。轻量化模型通过减少模型的复杂度和参数数量,降低了算力需求,同时保持了较高的性能。除此之外,增强模型的可解释性和鲁棒性也是模型适配与优化的重要方面。在能源行业中,模型的决策过程需要透明可解释,以便工程师和管理人员能够理解和信任模型的输出。通过引入局部可解释模型(Local Interpretable Model-agnostic Explanations,LIME)和SHapley可加性解释模型(SHapley Additive exPlanations,SHAP)等可解释性AI技术,可以使模型的决策过程更加透明[17]。同时,提高模型的鲁棒性,使其能够抵抗输入数据的扰动和噪声,对于确保模型在实际应用中的稳定性至关重要。另外结合强化学习和迁移学习技术,可以使模型更好地适应能源系统的动态变化。强化学习通过与环境的交互来学习最优策略,适用于需要实时决策的能源管理系统。迁移学习则可以利用在一个领域学到的知识来改善另一个领域的模型性能,有助于处理能源行业中不同场景和任务之间的共性问题。
3.3 算力基础设施
AI大模型的训练和推理过程对算力的需求极大,尤其是在处理复杂的能源系统模型时。为满足这一需求,能源企业需要构建高效的算力基础设施。边缘计算和云计算的结合提供了一种灵活的解决方案。边缘计算节点可以部署在靠近数据源的地方,进行实时的数据处理和分析,减少了数据传输的延迟,提高了系统的响应速度。云计算平台则提供了强大的计算资源,适用于大规模的数据处理和模型训练。随着全球对环境保护的重视,利用绿色算力技术减少碳足迹也成为算力基础设施建设的一个重要方向。通过采用可再生能源供电(如太阳能和风能),不仅可以降低能源消耗,还能减少温室气体排放,实现经济效益和环境效益的双赢[18]。
3.4 安全与可靠性保障
能源系统的安全性直接关系到社会的稳定和人民的生活质量,确保AI大模型的安全性和可靠性至关重要。对抗样本检测和模型审计是提升模型安全性的有效手段。对抗样本检测可以识别和防御针对AI模型的恶意攻击,而模型审计则可以对模型的训练过程和结果进行审查,确保模型的决策过程符合安全规范。此外,建立容错机制和备份系统是保障模型运行可靠性的重要措施。容错机制可以在模型出现故障时自动切换到备用方案,保证系统的连续运行。备份系统则可以防止数据丢失和模型损坏,确保在发生意外情况时能够迅速恢复服务。通过这些技术手段,可以提高AI大模型在能源行业应用中的安全性和可靠性,为能源系统的稳定运行提供坚实的技术支撑[19]。
4 能源行业AI大模型工程化实践关键环节
AI工程化整体流程涵盖规划设计、训练推理和应用落地三个阶段(如图1所示)。在规划设计阶段,首要关注企业战略和业务目标选择,围绕全链路规划展开需求分析,包括业务目标分析、AI应用场景分析、数据需求分析、技术可行性及算力需求分析等。同时,基于AI原生(AI Native)的系统方案设计强调业务需求理解、数据治理、模型优化与部署以及监控与运维的重要性,遵循以AI为核心、数据优先、持续学习与迭代、自适应与个性化等设计原则。在训练推理阶段,针对通用AI大模型存在的“有幻觉、成本高”等问题,行业、领域AI大模型成为落地“人工智能+”的有效手段,企业需根据自身情况选择开发L1行业模型或L2场景模型,并依托成熟工具平台支撑数据集工程交付能力,同时注重模型体系设计与选择、训练及调优以及推理优化及评估等关键环节。在应用落地阶段,智能体应用为AI大模型应用落地提供技术化手段,通过构建检索增强生成(Retrieval-Augmented Generation,RAG)知识库解决私域数据利用及实时性问题,同时智能体构建的技术方法手段多样,包括通过开发框架直接开发和基于智能体使能平台构建应用,且智能体全生命周期可观测体系和集群全生命周期管理体系为企业AI应用的稳定运行和持续优化提供保障。
图1 AI大模型工程化实践流程与环节
4.1 规划设计阶段
4.1.1 需求分析
需求分析是AI大模型工程化的起点,需围绕能源企业战略目标展开全链路规划。首先明确业务目标,例如通过AI大模型优化能源生产调度,目标是提升发电效率提升、降低能耗成本;通过预测性维护减少设备故障率,目标是减少非计划停机时间。其次,深入分析AI大模型应用场景,细化需求清单,例如在智能巡检中需支持无人机+传感器多模态数据融合,日均处理上万条设备运行数据;在能源交易中需实现动态价格预测,预测准确率提升至90%[20]。数据需求分析需确认数据类型、来源及质量标准,确保数据全面且无偏差,尤其关注数据时效性。技术可行性分析需评估AI大模型是否支持能源行业特定功能,如时间序列预测、设备故障诊断等,并验证其在现有IT环境中的兼容性。算力需求分析需综合考虑中央处理单元(Central Processing Unit,CPU)、GPU、通用算力与现场可编程门阵列(Field-Programmable Gate Array,FPGA)、专用集成电路(Application-Specific Integrated Circuit,ASIC)异构算力的配置,结合能源生产峰谷特性制定弹性扩展方案,例如在用电低谷期进行批量训练任务。最后进行成本与安全分析,估算数据采集、模型训练、推理部署等全流程成本,并开展数据加密、访问控制等合规性审查,确保符合能源行业数据安全标准。
4.1.2 方案设计
方案设计以AI Native理念为指导,构建端到端的能源行业AI系统架构。其中算力基础设施设计应采用混合云架构,核心训练任务部署在高性能计算集群,推理任务迁移至边缘节点。数据集建设方案需涵盖数据采集、清洗、标注、增强全流程,重点解决能源数据稀缺问题,例如通过生成对抗网络(Generative Adversarial Network,GAN)扩充设备故障样本集,或利用时序插值技术补全缺失数据。模型选择与优化需根据业务场景匹配模型类型,例如在负荷预测中选用长短期记忆网络(Long Short-Term Memory,LSTM)/Transformer架构,在设备故障诊断中采用Vision Transformer(ViT)模型,并通过模型蒸馏、剪枝等技术压缩模型体积。智能应用构建需集成多模态交互能力,例如通过语音+图像双模态技术实现巡检机器人自主识别设备异常。安全与隐私保护设计需贯穿全链路,采用联邦学习实现跨区域数据协作,根据参与方协作方式、数据分布及场景应用特点,选择横向联邦、纵向联邦、联邦迁移学习等不同协议类型,从而制定动态冻结、静态冻结、客户端自适应冻结等冻结策略;敏感数据通过同态加密技术保护,同时建立动态权限管控机制,防止数据泄露。
4.2 训练推理阶段
4.2.1 数据集构建
构建高质量数据集是能源行业AI大模型性能的基础保障,需遵循“全面性-一致性-可解释性”原则。数据收集阶段需整合多源异构数据,例如汇聚数据采集与监视控制(Supervisory Control And Data Acquisition,SCADA)系统实时运行数据、气象站历史天气数据、地质勘探报告等多模态数据,形成跨模态数据池。数据清洗需去除噪声与冗余信息,例如通过规则引擎过滤异常传感器数据,利用聚类算法剔除重复设备运行记录。数据标注需引入主动学习机制,优先标注不确定性高的样本,将标注成本降低40%以上[21]。针对特定任务构建专用数据集,例如在光伏发电场景中需包含光照强度、温度、阴影遮挡等多维特征数据,在输电线路巡检中需标注杆塔缺陷的像素级位置。预训练数据集注重规模与多样性,需覆盖不同能源类型和气候条件;微调数据集强调领域特异性,例如在核电站安全监控中需包含典型事故案例库。数据动态更新机制需定期引入增量数据,例如每日同步新能源电站发电量预测数据,确保模型对环境变化的敏感性。
4.2.2 模型训练与推理
模型训练需根据任务特性选择优化策略,预训练阶段采用大规模分布式训练框架,支持百亿级参数模型的高效训练;微调阶段应用大模型的低秩自适应(Low-Rank Adaptation,LoRA)技术冻结主干网络,仅更新少量参数,即可实现显存占用大幅度降低。推理优化需结合能源行业硬件特性选择框架,如云端推理采用TensorRT加速,推理延迟降至毫秒级别,满足实时性需求;边缘端部署开放神经网络交换(Open Neural Network Exchange,ONNX)推理引擎,支持INT8量化,能耗显著降低,适应智能终端的低功耗要求。针对特定场景开发定制化推理引擎,例如在光伏电站故障诊断中集成梯度加权类激活映射(Gradient-weighted Class Activation Mapping,Grad-CAM)可视化模块,解释模型决策依据。模型评估需建立多维度指标体系,分类任务采用F1分数,回归任务使用均方根误差(Root Mean Square Error,RMSE),同时引入业务相关性指标。持续学习机制通过在线学习框架实现模型动态更新,例如在电力市场价格波动时自动调整预测模型参数,确保模型在数据分布变化时保持性能稳定。在AI大模型落地过程中,选择先做L1行业模型还是先做L2场景模型,需根据业务目标、资源分配、市场需求和技术能力进行综合评估。
4.3 应用落地阶段
4.3.1 RAG知识库构建
RAG知识库通过整合结构化与非结构化数据,解决能源行业AI大模型的实时性与专业性问题。知识预处理阶段需构建领域本体库,定义实体关系,并开发数据清洗规则,去除冗余文档。数据处理采用双轨制流程:结构化数据通过ETL工具抽取特征,非结构化数据经BERT分词后生成向量索引,存储于Milvus向量数据库。检索模块采用混合索引技术,支持百亿级文档的秒级检索,召回准确率提升至95%[22]。知识增强模块集成Function Call接口,调用外部应用程序编程接口(Application Programming Interface,API)获取最新资讯,例如接入气象预报服务实时更新风能/太阳能发电预测模型。版本管理机制记录知识库更新日志,支持A/B测试验证知识有效性,典型应用场景包括智能调度系统日均处理上万条设备运行数据,故障诊断助手覆盖90%以上常见设备故障模式[23]。
4.3.2 智能体构建
智能体通过多主体协作实现能源行业复杂任务分解与执行。架构设计采用“中心化调度+去中心化执行”模式,中央控制器基于强化学习算法优化任务分配策略,边缘智能体自主完成子任务。大语言模型(Large Language Model,LLM)核心引擎支持上下文感知推理,通过记忆网络模块存储历史交互信息,实现跨轮次对话连贯性。开发框架提供低代码接口,支持拖拽式创建智能体,典型应用包括新能源电站巡检机器人集群,单日处理设备异常报警量达1万次[23]。全生命周期管理体系涵盖需求分析、模型训练、部署监控、退役回收4阶段,建立健康检查指标体系。安全管控机制通过沙箱环境隔离敏感操作,日志审计系统记录所有API调用行为,符合ISO 27001合规要求。集群扩展采用Kubernetes自动伸缩策略,根据流量波动动态调整资源池规模,支撑百万级并发访问。
5 大型能源集团AI大模型平台建设案例
为适应技术发展趋势,大型能源集团紧盯油气行业智能化应用发展趋势,积极规划AI建设。采用软硬件一体化模式开展AI大模型平台建设项目,涵盖算力、存储、网络与安全4方面资源。算力资源方面,通算云主机用于通用办公业务,智算服务器承载AI大模型训练;存储资源方面,通算固态硬盘(Solid State Drive,SSD)块存储挂载国产云主机,智算提供充足独立存储空间,满足特定带宽与每秒输入/输出操作次数(Input/Output Operations Per Second,IOPS)需求;网络资源方面,云上互联网带宽供应用访问,高速专线实现智算资源池与内网互通,智算服务器计算节点及计算与存储节点有高速互联;安全资源方面,满足国家等级保护2.0三级标准,从多个维度提供多种安全保障。围绕智能油气田、智能工程、智能工厂、智能贸销、智能供应链、智能管理、智能办公等8大类100多个业务场景模型,聚力实现小模型和大模型兼备、专业场景和通用场景兼容、生产和经营管理全覆盖,支持集团上中下游业务,如图2所示。
图2 大型能源集团AI大模型平台架构
5.1 典型专业场景
注采联动模型:以稳油控水为目标,基于油田20余年积累的海量数据,融合AI与专家经验,通过“智能诊断-方案制定-远程调控”闭环管理,实现精准注水、故障预防和油藏优化,提升油田采收率、延长设备周期推动降本增效。
安全钻井模型:运用机器视觉技术构建智能化安全监控体系,可快速识别海洋钻完井作业风险,显著降低不安全行为发生率,替代传统人工巡检、紧盯监控画面的传统模式,有效保障作业人员安全,同时提升作业效率与质量,为海洋油气开发提供智能化支撑。
油气贸销模型:融合AI技术,实现液化天然气(Liquefied Natural Gas,LNG)价格智能预测、进口通关提速、物流运输智能监管和油气销售精准营销,在资源采购环节,率先研发LNG现货价格智能预测系统,采购效率多维度提升,返税周期显著缩短、违规情况大幅减少。
5.2 典型通用场景
智能招采场景:聚合内外部数据,实现企业实力评估与风险筛选,几分钟内生成招标文件初稿,支持标书比对与自动评分,快速识别异常行为,显著提升招标编制和评标效率。
智能写作场景:通过自然语言处理技术,实现素材搜索、智能排版、辅助创作、精准校对等功能,对于在多类型文章写作方面需求大的员工可极大提升文档处理效率和准确性。
智能会议场景:利用语音识别、声纹识别和AI大模型等技术,实现实时转写与翻译、录音转写、智能摘要和纪要生成等功能,有效解决了会议记录难整理和效率低下的问题,确保会议纪要的及时输出和质量提升。
6 结束语
AI大模型工程化落地是能源行业转型升级的核心驱动力,也是AI产业纵深发展的关键环节,但目前仍面临多重挑战。技术层面,能源数据因多源异构、隐私性高需构建标准化治理体系,通用AI大模型难以适配行业特殊场景,亟需开发轻量化、可解释的定制化模型;政策层面,专项激励政策与标准规范缺失,导致技术转化动力不足;市场层面,企业接受度低、投资回报机制模糊制约规模化应用。破解路径包括通过联邦学习等技术强化数据安全,开发融合物理规律的行业AI大模型;制定财税补贴、场景开放等政策,建立能源AI标准体系;构建“政产学研用”协同生态,推动技术-产业闭环。未来,AI大模型工程化将从单点创新转向全链条落地,以多模态AI大模型加速跨领域融合、边缘计算提升实时决策能力、绿色算力降低应用成本为主要趋势,AI大模型将深度赋能能源生产优化、助力碳达峰碳中和目标实现,同时为智能制造、智慧城市等领域提供范式参考,释放万亿级经济社会价值。
Research on engineering practices of large-scale AI models in energy sector
WANG Yuhang, SHI Xiang, SHEN Yitong
(China Telecom Digital Intelligence Co., Ltd., Beijing 100035, China)
Abstract: Amidst the accelerating global energy transition, decarbonization and digitalization have emerged as central priorities for the energy industry. Artificial Intelligence (AI) technologies, leveraging their robust capabilities in data analytics, predictive optimization, and intelligent decision-making, are profoundly transforming production, transmission, and consumption patterns in the energy sector. While recent breakthroughs in large-scale AI models (such as GPT, BERT, etc.) for natural language processing and computer vision demonstrate growing potential for energy applications, their industrial deployment faces multifaceted challenges including technical compatibility, data quality, and computational costs. This study investigates critical implementation aspects of large-scale AI models in energy systems, integrating analysis of industry trends, technological applications, and representative case studies to propose systematic solutions for practical adoption.
Keywords: energy sector; artificial intelligence; large-scale models; engineering practices
本文刊于《信息通信技术与政策》2025年 第6期
作者简介
王宇航:中电信数智科技有限公司智慧城市研究院解决方案专家,工程师,长期致力于人工智能、大数据、数字孪生等新一代信息技术在数字政府、智慧城市的应用研究。
史翔:中电信数智科技有限公司智慧城市研究院解决方案部门负责人,主要从事数字政府、智慧城市及新技术、新业务的研究与咨询工作。
申一彤:中电信数智科技有限公司智慧城市研究院院长助理,长期负责城市及企业数字化转型研究及市场推广工作。
论文引用格式:
王宇航, 史翔, 申一彤. 能源行业AI大模型工程化实践研究[J]. 信息通信技术与政策, 2025, 51(6): 52-59.
评论