当前位置: 首页 > 电网 > 技术创新

打造数据安全核心能力 护航能源数字化转型

国家电网报发布时间:2021-09-09 13:27:15  作者:石聪聪 高先周 杨如侠

  

  近年来,数字经济快速发展,数据已成为关键生产要素。国家电网有限公司运营的数据体量大、类型多、敏感程度高,数据安全责任重大。

  公司顺应能源革命与数字革命融合发展趋势,通过数字化促进电网智能化升级,推动电网向能源互联网升级。电力数据作为生产要素,是推进能源数字化转型、构建新型电力系统的关键资源。数据的价值在于流动,而数据的流动和开放共享将不可避免带来合规挑战和泄露风险,如何在保障数据安全的基础上促进数据开发利用,成为企业面临的重要课题。

  数据流动和共享频繁,电力数据安全面临挑战

  ● 数据安全及个人信息保护监管升级,电力数据应用面临合规挑战

  9月1日,我国首部关于数据安全的专门法律——《中华人民共和国数据安全法》正式施行。《中华人民共和国个人信息保护法》也将于11月1日施行。随着数据安全及个人信息保护法律体系的日臻完善,电网企业在数据安全、个人信息保护方面的义务更加明确。

  电力数据既是电网企业的战略资源和核心生产要素,也能直接反映经济运行、社会民生、产业运转、客户信用等情况。近年来,公司各单位围绕数字化转型,开展电力大数据应用及价值挖掘,推出“电力看经济”“电力看环保”“电力大数据征信”等数据产品和服务。同时,电力数据包含企业海量重要数据和高敏感用电客户隐私信息,关系个人、企业甚至国家利益。在电力数据使用、处理、共享等过程中,务必严格遵守国家法律法规要求,把安全合规作为前提条件,确保企业重要数据和客户隐私安全。

  ● 电力数据开放共享、广泛流动,数据泄露风险将增加

  能源互联网广泛融合能源生产、传输、交易、消费等各环节数据,促进能源客户、政府、行业伙伴、供应商等能源供给侧、消费侧的数据汇聚共享和协同应用。综合能源服务、新能源云、智慧车联网等新型业务不断涌现,也促进了电力数据多方共享应用,拓展了电力数据的应用场景、交互对象和渠道。

  随着提升多场景、多主体数据应用价值成为共识,全社会对数据开放共享的需求日益迫切,数据跨系统、跨边界、跨组织流动也更加频繁。开发共享环境下,数据在采集、存储、传输、利用、交易和销毁等全生命周期中,所有权与管理权分离,多系统、多环节的信息隐性留存,极易造成隐私保护和数据安全方面的重大风险。

  ● 传统安全技术难以有效应对开放环境下的数据安全保护难题

  随着现代信息技术和能源技术深度融合,新业态、新模式蓬勃发展,电力数据业务环境将更加开放,系统、业务、组织的边界将进一步模糊。

  数据应用场景复杂化、数据处理技术多样化、参与数据处理的角色多元化,将给数据安全防护带来新问题、新挑战,如多源异构数据保护、数据流动确权及访问控制、数据泄露监测及追踪等。近年来,数据窃取、数据勒索、大数据杀熟、数据滥用等问题日趋严重,重大数据安全事件频发,数据安全面临较大风险。

  随着数据共享和流通成为刚性业务需求,数据安全与数据可用性之间的矛盾凸显。传统加密、隔离等网络安全技术已较难适应数据频繁高速交互流动和不同场景下的差异化保护需求。单纯追求安全会在一定程度上限制数据可用性,单纯追求数据价值而忽略数据安全又可能导致严重的数据泄露风险。

  面向能源数字化转型,开展数据安全技术攻关

  针对能源数字化转型面临的网络及数据安全问题,全球能源互联网研究院有限公司布局“电力全场景网络安全智能防御与攻防对抗关键技术”等攻关方向,加快面向流动共享数据的安全及隐私保护核心技术攻关,支撑能源数字化转型和新型电力系统建设。

  ● 融合人工智能技术,实现敏感数据高效识别

  敏感数据识别和分类分级是数据安全工作的基础。为促进数据在企业内部共享应用,公司发布了各专业负面清单及认定原则。由于电力数据体量大、专业覆盖广、数据类型多,部分专业部门的数据表可能超过数十万张。各单位如果完全依赖人工梳理负面清单,工作量极大,且可能存在主观标准不统一导致的误报、漏报等问题。

  通过深入调研分析,联研院数据安全攻关团队基于自然语言处理(NLP)算法,研制了负面清单智能识别工具。这一工具通过对负面清单规则的充分学习及训练,实现了负面清单快速、精准化识别,解决人工梳理效率低下、准确性低等问题。该工具具备多种自然语言处理能力,已在国网冀北、浙江、江西电力和国网大数据中心等单位成功验证应用,负面清单识别准确率可达97%,大幅度降低了人工梳理成本。

  ● 提出场景化智能动态脱敏技术,保障数据安全

  《中华人民共和国网络安全法》第四十二条提到:“网络运营者不得泄露、篡改、毁损其收集的个人信息;未经被收集者同意,不得向他人提供个人信息。但是,经过处理无法识别特定个人且不能复原的除外。”

  数据脱敏技术通过变形、转化、掩盖等方式处理原始信息、降低敏感程度,在数据采集、传输、使用等环节被广泛采用。传统脱敏技术一般按照预置脱敏规则对敏感数据进行批量脱敏或者对实时访问过程进行脱敏。然而,电力业务场景复杂且迭代快,同一敏感数据在不同的场景下、针对不同角色的用户,脱敏策略都可能动态变化。

  攻关团队结合电网核心业务需求,提出了场景化智能动态脱敏技术,研制了集敏感数据自动化感知、业务场景自动识别、脱敏处理自动完成等于一体的动态脱敏系统。系统可从海量交互数据中快速识别敏感数据,并基于场景状态准确定位业务场景和用户角色,自动匹配脱敏算法。目前,该系统已在能源互联网营销服务系统(营销2.0系统)全面应用,为市场化售电、在线交费、工单处理等50余个典型业务场景2000余个业务访问提供智能化脱敏能力。

  ● 攻克高隐蔽性结构化数据水印技术,实现泄露数据精准溯源

  由于数据具有流动性和可复制性,一旦共享分发后,数据所属权将丧失,造成数据泄露后无法追踪。数据水印技术是追踪泄露的共享数据的有效手段。传统数据水印技术通过将人员姓名、电话等信息显示添加在文件背景中保护版权或进行泄露追踪溯源,一般适用于图片、文档等非结构化文件。此技术对于电力数据中大量的数据表、字段等片段信息(如结构化数据)则无法发挥作用。

  攻关团队攻克了高隐蔽性结构化数据水印技术。该技术通过提取外发数据特征信息生成水印密钥(数据DNA),并采用数值低噪声变换和文本低冗余变换等方式将水印密钥隐性添加至外发数据内容中,确保不被攻击者发现且不影响数据使用。一旦数据泄露发生,即使是片段数据泄露,该技术也可提取水印密钥进行高效精准溯源,溯源准确率超过90%。目前,该技术已广泛应用于公司面向政府、监管机构等第三方单位共享分发数据的场景和公司重要业务系统。

  ● 打造数据安全合规管控平台,提供“一站式”数据全过程保护

  如今,数据资产识别、分类分级防护、数据加密、数据脱敏、泄露追溯等能力成为企业满足新业务发展需求的重要途径。企业在开展数据活动或者数据保护的过程中常常存在一些困惑,如需要哪些安全能力才能满足数据安全合规要求、碎片化的数据安全能力如何与业务场景融合、如何清晰地展示目前数据安全状态等。

  联研院自主研发的“面向流动共享的电力数据安全合规管控平台”提供了创新解决思路。

  电力数据安全合规管控平台以数据安全为核心,采用服务化、组件化方式开展敏感数据识别、数据分类分级、数据脱敏、数据水印等数据安全服务,基于编排技术实现数据安全能力统一管控及业务场景按需调用,具备覆盖数据活动全景的合规监测和风险预警能力,实现静态数据可知、数据使用可控、操作过程可审、泄露数据可溯。该平台目前已在国网大数据中心和国网冀北、安徽电力等单位的不同数据业务场景中应用,实现“一站式”的数据安全保护。

  处理好保护与利用的关系,发挥数据更大价值

  随着能源数字化转型深入推进,数据跨界汇聚融合、共享融通和创新应用日益广泛。如何处理好数据保护与利用之间的关系,平衡效率和风险,已成为能源数字化转型的一道“必答题”。这对数据安全工作提出了更高要求。

  一是尽快树立以数据为中心的安全防护理念,在现有网络安全防御体系的基础上,深化数据加密、数据脱敏、数据防泄露、追踪溯源等技术的场景化应用,构建覆盖数据收集、传输、存储、处理、共享、销毁全生命周期的全场景安全防护体系。

  二是针对数据流动共享过程中的突出风险点和新型数据安全攻击,强化数据安全监测、预警和应急处置能力建设,常态化开展面向数据安全和隐私保护的实战化攻防演练,持续提升攻击风险应对能力。

  三是面向多方数据共享协同安全需要,加快联邦学习、同态加密、多方安全计算等隐私保护新技术的联合攻关及应用,突破制约数据共享利用的技术瓶颈,实现数据“可用不可见”。

  (作者单位:全球能源互联网研究院有限公司)

评论

用户名:   匿名发表  
密码:  
验证码:
最新评论0

相关阅读

无相关信息