近日,在2023中关村论坛——数据安全治理与发展分论坛上,冯登国院士做了主题为:《数据安全新方向:数据使用安全》的分享,以下是分享全文。
各位专家,各位嘉宾,大家好:
很高兴有这个机会与大家进行交流一下对数据安全的一些认识,发言题目是《数据安全新方向--数据使用安全》。
数据使用安全实际上已经告诉了大家所有的信息,就是谈谈当前数据安全这个新方向,就是数据使用安全。
因为数据安全这概念是相对比较古老的,我的报告主要是包括如下几部分内容,数据是数据时代的基础性战略资源与关键性生产要素,随着国家数据战略的深化,数据要素呈现出加速整合与互联互通的这个趋势。
数据安全需求凸显,另外一点就是数据安全法、个人信息保护法于2021年落地实施,如何平衡数字的经济的发展与重要数据安全、个人隐私保护已经成为现实的挑战。
那么什么是数据安全,在数据安全法里边给了这个定义,首先给了一个数据的这个定义,数据就是任何以电子或者其他方式对信息的记录。
那么这句话的含义是什么呢?就是数据是信息的载体。那么信息呢?是数据的内涵。
那么数据安全就是通过采用必要措施确保数据处于有效保护和合法利用的状态以及具备保障持续安全状态的这种能力,那么这就是数据安全。
当然我这里谈的主要是电子化和数字化的这种数据,数据是有生命周期的,从它的产生到它最后的销毁,那么有很多环节,当然在我们的数据安全法里边,是这样定义这几个环节的,它主要是从数据处理来定的这么几个环节,不管怎么去讲,它是有这个生命周期的。
在我们保护的时候,它每一个环节都要进行保护,因为每个环节都可能遇到这个不同的安全威胁,数据安全现在有哪些主要的威胁呢?这里做了一个归纳,主要有这么几个方面。当然也有的归纳的不同,但是这些方面呢,是现在大家比较关注的。
第一个就是数据泄露,那么这个就是通过偷取和窃听,那么可能造成数据泄露,也可能通过流量的分析,也可能造成数据泄露,也可能通过公开的数据分析,那么造成数据泄露。
第二方面就是数据破坏,比如被篡改可能造成破坏,比如系统跟设备感染病毒蠕虫,也可能导致这个数据破坏,那么电磁感染,也可能导致数据破坏。
第三个方面就隐私泄露,通过数据的分析处理跟推理,这些手段可能获得个人的隐私,泄露包括用户的身份,包括社交关系属性、轨迹等等。
第四个方面就是数据的失控,比如说新的这种处理模式,应用模式,尤其是像云计算这种模式,那么它可能会导致用户的数据失控。
第五个方面,像数据滥用,包括非法使用,非授权使用或者越权使用,也包括数据的垄断。
第六方面就数据损坏或丢失,那么可能存储的这个硬盘,那么存储设备损坏造成的,也可能人为操作造成的,也可能自然灾害造成的,那么等等。
那么大数据时代的数据安全,那么不仅包括传统的像这种机密性、完整性、可用性,也包括隐私性跟敏感性。
大家可能讲到现在讲隐私性比较多,隐私性我们主要强调的是个人的隐私,但是敏感性它就范围更广一些,不仅包括防止数据泄露的这种隐私性跟敏感性,而且也包括数据分析的隐私性跟敏感性。
那么另外一个数据安全问题的解决,离不开配套的法规政策支持以及严格的管理手段,但更需要有可信赖的技术手段来支撑。
那么第三点就是要从技术角度来看数据,既包括像密码控制、访问控制、信息流控制、推理控制和隐私控制这些控制手段,也包括像容灾备份,数据恢复这些实用的方法。
近年,也涌现出了一大批数据安全新技术,比如密文计算技术、基于风险分析的访问控制技术、具体高效的安全多方计算技术、抗量子计算安全技术,差分隐私保护技术等等。
这些都是近年来在数据安全领域涌现出的一些新技术,从体系上来讲,我们要构建这样的技术体系,实际上是一个矩阵式的技术体系。
我们要从生命周期作为出发点,有一些技术是有共性的,比如说测评、检查、合规,包括安全监管,那么这些是共性的。
那么对于每一个环节,比如说数据产生环节,它有它的技术,比如数据采集有他自己的技术,数据存储环节也有自己的技术,这样就构成了一个矩阵式的技术体系。
那么从另外一个角度维度来看,我们可以面向数据全生命周期,关心三个方面的关键技术,一个是安全防护,第二个是安全治理,第三个是安全威慑。
防护主要是来支撑金融等应用,治理主要是来支撑国家监管机构的这种应用,威慑主要是支持国家安全部门的这种应用。
下面就谈谈这个数据安全新方向,也就是数据使用安全。
第一句话就是数据使用安全现在需求迫切,像云计算、大数据等信息应用场景的发展,迫切需要对使用中的数据进行保护。
尤其是针对运用中的那些数据,每一种攻击模式都使用了不同的攻击技术,但是他们的共性是被攻击对象都是使用中的代码或者数据。
那么第二个方面就是移动、物联网等设备数量的不断扩大,迫切需要对使用者的数据进行保护。
数据使用安全也受到了高度的关注,像工业界跟学术界已经发现了多起影响深远的基于内存数据的攻击手段,这些都极大地增加了人们对使用中的数据安全的关注。
那么从2021年的一项调查,我们也看到大家现在非常关注使用中的数据安全,使用安全成为当前数据安全领域的前沿的一个研究方向。
数据保护的时候,主要涉及到三种不同的状态:
第一个是存储时的数据,涉及数据资产安全,它的安全保护措施,主要有加密、访问控制等等,那么这些技术相对比较成熟,但是随着技术跟应用的发展,需要满足它的深入性,包括它的先进性也要进行研究。
第二个是传输时的数据,安全保护措施像有IPSec、VPN等等,涉及到通信安全,它也是相对比较成熟,但是随着技术的发展还要进行深化研究。
最后一个是使用时的数据,包括其在内存处理器中进行计算时的形态的机密性和完整性的保护,也就是运行态数据的安全,或者流动的数据安全,那么这方面的技术现在是一个薄弱环节,是一个短板。
这方面的技术有很多,包括像同态加密、可信执行环境、联邦学习安全、安全多方计算、密文检索等等,那么这些技术,有的是不够可靠,有的是实现的性能不能满足我们现实的需求。
最后,做一个总结,我们应该在坚持自主可控、安全可信的这个防护理念的基础上。
一是要不断深刻认识数据安全的内涵,就是刚才讲的那句话,大数据时代的数据安全,不仅包括传统的机密性、完整性、可用性,也包括隐私性和敏感性,不仅包括防止数据泄露的隐私性和敏感性,也包括数据分析的隐私性和敏感性。
二是要紧跟国际数据安全技术的发展趋势,因为国际上有很多大家都很关注的成果,我们应该在我们进行原始创新跟集成创新的同时,充分借鉴这些国际的先进成果。
三是应该加强数据安全法律法规研究制定,我们的法律法规毕竟还比较年轻,那么需要通过法律手段来规范市场,那么强化监管,合理平衡数据管制与自由流动,营造良好的法治环境,要处理好发展和安全的关系。
四是要紧密结合产业和应用实际,我们的工作应该自主掌控一些核心的关键技术跟产品,推出切实可行的安全解决方案和标准规范,为保障数据产业健康稳定发展保驾护航。
第14届中国数据库技术大会(DTCC2023)上,华为云数据库GaussDB首席架构师冯柯对华为云GaussDB数据库的高级压缩技术进行了详细的解读。