中新经纬9月25日电 9月25日,“互联网之光”博览会开幕。2021年世界互联网大会乌镇峰会在保留传统特色论坛的基础上,还聚焦于开源生态、下一代互联网、数据与算法等网络技术新趋势。
事实上,伴随《数据安全法》《中华人民共和国个人信息保护法》的出台,数据已然成为网络安全行业年度热词。此次世界互联网大会更是设立了“数据安全典型实践案例“奖项,让数据的安全之城成为各家所向之地。
数据安全是什么?是用户隐私,是业务基石,亦是安全建设的关键环节。从数据存储、流通、处理到销毁,安全问题无处不在。而当传统IT架构被打破后,数据从数据中心走向云端、边缘后,勒索攻击、数据库泄露、敏感数据外泄事件更是不绝于耳。
上海社科院互联网研究中心主任,研究员惠志斌介绍,目前,针对数据安全的技术与产品不断涌现,包括传统的数据加密、脱敏、备份容灾、DLP,以及愈加火热的数据治理、数据管控、基于数据安全的零信任解决方案、隐私计算等。显而易见,以隐私计算为代表的新兴技术正在从实验室走向市场实践,接受隐私保护与数据安全的现实挑战。
数据安全的囚徒困境
惠志斌指出,个人有权维护自己的隐私数据安全,企业则需要基于用户数据开展业务和提供服务。纵然围绕数据的安全与隐私管控问题一直面临争议,但“个人最佳选择”(一味地拒绝提供数据),或是“企业最佳选择”(无限制地收集与处理数据),都不是数据时代里发展与安全的平衡点。当前,全球数据安全监管不断收紧,对企业数据处理活动施加了日益严苛的数据保护义务,强调遵循了“用户明确授权原则”和“最小化原则”,这对传统的互联网和大数据商业模式构成了严峻挑战。为此,隐私计算脱颖而出,为产业发展提供了可行方向。
惠志斌介绍,隐私计算(Privacy-preserving computation),主要是在数据被使用时(处理)保护数据,实现在安全的数据处理、共享、跨境传输和分析。简单来说,通过技术路径实现数据在处理过程中不透明、不泄露,也不能被计算方或者其他非授权方获取。目前,隐私计算的实现技术路径包括联邦学习、多方计算、可信计算、差分隐私、同态加密等。多个技术流派的交叉和发展,推动隐私计算的进一步实现。根据Gartner的预测,到2025年50%的大型企业机构将采用隐私增强计算来处理不可信环境或多方数据分析用例中的数据。彼时,数据孤岛不再存在,数据跨IT边界、跨系统、跨境应成为安全常态,一些依托于隐私计算的平台将充当数据交换与处理的媒介……
从“黑科技”走向“白科技”
惠志斌表示,如何让数据安全地流通创造价值,成为行业内近年的实践重点。以金融行业-银行的授信分析场景为例,由于授信分析一般需要基于企业的各种行为数据,为了提高分析的准确性、降低授信风险,不仅要企业/客户在本银行的数据,还要融合其他银行的数据,甚至与其他场景的行为进行联合建模,最终获取更精准的模型效果。
惠志斌称,医疗行业作为隐私计算的重要应用行业,同样有着类似的“联合处理数据”的需求。医院系统基于历史的病例数据进行训练,从而得到一个辅助诊断模型,当再出现一个新病例时,即可根据这个模型来推断疾病。由于模型训练往往需要大量的数据样本,而一家医院可能因为历史病例数量少而导致模型准确度存疑。这时,同样要结合多家医院的病例数。
上述两个场景中,如何保障在联合处理数据时,各家数据的不透明和不泄露?
惠志斌指出,世界互联网大会期间,蚂蚁隐私计算互联网医疗应用方案作为中国网络空间安全协会2021年数据安全典型实践案例代表,被授予获奖证书。这个案例是应用了蚂蚁的隐私计算技术,使用联邦学习进行联合建模,实现提升模型样本量的目的,同时使用差分隐私技术来保护各银行/医院和中心节点进行梯度数据交换计算时的隐私信息。当然,也可以用SCQL(智能卡数据库命令)技术来进行多家数据联合分析,如医疗机构希望知道自己的平均住院日和其他医院的对比情况,但不愿意分享自己的数据,可以使用SCQL技术对同一类别医院同一病种的平均住院日进行统计,来实现不直接分享数据还可以进行联合分析。
惠志斌还称,蚂蚁集团与浦发银行(600000,股吧)针对零售贷款业务共同开发了一整套风险评估解决方案,采用多方安全计算的风险模型利用浦发银行及其合作方的数据来共同提高模型的有效性。由于在训练和运行两个阶段内均采取了分布式部署,且双方都应用了加密算法。这意味着任何一方的原始数据都不会泄露给另一方,并且也无法通过对训练结果的反向工程来推导原始数据。最终,基于丰富数据源训练出的模型识别出了超过14.5万名高风险客户,阻止了数十亿人民币的高风险贷款的发放。
在惠志斌看来,从金融到医疗行业,数据的流通和多方协作所面临的安全困境,反向推动隐私计算从黑科技变成白科技。而数据流通起来才成创造价值,这一论调也在隐私计算的实践中被反复验证。
隐私计算:未来数据处理的“安全媒介”
惠志斌认为,有了隐私计算技术的应用,不断发布的安全法规对大数据行业不仅不是禁锢,反而是一种正向的激励:明确了个人信息的界限、指明了数据流通与处理的规范。
《数据安全法》第一章第十六条规定:“国家支持数据开发利用和数据安全技术研究,鼓励数据开发利用和数据安全等领域的技术推广和商业创新,培育、发展数据开发利用和数据安全产品、产业体系。”固然,隐私计算的发展空间和商业上限还需要继续探索,但是从市场需求趋势和行业数据安全需求来看,隐私计算正在迎来春风,通过结合数据全生命周期保护的全部主流技术,应用于金融风控、保险快速理赔、民生政务、多方联合科研等多个领域。
“数据可用不可得,数据可用不可见,隐私计算正在积极破解各行业数据流通的痛点,推动我国数据要素市场的健康发展。”惠志斌说道。(中新经纬APP)