- 数据治理的“内忧外患”[2022-06-16]
- 数据治理应平衡好安全与创[2022-06-15]
- 开展全球数据治理——现实[2022-06-14]
- 数据治理:银行业高质量发展[2022-06-13]
- 加强数据高质量治理 发挥大[2022-06-10]
- 我国大数据产业规模突破1.3[2022-06-09]
- 江苏推行首席数据官制度 增[2022-06-08]
- 数据治理为智慧医院建设按[2022-06-07]
- 隐私计算练兵金融数据治理[2022-06-06]
- 工业互联网平台赋能制造业[2022-06-02]
隐私计算练兵金融数据治理
随着《要素市场化配置综合改革试点总体方案》、央行《金融科技发展规划2022—2025》等顶层设计出炉,以及去年落地的《个人信息保护法》助推,解决数据安全合规流通的隐私计算已经取代区块链成为金融数字化转型中最走俏的技术。
值得注意的是,经过2020年以来的沉淀,杀入隐私计算赛道的参与者快速发展到数百家,相关技术在数据流通和治理中的原理和作用已初步得到市场认可。进入2022年,金融机构、创业公司以及风投机构显然希望看到更多实打实“落地”的价值以及生产级项目出现,等待一个拐点性阶段到来。
“隐私计算并不是一个容易在短周期内完成真正落地闭环的技术,这受到技术自身难度和领域交叉复杂度制约,除了行业自身升级工程化能力需要进一步提升。虽然当前顶层设计层面的政策密集,但转化为机构执行力还需要时间。”一位隐私计算头部公司高管直言。
隐私计算供应激增
在今年4月,央行旗下的北京金融科技产业联盟相继发布了《隐私计算技术金融应用研究报告》、《多方安全计算金融应用现状及实施指引》和《联邦学习技术金融应用白皮书》等多项研究成果。这也是继央行与支付清算协会此前发布相关规范后,央行系统针对隐私计算技术在金融领域应用的又一次全面梳理。参与编撰的机构包括国有大行及其金融科技子公司、清算机构,以及头部隐私计算服务商等。
中国信息通信研究院(以下简称“中国信通院”)云大所大数据与区块链部副主任闫树接受《中国经营报》记者采访时透露,根据信通院统计评测,去年以来隐私计算商用产品快速增加,目前已有80余家企业陆续发布了自己的相关技术产品。
大型机构的入场可以看做一项技术效果和成熟度的重要指标。作为数据密集度最高的行业,金融领域被公认为隐私计算发酵和落地的首个场景,目前大约占据了隐私计算市场七到八成的份额。
市场共识在于,基于密码学发展而来的隐私计算几乎是解决数据“可用不可见”“可控可计量”的唯一选择。富数科技CEO张伟奇举了个例子:去年年底,银保监会给银行信用卡中“睡眠卡”比例设置了不超过20%的上限,这就需要识别潜在流失用户并匹配一定的挽留策略。
但识别存量用户信用情况时,仅靠银行内部数据是不够的,必须结合运营商、平台公司、银联等外部数据。过去的一种普遍做法是,直接通过API接口调用第三方数据源,但这种方式目前存在合规问题。“隐私计算的解决方案相当于在机构内的业务数据和外部合规数据源之间搭一座桥,在数据不出本地的前提下,实现联合建模或者多方安全计算,盘活了这个数据流通僵局。”张伟奇表示。
华夏基金董事总经理、首席数据官兼首席技术官陈一昕向记者表示,虽然基金公司尚无落地层面的应用,但痛点和需求同样存在。“基金公司不能获取更多维度用户信息的条件下,也无法精准刻画出立体的用户画像。因此,需要借助隐私计算技术,在确保不泄露参与方保密数据的前提下进行联合建模。”
效能压力催生路线分化
值得一提的是,隐私计算技术的复杂性和早期性,也让其在金融领域落地时步伐迈得并不算大。这直观体现为相关招标项目的金额有限,较难出现“大单”。其背后的主要原因之一,即隐私计算技术在从实验室走向工程化、生产级输出过程中,面临着算力、技术路线和行业标准缺失等一系列制约。
记者梳理相关招标公告发现,目前隐私计算领域的招标金额多在几十万元到数百万元,超过300万元的项目很少。前述隐私计算头部公司高管透露,行业头部公司中,现阶段卖软件一年能做到两三千万元就已经非常了不起,涉及交付压力也很大。
隐私计算招标金额不大的一部分原因还来自于金融机构的系统兼容问题。陈一昕告诉记者,大型金融机构经过多年的技术沉淀,许多系统往往都有着复杂的架构,且各系统间紧密连接,对现有系统的改造牵一发而动全身。这就导致隐私计算技术的使用很多时候只能从一个迷你的测试场景做起,再逐渐过渡到一个新的系统。
此外,隐私计算作为一种“密文计算”,相对于“明文计算”的效能仍旧有限。“受效能以及安全性的制约,去年一些金融机构的试点项目也不了了之。”某金融机构高管透露,虽然技术发展已经大幅提升了密文运算的算力,但在本地建模上相较明文计算,密文运算要慢5~10倍,特别是在对多方海量数据的生产级运算方面。
加拿大皇家科学院及工程院院士、FATE开源社区技术指导委员会主席杨强向记者表示,效率问题一直是隐私计算行业的重中之重,如果一个技术足够安全但实际效率却很低,则同样没办法使用。
效率问题使得算法优化和工程化训练成为去年下半年以来一些公司的主要发力方向。所谓工程化,即在符合银行生产环境下进行作业的能力。张伟奇告诉记者,公司这一年的主要精力是提高技术和方案的工程化能力。进行生产级应用后,网络系统抗攻击性是否强大?是否支持大规模数据吞吐?这些都是比较大的挑战。
闫树指出,性能瓶颈和安全风险仍然是当前隐私计算大规模商用需要关注的两个重点问题。除了算法优化和工程化,通过软硬件一体的隐私计算解决方案,隐私计算应用可以进一步加速性能,加固安全,提升易用性。
这也使得在2021年,头部隐私计算公司的发展路径开始发生分化,逐渐过渡到单点突破。比如蚂蚁已经在隐私计算软硬件一体机上进行押宝,星云Clustar主攻高性能算力提升,推出了隐私计算加速卡和一体机等硬件方案;数牍科技则推出了软硬协同的隐私计算方案;也有公司侧重发展基于TEE(可信安全执行环境)的芯片研发……
在闫树看来,隐私计算安全要实现从“研究安全”到“产品安全”的跨越,必须经过三个标准核验:算法安全、密码安全和产品安全。“多技术融合是趋势之一,隐私计算涉及多方安全计算、联邦学习、TEE。若想实现互相融合、取长补短,就需要结合应用场景综合选择合适的技术,并不断提高产品安全性。”
拐点何时来?
隐私计算技术的小步发展,既显示了金融机构“试水”的谨慎,也折射出现阶段不同技术厂商提供的隐私计算技术产品和解决方案在设计原理和功能实现之间存在较大差异,标准化程度不足。
闫树直言,为实现多个合作方之间的数据融合,用户往往要付出极高的沟通成本以协调产品选型方案,甚至不得不部署多套产品以逐一适配,造成重复建设,这对隐私计算技术的推广应用十分不利。
这指向的是不同技术壁垒之间互联互通的老问题。
在这一背景下,2022年以来,“开源”和“可信”的呼声逐渐高涨。据记者了解,目前55%的国内隐私计算产品基于或参考了开源项目,相关方也希望推动更多公司可以加入开源社区,降低技术门槛,促进技术互通。全球首个隐私计算和联邦学习的社区FATE的技术指导委员会主席杨强认为,足够多测试者和共同开发者的参与,就更容易定位软件的bug(缺陷),也可以解决隐私计算技术本身黑箱化的问题。
深圳数据交易有限公司副总经理、开放群岛(Open Islands)开源社区委员会生态赋能工作组组长王冠向记者表示:“通过开源协作,在隐私计算核心技术发展层面可以有效提升开发与迭代能力,降低开发门槛,实现跨数据、跨平台、跨行业互联互通,满足数据交易多场景技术需求,并且有助于监管透明化。”
据记者了解,目前FATE社区已经在国际建立了一个联邦学习的初始标准;在国内,央行系统有关单位和中国信通院也都致力于引导建立隐私计算不同技术路径的相关标准。
而在杨强看来,目前隐私计算的需求方仍缺乏“急迫性”。一个典型案例是,在国外并不是金融机构率先使用隐私计算技术,而是谷歌和苹果等大型科技公司。由于欧盟针对个人信息保护提出了极为严苛的法规《通用数据保护条例》(简称GDPR),美国几大巨头先后在欧洲连续遭到巨额罚款,迫使他们不得不急速引用隐私计算技术。
“国内一家手机终端公司去年以来就积极引入隐私计算技术,是因为他们的产品会卖到欧洲,必须加速对系统进行改造升级。”杨强表示。
在杨强看来,隐私计算行业发展需要在技术、法律、行政要求等方面加速推进,真正把机构需求和政府要求转化成技术的确切规范。