财新传媒
位置:博客 > 高声谈 > 隐私计算公司开拓金融行业的意见与建议

隐私计算公司开拓金融行业的意见与建议

2021年,我国的隐私计算市场被新出台的《个人信息保护法》点燃,风险投资热钱涌入,项目案例百花齐放,行业关注度急剧升温,2021年也被称为我国隐私计算元年。无独有偶,美国、欧盟、韩国等国家的隐私市场同样经历了提速过程,Gartner(高德纳,全球最具权威的IT研究与顾问咨询公司)连续两年(2021年、2022年)将隐私计算列为世界范围内的重要战略科技趋势。其中,我国的隐私行业逐渐展现出领先全球的发展态势。

法律法规的高压之下,各行各业隐私保护合规需求极为迫切。通过深入观察市场笔者认为:一方面,国内隐私计算行业的部分技术路线、部分产品已经具备了商用化的前提条件;另一方面,由于行业刚刚兴起,技术标准缺乏、配套资源整合不足、场景理解不够与产品易用性不好等问题十分突出,为隐私计算公司的资源整合能力、场景理解力、法规解读能力、市场机制灵活性提出了严峻挑战,有些时候,采取“依附策略”与数据供需两端的垄断企业深度绑定可能更容易打开局面。

 

坚定信心,努力活下去

政策鼓励,方向正确

自2021年起,国家重点从法律法规维度构建信息保护体系,其中个人金融信息保护更是重点方向。2021年6月10日,《中华人民共和国数据安全法》由中华人民共和国第十三届全国人民代表大会常务委员会第二十九次会议于通过,自2021年9月1日起施行;2021年8月20日,十三届全国人大常委会第三十次会议表决通过《中华人民共和国个人信息保护法》,自2021年11月1日起施行;2021年9月27日,中国人民银行令〔2021〕第4号,公布《征信业务管理办法》,自2022年1月1日起施行。这些法律及监管机构管理办法规范了使用个人信息及数据时必要的授权及规范,对个人信息处理机构提出了若干义务要求,尤其是明确了处理机构在存储和传输时对个人信息的去标识化义务,或是匿名化带来的责任解脱,彻底改变了个人信息相关行业企业的经营逻辑和业务流程,市场亟需一种新型的、合规的解决方案重新组织商业逻辑。

监管政策倒逼下,隐私计算行业逐渐纳入视野,尤其得到了监管机构的鼓励发展。2021年5月24日,国家发改委、中央网信办、工业和信息化部、国家能源局联合印发《全国一体化大数据中心协同创新体系算力枢纽实施方案》,提出“试验多方安全计算、区块链、隐私计算、数据沙箱等技术模式,构建数据可信流通环境,提高数据流通效率”。

中国人民银行范一飞副行长在《金融电子化》(2021年10月刊)发表署名文章,其中提到“要探索应用多方安全计算、联邦学习等技术,在保障原始数据不出域前提下规范开展数据共享;建立数据全生命周期安全保护机制,运用匿踪查询、去标记化等措施,严防数据误用、滥用, 切实保障金融数据和个人隐私安全”。

中国人民银行《金融科技发展规划(2022-2025年)》中多次提到并鼓励发展隐私计算技术:“建立健全数据全生命周期安全管理长效机制和防护措施,运用匿踪查询、去标识化、可信执行环境等技术手段严防数据逆向追踪、隐私泄露、数据篡改与不当使用”、“在技术方面,积极应用多方安全计算、联邦学习、差分隐私、联盟链等技术,探索建立跨主体数据安全共享隐私计算平台,在保障原始数据不出域前提下规范开展数据共享应用,确保数据交互安全、使用合规、范围可控、实现数据可用不可见、数据不动价值动”。

风投汇聚推动行业火热

隐私计算市场被进一步点燃,大量投资涌入市场,从业机构数量快速增加。截至2021年9月底,隐私计算初创公司累计获得63笔股权融资,公开披露的融资总额达到56.1亿元(不包括12笔未透露金额的投资),成为国内乃至全球最热的科技赛道,从业机构也从2021年初的十余家增加至2021年底的86家(信通院测试过检单位名单)。

从项目落地维度看,主要集中在数据化程度较高的金融行业、政务平台、医疗行业,其中,金融行业需求最为迫切、市场天花板最高,创新开放度最高,同时也是落地项目最多的行业。2021年,金融行业的头部机构纷纷尝试运用隐私计算方法用于个人信息匿踪查询、外部数据引入建模、联合营销、联合统计、反洗钱与反欺诈等涉及数据跨主体应用等场景中,据不完全统计,全年落地的隐私计算项目至少有21个,其中知名项目有:工商银行的基于多方安全计算的工银e生活营销项目、基于联邦学习的工行&工银安盛健康险联合营销项目、基于联邦学习的企业贷中检测项目、光大集团基于多方安全计算的全辖子公司联合统计项目等。目前已知落地隐私计算项目的银行主要有:五大国有银行、银联、光大集团、平安银行、浦发银行、华夏银行、重庆农商银行、北京银行、南京银行、苏州银行、新网银行等,保险公司有国寿财。

功能作用逐渐清晰,行业天花板不断提高

个人信息保护具体合规要求包含数据收集最小化、数据分级分类、数据匿名化和去标识化、知情同意、规范操作、应急补偿等。目前,隐私计算被认为是解决数据匿名化、去标识化存储和传输的最佳方案。

商业化市场随着CPU、GPU的大规模应用以及国产成熟芯片的大量推出,隐私计算的算力瓶颈和国产化芯片替代问题得以一定程度解决,各技术路径均具备了商用化落地的条件。国家监管机构纷纷出台鼓励发展的政策文件,风险投资金额屡破新高,头部金融机构开展了大规模项目试点工作,市场认知和接受度快速普及,隐私计算行业迎来大发展。

腾讯银行和毕马威联合发布的《隐私计算行业研究报告》中预测:我国隐私计算系统的销售和服务收入规模在三年之内有望触达100-200亿元的市场空间。

笔者采用另外一个逻辑推算:仅以数字风控广泛应用的线上消费贷和信用卡贷款市场为例,2020年我国银行业信用卡放贷总额约为19万亿元,银行业个人消费贷款全年放款总额约6.5亿元(含互联网平台助贷和联合贷),合计25.5万亿元。按照数据及附加费用在放款额中占比千分之五的保守比例推算,现有隐私计算和数据费用加总收入规模可达125亿元。

 

行业发展趋势与问题

行业竞争迅速加剧,找准并建立竞争优势

据笔者统计,截至2021年末,通过信通院相关测评的公司数量为86家,隐私产品数量为113个。时至今日,市场传言行业从业机构已接近300家。伴随着资本的汇聚,从业机构如雨后春笋涌入。

行业快速发展同时,由于缺少必要的顶层设计和行业标准,导致行业底层技术应用杂乱,企业技术能力水平高低不一,行业鱼龙混杂。

从从业机构原始基因看,目前提供隐私计算服务的厂商大致可以分为四类:

  • 互联网头部企业:如阿里云的隐私增强计算平台、蚂蚁隐私计算隐语平台、蚂蚁链摩斯安全计算平台、腾讯神盾隐私计算平台、百度点石隐私计算平台、京东万象隐私计算平台等;
  • 隐私计算技术出发的初创公司:如华控清交、星云Clustar、冲量在线、数牍科技、易方建数、融数联智、蓝象科技等;
  • 人工智能或区块链行业转型企业:如瑞莱智慧科技、第四范式、杭州趣链、联易融数字科技等;
  • 金融科技背景公司:如同盾科技、百融云创、洞见科技、富数科技等。

通过跟踪、观察前期落地项目进展情况发现,很多项目或因技术问题被迫流产,或因实现结果偏差中途转包,多数项目停留在实验试点阶段,行业距离大规模商用化还有很长的路要走。行业赛道愈发拥挤,倒逼从业机构必须迅速调整身姿,从解决客户实际问题角度出发,不断优化产品实用性和易用性,寻找差异化竞争优势,快速形成竞争壁垒。过程中,考验每个创业公司的机制灵活性、资源整合等多维能力。

技术兼容性问题形成“新鸿沟”,互联互通任重道远

隐私计算本为解决因隐私保护导致的信息传输阻塞而生,但由于技术路径众多,厂商林立,底层密码协议、使用语言各有标准,导致信息传输因产品不兼容而产生新的“技术鸿沟”。

产品互联互通问题是阻碍行业进步的一大障碍,很多机构致力于互联互通的标准制定,其中,信通院(中国信息通信研究院)下辖的“隐私计算联盟”工作最为靠前。

跨平台的技术互联互通当前主要解决各平台自治带来的异构性,如信任基础不一样(包括对管理方法的信任和对技术方法的信任),平台之间身份认证体系不统一,以及各平台使用的技术方案和计数原理不相同等问题。解决跨平台技术互联互通问题首先要解决不同技术路径的行业技术标准问题,信通院即是秉承这一思路。

即便如此,行业的互通互联还存在合作意愿问题,因此会是一个漫长的推动过程。为了短期内解决问题,行业提出了多方集成的解决方案。多方集成是指将多个产品解决方案集成于一处,为数据或模型需求方提供一体化解决方案,解决其因数据锁定或技术路径不同等带来的多头采购或重复采购问题。

为了尽快解决问题,行业提出了多方集成的解决方案。多方集成是指将多个产品解决方案集成于一处,为数据或模型需求方提供一体化解决方案,解决其因数据锁定或技术路径不同等带来的多头或重复采购问题。在此背景下,硬件一体机应运而生。

软硬结合是发展方向,硬件一体机迎来大发展

几个趋势印证了硬件一体机是行业未来发展方向:

  1. 算力和计算效率问题始终是困扰隐私产品性能的首要问题,行业探索至今通过“纯软”方式很难实现向明文建模速度的看齐,因此行业纷纷推出算力加速卡来解决算力瓶颈问题;
  2. 隐私技术路径中可信执行环境(TEE)本身就是软硬结合的解决方案,如果要将市场所有隐私产品做兼容性打通,避免不了硬件底层(主要是芯片和内存型号)的支持;
  3. 在愈发“内卷”的行业竞争中,通过构建与自身产品深入融合绑定的加速卡或一体机,是隐私公司构建竞争壁垒的有效手段;
  4. 对于采购方来说,含带硬件的中标结果有利于规避隐私初创公司经营风险或技术路径风险导致的项目无法了落地的风险,也为灵活转切其他隐私产品提供了便利。

据了解,行业头部厂商纷纷提出了硬件发展战略,华控清交、冲量正在推出自己的一体机,星云Clustar已经推出加速卡硬件产品。

 

 

意见与建议

笔者所在金融机构曾与很多头部企业开展了较为贴近实际生产环境的测试工作,发现了很多行业尚未关注、但十分重要的问题。在此提出,供行业参考。

产品易用性普遍存在问题,对建模个性化支持的功能优化势在必行

目前测试情况看,很多厂商由于大多缺乏金融行业的建模经验,导致隐私产品对数据清洗、分栏、特征值和算法选择等环节的灵活性支持不足,很多产品简单将上述环节的策略和标准写死,不支持灵活调整工具及调整后统计结果的反馈,导致大量数据标签被误杀,产出的模型效果无法达到实用标准。

这个问题十分重要,直接影响了隐私产品的实用性,也是阻碍行业大规模商用化的重要问题之一。时至今日,厂商多是埋头解决算力加速和安全性问题,少有认识到或有精力优化产品实用性和易用性问题。根据目前测试了解情况,由于可信执行环境更接近于明文建模状态,因此在产品实用性和易用性方面表现普遍出色。

隐私产品会重构风控建模流程和风控技术架构

金融行业标准建模流程的技术架构为:先搭建“数据对接平台”和“企业数据中台”,分别用于外部和内部数据的采集和汇总。而后对接“决策引擎”,实现“数据-模型结果-生成决策”的转化,最后推送给业务系统。

明文状态下的模型训练和使用是异域、异步的。搭建和训练模型在事前和线下,训练好后部署在“决策引擎”的计算模块之中供生产使用。生产状态下,客户多维信息推送进“决策引擎”计算模块后瞬时算出结果和策略。

使用隐私计算产品后,所有涉及数据和模型计算的工作必须在隐私产品中完成,模型无法抽离并部署在“决策引擎”之中,因此离线建模和模型使用是同域、同步的。

此时,“数据对接平台”和“决策引擎”的计算模块功能由隐私产品替代,金融企业只能接触到自身的明文数据。调整后的技术架构为:“企业数据中台”将明文数据在节点加密后推进隐私产品,隐私产品通过与外部数据源节点实时交互后,跑出模型得分或策略结果,而后推送给“决策引擎”的决策部署模块后,形成指令集推送给业务系统实现。

这一点同样考验金融机构的接受度,尤其对于大型金融机构,风控流程及工程实现的改变属于重大调整,需要慎重决策、强力推行方能见效。如隐私产品调整后的建模流程能够经过测试,得到权威机构认证,形成企业标准、团标甚至行标,则会大大降低每家金融机构的学习成本,加速推进隐私产品的行业落地。

隐私计算需要集成多种能力才具实用性

金融行业隐私数据存储和传输需求是一项综合工程,隐私厂商还需要拼凑多块能力短板方能凑齐全部解决方案:

  • 一是引入金融机构优化决策模型的外部数据,需要将隐私厂商积极寻找市场合规且有用的数据源,说服其部署安装产品节点,同时还要建立数据测试联动机制。
  • 二是隐私计算无法满足个保法对信息处理主体的所有义务要求,隐私公司需要结合数据需求方的具体场景,设计合理的告知和授权、前端展示、数据全生命周期管理、账户权限分级管理等一整套合规方案,隐私计算产品应该是合规方案中的一个组成部分。
  • 三是对于某些不具备深度建模能力的需求方,需要有既熟悉隐私产品操作、又具备建模和策略部署经验的量化分析团队,帮助其搭建有效且好用的量化决策体系,并定期运维更迭模型。

从目前我们理解看,隐私计算至少应集成以上三项能力板块后,方能形成一套对金融机构的整体解决方案。这些能力的拼凑,单靠初创的隐私计算公司很难有效整合,而在数据供给侧或是需求侧有重大话语权的大型国有企业更具备竞争力。基于此,与数据供需两端具有垄断优势的企业,尤其是大型国有企业进行战略绑定,借船出海整合上下游资源,可能是隐私公司的明智选择。

隐私产品的系统安全和网络安全均需要加固

如前所述,无论是多方安全计算、隐私增强联邦学习还是可信执行环境,均在防范恶意攻击方面缺少有效防护手段,尤其对于硬件一体机的系统与安全防护问题,对集中运行隐私数据的隐私产品解决方案来说是致命问题。因此,结合行业硬件集成的发展方向以及等保2.0方案中对于可信计算环境的相关要求,有机构提出了“可信+隐私计算一体机”的提法:即在隐私计算一体机中,引入可信计算硬件模块,对一体机所承载的计算节点的系统安全和网络安全进行主动防御,较大程度上解决恶意攻击问题。该提法属于行业前沿探索,蚂蚁已经推出了摩斯一体机,集成了可信平台、可信执行环境、安全容器、算法加速等功能,并通过了国家金融科技测评中心的测评。

———————————————————

笔者个人公众号:高声谈,Inter-FinanceCow

邮箱:gaoshengtan2021@yeah.net

欢迎读者多交流!

 



推荐 0