对话微众银行杨强:联邦学习的问题何解、前景何方
对话微众银行杨强:联邦学习的问题何解、前景何方
蔡鹏程
· 2022.11.23 14:25
“长远来看,随着社会数智化的发展、数据要素的流通、数据交易所的落地,数据的定价、数据知识产权的认证,数据安全隐私的保护等环节都离不开联邦学习,这也是联邦学习发展的最大机遇。”
数据安全、隐私保护、数据孤岛是AI时代遇到的普遍难题。
在人工智能的发展道路上,除了算法、算力的要求,“喂养”人工智能模型需要海量、多维数据进行模型训练。在此过程中,数据安全、个人数据隐私等风险事件频发,数据孤岛现象频现。隐私与数据保护越发得到重视,相关的法律法规日渐严格和完善。
在此背景下,“联邦学习”为以上问题的解决提供了一个可行方案。
所谓“联邦学习”,其基本思想是建立一个共有模型,各个参与者的身份和地位相同,通过加密机制下的参数交换方式,实现不同企业、不同部门所拥有的数据不交换、不移动。在不违反数据隐私保护法律法规的前提下,模型利用全量数据进行训练和模型优化,从而得到最优模型结果。
香港科技大学计算机与工程系讲座教授和前系主任、中国人工智能学会(CAAI)荣誉副理事长、微众银行首席人工智能官杨强教授曾以羊与草为喻,形容联邦学习的思路所在。
假设用一只羊来类比机器学习模型,我们希望羊吃了草以后能够长大。过去的做法是,把草买到一起来建立模型。羊不动,但是草被购买到中心。相当于用简单粗暴的办法来获取数据,形成大数据,来建立模型。
但我们希望能够保护各自的隐私,所以让草不动,让羊动。也就是说,我们带着模型到不同的草场去访问,那么久而久之羊就长大了——这个就是联邦学习的新思路,就是让草不出草场,本地主人无法知道羊吃了哪些草,但是羊还是长大了。
“联邦学习”在解决数据共享和数据隐私保护领域展现出强大的吸引力。到目前为止,联邦学习已在金融、广告营销等方面获得落地。
比如,互联网平台推送“千人千面”式的营销信息时,其背后的推荐模型就需要大量用到用户的特征数据。但单一企业只拥有用户的一部分特征数据,如果可以接入更多其他互联网企业的数据或者是投放广告主关于用户的数据,那么将大幅提升广告推荐的效果,既能提升点击率也可以提升广告主的ROI,联邦学习的出现就很好的解决了这个问题。
金融领域同样如此,单个金融机构掌握的用户信息较少,除了个人征信系统之外,各平台数据之间彼此是不互通的。联邦学习的出现同样让各大金融机构之间可以联合建模,对于用户的资质进行全面客观的评价,降低贷款的违约率和资产的不良率。
不过在现实中,“联邦学习”商业应用仍然面临一些问题,且其在技术研究中也仍然存在一些难点有待突破。
比如,如何在效率、性能与安全性之间取得平衡是一个难题。目前“联邦学习”系统严格保护用户本地数据不外泄,只传输模型更新,而且即使是模型更新,也会对模型进行加密后再传输。对于更复杂的加密系统,就意味着回传也需要更多的资源和实践去解密。效率、性能与安全性之间有此存在冲突。
再如,“联邦学习”面临着的“数据下毒”的威胁。联邦学习的分布式特点以及安全聚合机制往往让数据造假变得更容易,更难被发现和举证。每一方都有可能通过构造“数据下毒”来控制整个模型的训练结果。
经过数年发展,“联邦学习”究竟在技术和商业应用层面有何发展?
对此,钛媒体App近日专访了杨强教授,杨强是国内联邦学习领域的知名学者。2018年,杨强带领的微众银行AI团队在国内国内引进了并延展了联邦学习(Federated Learning)概念,在国际首次系统性提出联邦学习理论。2019年,微众银行AI团队开源了首个工业级联邦学习技术框架FATE,同年6月捐献给Linux基金会。
不久前,杨强教授的团队与上海交通大学、中山大学等机构联合撰写的三篇论文被IJCAI 2022、TPAMI 2022、ACM TIST等国际人工智能顶级学术期刊和顶级学术会议收录发表。三篇论文分别为:《联邦学习中隐私与模型性能没有免费午餐定理》、《FedCG: 联邦生成对抗网络保护隐私保障性能》、《FedIPR:联邦学习模型所属权验证》。
在杨强教授的回答中,有三点观点值得关注。首先,在联邦学习的隐私保护、模型性能、算法效率三者需要平衡,且可以平衡,目前杨强教授的团队已经找到了一条在更好的隐私保护能力的同时,让模型性能上也具有竞争力的一条道路。
其次,长远来看,随着社会数智化的发展、数据要素的流通、数据交易所的落地,数据的定价、数据知识产权的认证,数据安全隐私的保护等环节都离不开联邦学习,这也是联邦学习发展的最大机遇。
第三,让技术和法律法规结合起来是一大挑战。关键是要让整个联邦学习决策过程变得可解释、透明,并且可监管、可问询、可追踪。
以下是钛媒体App与杨强教授的采访实录,经编辑后发布:
解读三篇论文:从理论到实践,再到规模化和工程化
问:近期发表的3篇论文,分别是从信息论、联邦学习效率提升以及模型版权验证切入,为什么会选择这3个角度作为研究的切入?背后有怎样的研究路径和规划?
杨强:计算机学科的发展往往是先有理论再有实践,然后进一步发展理论,我们现在处于第三步,那么这一步的理论要解决的问题是什么?
首先,我们要注意联合建模的安全性(这个是大家特别关心的)和联合建模的可用性。如果只是一个极端安全的模型,没有人能用,这东西也没用。模型质量要好、准确率高,同时训练速度要快,要安全,需要这三点的平衡。
基于这三点的平衡,我们就要做下面几件事,第一件事,是要证明这其中确实是需要做平衡的。因此,我们发布的文章《联邦学习中隐私与模型性能没有免费午餐定理》阐述,联邦学习的隐私和模型性能是没有免费午餐。两者必须要做出权衡和取舍。
第二,在联邦学习的安全和效率之间,有没有可能很聪明地发明一些算法,能够实现安全性和模型的效能,以及准确率的同时提升。我们发表 《FedCG:联邦条件对抗生成网络》阐述了,我们可以在每一个参与方都建立一个它的镜像模型,然后让这些镜像模型之间互相沟通,这样就大大的降低了隐私泄露的可能性,同时我们建模效率和效果都大为提升。
关于最后一篇文章,联邦学习不仅仅是一个训练、一个模型,而是从数据的收集、选择,模型的训练,到模型的治理,直至模型和别人进行交换。在这种情况下,我们就提出了“全生命周期的联邦学习的模型治理”。
具体来说,模型治理其实和数据治理一样重要。未来的世界我们看到是一个数字化的世界,而数字都是以模型的形式出现。但是,每个模型是谁做出来的,谁用过,谁从谁那买的,这个模型有什么危险性,有什么特别性等等,这些问题我们都叫模型的所属权验证。而在模型里面加入水印实现归属权的验证,目前在业界我们是第一个做出来。
我们基于这3个不同的角度,从理论到实践,到规模化,到工程化生命周期管理,应该说是一个全面的概括。这是“可信联邦学习”的一个里程碑。
行业应用及商业前景
问:从目前的应用,到未来可以预见的一些场景,联邦学习会产生哪几方面的影响?在与行业结合的过程中,还有什么问题需要注意?
杨强:越来越多的行业在提数字化和智能化,联合起来就是数智化。数智化的过程,离不开一个观念,就是数据要素的流通,数据从一个地方流到另外一个地方,通过数据交易所进行交易。所以需要对数据进行定价,数据的知识产权要有认证,数据的安全隐私要有保护,这些要求是未来金融的一些重要的特征,而所有这些都离不开联邦学习,联邦学习实现这些目标的一个有力工具。
未来要注意的一个重要方面,就是如何有机地让技术和法律法规结合起来。现在有数据安全法,还有很多金融行业的一些规章制度,其中有一部分是可以用技术来实现的,但是有一部分是需要有法律和监管来实现的,这两方面的有机结合,我们现在正在尝试。我们要做到这种无缝的对接,能够既有技术的保证,又有法律和规章的保证,同时又需要让整个决策过程变得可解释,透明,并且可监管、可问询、可追踪,这些都是我们所面临的一些挑战。
问:从商业化的角度来看,联邦学习未来的商业潜力是怎样的?
杨强:其实他们就像任何技术一样,是需要满足自然的发展规律的,比方说一个技术的出现,先适用在一些案例上,取得了成功,于是各方都想积极地参与试用,会发现一些挑战,会有一些新的解决方案,让这些技术进行升级,这样最后能够成熟到大家都普遍使用,所以联邦学习和刚才所说的这些技术,也是一样的,要满足这样的规律的。
这其中的市场空间应该是很广泛的,在我个人看来,未来的计算,一定是数据和模型的计算。为了保护数据安全和用户隐私,在我们管道里跑的不应该是原始数据,应该是由数据产生的模型,而模型的交流组合、更新迭代,认证审计,这些都需要我们整个人工智能行业和大数据行业的升级迭代,都离不开联邦学习。(本文首发于钛媒体APP,作者|蔡鹏程)
469篇资讯
1.9万关注
蔡鹏程
钛媒体资深记者。关注领域:金融信息化、数字银行、科创板及创投市场,欢迎提供采访线索。微信:caipengcheng5429
最近资讯
- 对话微众银行杨强:联邦学习的问题何解、前景何方
- 易会满:探索建立具有中国特色的估值体系,密切关注房地产行业困难
- 【Fintech 周报】银保监会:财富管理等领域引入外资机构;银行理财产品现“破净潮”
声明:文章内容仅供参考,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里。
敬原创,有钛度,得赞赏
-
钛粉81947 赞赏了
历史进程中的茅台与6次暴跌
2022-10-28 12:23 -
钛粉48375 赞赏了
7种傲慢与偏见,导致互联网人改造传统行业失败
2022-10-20 19:53 -
想暴富25... 赞赏了
7种傲慢与偏见,导致互联网人改造传统行业失败
2022-10-20 17:18 -
钛粉61006 赞赏了
7种傲慢与偏见,导致互联网人改造传统行业失败
2022-10-20 16:41 -
AIBEN 赞赏了
月费不到100块、1分钟出图,AI作画要打翻多少设...
2022-10-17 15:10 -
钛粉36011 赞赏了
身处风口却“一桩难求”,一文看懂充电桩产业全景|钛...
2022-10-14 14:27 -
钛粉36716 赞赏了
身处风口却“一桩难求”,一文看懂充电桩产业全景|钛...
2022-10-14 14:24 -
钛精378... 赞赏了
那些"上不了席面”的私房美味
2022-10-10 13:04 -
钛粉18902 赞赏了
中集李凌寒:数字化供应链的动因、要素及实践|202...
2022-10-01 11:40 -
有颜有钱5... 赞赏了
中集李凌寒:数字化供应链的动因、要素及实践|202...
2022-09-30 19:02 -
钛粉29232 赞赏了
割韭菜、白嫖、疯狂AMA……在30多个元宇宙Web...
2022-09-15 15:45 -
钛小773... 赞赏了
沈抖发布百度智能云新战略,回答了“木星”与“蜻蜓”...
2022-09-10 09:33 -
钛粉07914 赞赏了
钛媒体Pro创投日报:9月2日收录投融资项目25起
2022-09-03 03:20 -
钛粉65687 赞赏了
银泰百货“破产第一案”背后:苦涩退场,西安城改的挽...
2022-08-19 17:41 -
钛粉61539 赞赏了
对话蚂蚁集团副总裁何勇明:“支付宝不对标抖音”
2022-08-06 13:53 -
钛粉60785 赞赏了
近10亿募资闲置理财如今又推14亿定增,泽璟制药持...
2022-07-27 14:44 -
在天空中自... 赞赏了
钛媒体Pro创投日报:7月21日收录投融资项目32...
2022-07-22 16:40 -
钛粉14772 赞赏了
寻找下一个“玻色因”,国货抗衰盯上了蓝铜胜肽
2022-07-22 10:47 -
单晶冰糖啦... 赞赏了
宁德时代依靠钠电池可以维持万亿市值吗?
2022-07-22 10:37 -
钛友趣64... 赞赏了
女性专属时尚座驾,欧拉芭蕾猫上市19.3万元起售
2022-07-12 23:58 -
钛粉93105 赞赏了
TapTap塌房,“中国Steam”的故事结束了
2022-07-12 14:02 -
已注销用户 赞赏了
【医疗健康周报】第26周:“康诺亚生物”获得1.9...
2022-07-07 15:05 -
钛粉97884 赞赏了
零和游戏与非零和玩家:InterSystems的数...
2022-06-29 22:21 -
钛粉97003 赞赏了
零和游戏与非零和玩家:InterSystems的数...
2022-06-29 21:58 -
钛粉97388 赞赏了
零和游戏与非零和玩家:InterSystems的数...
2022-06-29 21:50 -
钛粉11323 赞赏了
丰谷酒业换帅!李寒松出任党委书记、董事长
2022-06-28 17:09 -
钛粉97508 赞赏了
海外港口货物积压,商家提前备货,今年外贸旺季来得有...
2022-06-24 18:44 -
钛粉36186 赞赏了
习酒划转茅台集团财务公司5%股权,上市仍在“激烈博...
2022-06-21 15:25 -
钛粉66633 赞赏了
重新定义“一体化”?HR SaaS产品PaaS化之...
2022-06-16 08:51 -
碧天黄地 赞赏了
未来汽车如何实现创新与融合?几位大佬有话说
2022-05-30 21:37 -
钛友趣76... 赞赏了
批量招聘难题何解?他们发现了HRSaaS的新机会 ...
2022-05-26 23:38 -
单晶冰糖啦... 赞赏了
钛媒体华南中心成立 全财经战略布局再进一步
2022-05-25 11:30 -
钛粉89798 赞赏了
郑大一附院,一家“超级医院”的双面特写
2022-05-21 06:19 -
钛粉00698 赞赏了
大厂深蹲,时代向前
2022-05-19 10:27 -
刘成军 赞赏了
中国信通院院长余晓晖:加快构建我国特色的工业互联网...
2022-05-18 14:09 -
已注销用户 赞赏了
Netflix真的会为「卖广告」掏出真心吗
2022-05-17 10:19 -
钛田097... 赞赏了
黑海粮仓“起火” ,全球粮食失衡
2022-05-09 19:50 -
钛i7Tw... 赞赏了
Bilibili Issues 10,000 NF...
2022-05-03 16:30 -
钛粉11841 赞赏了
式微的金三银四,进击的线上招聘 | 钛媒体深度
2022-04-28 00:39 -
钛粉70984 赞赏了
式微的金三银四,进击的线上招聘 | 钛媒体深度
2022-04-27 14:29 -
刘成军 赞赏了
【书评】工业互联网,如何开启工业全价值链价值重构的...
2022-04-20 15:10 -
钛粉12812 赞赏了
破发又大涨 海创药业“明天”的故事不好讲
2022-04-13 19:13 -
端生 赞赏了
孟晚舟归国首次亮相,华为年度净利润超1100亿元 ...
2022-03-29 17:26 -
钛粉04723 赞赏了
京喜基本退出社区团购
2022-03-28 12:53 -
钛粉34992 赞赏了
我和我的植物人女儿|钛媒体影像《在线》
2022-03-25 14:59 -
钛粉32623 赞赏了
“看风使舵”的摩根大通,为什么不值得信任?
2022-03-23 13:18 -
钛粉64062 赞赏了
酒店机器人离“万能”员工,还差多少笔融资?
2022-03-19 10:27 -
钛粉41134 赞赏了
俄乌战火中的中国留学生:我决定留下帮助普通人
2022-03-18 11:45 -
钛粉52609 赞赏了
半导体高管不断跳槽,背后透露什么信号?
2022-03-05 16:01 -
钛粉08632 赞赏了
叮咚买菜上海地区实现盈利,未来扭亏有望了吗?
2022-02-28 13:11 - 查看精彩文章,打开钛媒体客户端
挺钛度,加点码!
- ¥ 5
- ¥ 10
- ¥ 20
- ¥ 50
- ¥ 100
支付方式
支付
支付金额:¥6
赞赏金额:¥ 6
赞赏时间:2020.02.11 17:32
账户【未登录】提示!
个人中心将无法记录并同步您的赞赏记录,
是否进行登录
分享文章
Oh! no
您是否确认要删除该条评论吗?
猜你感兴趣
分享文章