导航菜单

“联邦学习”引领者:微众银行AI团队如何推动国内人工智能+行业落地?

当我们谈论人工智能登陆时,我们在谈论什么?

件。这个项目有足够丰富和干净的大数据。然而,现实往往非常瘦。许多项目获得的数据是业内单山中的“数据岛”,不可能得到一个完整而全面的“数据大陆”。

这与传统垂直企业的数据收集和数据管理方法有关。整体呼声受到商业秘密,安全和管理因素的制约,互联互通面临巨大障碍,严重影响了AI +行业的进步和质量。

5月24日至5月25日,由中国计算机学会举办的“2019年CCF青年精英会议(YEF 2019)”,由魏中银行人工智能团队提出的“联邦移民学习”新方法及其创建开源“联合AI技术推动者”或未来十年领导AI +行业。

打破维度的墙壁并重振数据岛

虽然人工智能现在非常受欢迎,但我们认为“大数据”时代并未真正到来。该行业的实际情况是存在大量“数据孤岛”。这些“岛屿”大小不一,不均匀,并且彼此没有连接,使得AI难以着陆。

以金融业为例。它细分为银行,证券和保险等各个领域。虽然每个领域积累的数据方法和数据特征具有相同的部分,但差异更为明显。在此基础上,有一个更详细的数据分离,例如细分为银行的多个部门,所有部门都有自己的数据沉淀,但它们不是开放的。

在岛内,N个岛屿是分开的。就像俄罗斯娃娃一样,AI团队很难处理数据。他们需要说服公司的领导者访问多个部门的数据,并面临繁琐的审批流程。要说服不同公司提出自己的数据更难。

面对这个问题,AI从业者一直在努力。 Micro-Bank AI团队倡导的联合学习提供了一种新的思维方式。

顾名思义,所谓的“联邦研究”是建立一个虚拟的“联邦国家”,以统一大小的“数据岛”。它们就像是一个处于“联邦国家”的州,它保持一定程度的独立性(例如商业秘密,用户隐私),并且可以在不共享数据时联合建模和改进AI模型效应。

从本质上讲,它是一种加密的分布式机器学习技术,参与者可以在不显示基础数据和基础数据的加密(混淆)形式的情况下构建模型。这也是一种双赢的机器学习方法。它打破了山的数据维度墙,振兴了大大小小的“数据岛”,并加入了一个双赢的AI大陆。

将“移民学习”和“联邦学习”结合到“联邦移民学习”中,是CCF青年精英会议的人工智能行业的领导者,以及微银行的首席人工智能官员(CAIO)杨强教授。最新研究成果提到。

杨强教授认为,“移民学习”是将大数据转移到小数据,并实现相反的目的,而“联邦学习”允许多个参与者在没有本地合作的情况下协作处理数据。 “联邦移民学习”将“迁移”。学习和“联邦学习”相结合,帮助不同的组织打破差距,共同建立AI模型。同时,各方的数据不是本地的,用户隐私受到最好的保护。

“联邦移民学习”作为一种新的方法和处理数据的能力,其实用价值和安全性说服了许多公司共享数据,打破数据孤岛的障碍,建立跨域合作,实现多赢。

“联邦学习”的领导者

“联邦学习”是机器学习的新模式。它的历史只有三四年,主要是为了解决“数据孤岛”和数据隐私保护的两难问题。它得到了业界主流机构和专家的一致认可。

2016年,Google提出了一种基于个人终端设备(C端)的“水平联合学习”算法框架。在中国,微中银行的AI团队是最早的“联邦学习”倡导者,并根据自己的实践,提出“联邦移民学习”,主要是为了解决B端机构联合建模的问题,让“联邦学习”更为一般。

它不再是一个概念,而是人工智能+工业浪潮中的武器。

据报道,在不侵犯企业用户数据的情况下,威中银行采用“联邦学习”技术,除了央行的信用数据和水资源数据外,还能够证明数据的不同方面,如发票公司业务健康状况的数据。建模,小微企业经营状况和信用的360度模型评价,小微企业风险控制模型绩效提升7%,大大扩大了可贷企业的范围。

效果也很明显。 68%的小额信贷客户在获得信贷时没有任何公司贷款记录; 38%的信贷小额信贷客户在获得信贷时没有任何个人经营贷款记录。

此外,微中银行成功实施了风险评估,差别定价,精准营销等多种财务方案,帮助威中银行实现业务创新,使金融服务覆盖面不断提升,社会价值贡献进一步提升。增强。反映。

推动潍坊银行人工智能团队率先开展“联邦学习”研究,并将其应用于企业,是潍坊银行首席人工智能官杨强教授。根据数据,杨强教授是最早研究“联邦学习”的国际人工智能专家之一。2013年,他当选为国际人工智能协会(AAAI)院士。2017年,他当选为国际人工智能联合会主席,超过400人。关于人工智能和数据挖掘的论文被多次引用。微行人工智能团队成员也是具有丰富经验和人工智能技术深度积累的高端人才。

人工智能是一个由强大的技术推动的产业。”在杨强教授的领导下,微型银行人工智能团队已成为国内外“联邦学习”的领导者。

去年10月,微型银行人工智能团队向IEEE标准协会(IEEE Standards Association)“联邦机器学习体系结构框架和应用指南”提交了建立联邦学习标准的提案,并获得批准。

今年,杨强教授作为AAAI2019年大会的特邀嘉宾,以“gdpr、数据短缺、人工智能”为主题,对“联邦移民学习”的安全分布进行了全面描述。建模原理和数据遵从性的重要性引起了国际人工智能界的强烈关注。

不仅仅是金融,创造一个人工智能大数据生态系统

由于数据相对完整,场景要求较强,金融业被认为是人工智能应用最成熟的领域之一。然而,微型银行人工智能团队的“联邦移民学习”能力并没有停留在人工智能+金融行业。

“数据岛”问题也存在于其他领域。

。他们必须经过相关部门的批准,法官和律师的参与才能标记样本,这样就不会产生带有注释的高质量数据。更困难的是,这些数据分散在各地的各个法院,需要收集和面对监督和程序是令人讨厌的。

幸运的是,在金融领域充分实践的“联邦移民学习”模式在其他领域复制得很好。在这方面,Micro-Bank AI团队发布了联合人工智能生态系统,以吸引更多从业者通过FIDE(联合AI技术启动器)参与数据安全的开发和推广。和AI技术及其在用户隐私保护下的应用。

作为联邦学习领域的第一个商业级开源项目,FATE为开发人员提供了必要的多方协作建模工作流管理,加密机器学习工具库和并行计算基础架构抽象三层功能,同时提供了大量的开箱即用即用型“联邦学习”算法和“联邦迁移学习”算法供开发人员参考,大大简化了联盟AI开发过程并降低了部署难度。自推出以来,它吸引了众多品牌首次加入。

不久前,Micro-Bank AI团队和Extreme Vision联合创建了一个城市管理领域的联邦学习视觉应用项目。传统的城市监控设备管理面临更少的标签,数据分散,集中管理成本高,模型更新和反馈具有离线延迟。联邦学习允许监控终端在不上传数据的情况下执行在线模型更新反馈,并且该模型具有高的改进率。 15%,模特效果不失。

这只是联邦学习应用程序的典型示例之一。基于FATE提供的分布式数据隐私保护安全计算框架和友好的跨域交互信息管理解决方案,更多企业将加入并提出自己的累积数据,共同构建安全高效的AI大数据生态系统。最后,我们将支持自己的业务并实现产业升级。

技术是好的,更安全的AI时代

自去年以来,新的国际形势对中国的科技界提出了更高的要求。基础学科的大规模投资,知识产权保护和个人隐私的重要性达到了前所未有的高度。

人工智能的着陆伴随着与各种数据的“亲密接触”。如何保护隐私和处理数据安全问题一直是业界关注的焦点。越来越严格的法律也给AI从业者带来了新的要求和挑战。

历史上最严格的“数据隐私保护法案”欧盟数据隐私保护法的一般数据保护法规(GDP)最近调查了谷歌等巨头违反数据隐私法并以数据隐私为借口。一个事实是保护隐私是一个大趋势,世界正在加强有关数据隐私保护的立法。

隐私和数据安全,领先的公司必须带头。必须解决的问题。

上个月,腾讯首席执行官马化腾表示,腾讯将调整其愿景并采取“技术走向良好”的路线。这是腾讯自推出工业互联网以来一直强调的新概念。

科学技术是好的,实质是利用科学技术的力量使世界变得更美好。例如,张小龙说,不可能使用技术常规用户,例如,诺贝尔奖获得者Deaton说,人工智能技术的发展需要考虑隐私保护,这是一种积极的“善”行为。发展科学技术的过程。技术本身是一把双刃剑。从业者应该总是管理他们的手或者试图使他们的剑更友好。毕竟,技术发展的最终目标是更好地使公众受益。此时,威中银行的概念与腾讯类似,创新的“联邦移民学习”技术就是最好的证明。这是一款优秀而友好的剑,专为AI +行业而设计,旨在启动这项技术授权之战。

联邦移民学习的另一个优势是保护隐私并确保数据安全。它克服了用户的政策,监督和技术保护。同时,它可以将碎片化数据岛组装成一个“大联盟”,既满足了隐私保护,又实现了数据的发展。

早些时候,在谈到人工智能威胁理论时,伊隆马斯克一再强调隐私保护和数据安全对人类的重要性。如果方法不正确,盲目使用收集的数据可能会对人类产生很大的负面影响,间接阻碍人工智能的发展。 “联邦移民学习”考虑到数据的发展和隐私保护,确保人工智能登陆的安全进步。

人工智能在B侧的着陆已达到历史关键点。威中银行人工智能团队的努力旨在利用最新的机器学习技术,汇集人才的优势,构建“可持续,和谐,共赢”的人工智能生态系统,为下一步的人工智能立法和监督提供更多的技术基础。促进行业进入更安全的人工智能时代。