从征服天空的殿堂AI,到走出大山的就业工具


【资料图】

作者/ IT时 报记者 孙妍

编辑/ 孙妍

3年,靴子落地,蚂蚁集团完成整改。

蚂蚁在调整中前进,越过山丘却始终未变的是,科技这一核心基因。这3年以来,每年世界人工智能大会(下简称WAIC)都是蚂蚁集团AI技术“大赏”,也见证了蚂蚁“根技术”的进化。其实3年前,在准备IPO之前,蚂蚁集团就已明确自身定位是科技公司,而非金融公司。

在WAIC 2023上,一半的国产大模型都来“秀肌肉”,或将成为“百模大战”的开端。但蚂蚁却另辟蹊径,当AIGC被幻觉频发、结果不可控、隐私安全、歧视偏见等问题困扰时,蚂蚁祭出了给AI“祛毒”的一招:AI安全检测平台“蚁鉴”,用生成式AI能力检测生成式AI模型。

去年WAIC 2022,蚂蚁就展示了隐私计算、区块链、图计算这三大“根技术”。今年WAIC 2023上,这三大“根技术”开花结果,“蚁鉴”升级为“蚁鉴”,增加了AIGC安全检测;隐私计算“隐语技术栈”开源升级,推出隐语框架,并开源首个国产金融安全级TEE方案“HyperEnclave”;蚂蚁区块链隐私协作平台AntChain FAIR 全新架构升级,引入零知识证明(ZKP)为核心的可验证计算技术,在Web3技术攻坚上再进一步。

大模型的“安全体检软件”

“百模大战”开启中国AI追赶赛,自然不是一件坏事,但当人类开始依赖大模型这一生产工具,如果大模型胡说八道,谁来判定它是对是错,它产生的假数据是否会污染数据池?

在WAIC 2023上,蚂蚁集团联合清华大学发布AI安全检测平台“蚁鉴”,用生成式AI能力检测生成式AI模型,可识别数据安全、内容安全、科技伦理三大类数百种风险,覆盖表格、文本、图像等多种数据和任务类型,是业内首个实现产业级应用的全数据类型AI安全检测平台。

在展台C位,《IT时报》记者见到了这一大会的“镇馆之宝”——“蚁鉴”,左侧的“蚁鉴机器人”自动生成海量测试集,对右侧的大模型进行交互诱导,每分钟可调用10余种不同难度系数的对抗手法生成超过30个诱导问题。它很像一个24小时不眠不休的“安全黑客”在找茬大模型,比“安全黑客”更智能的是,在诱导的同时,会对大模型的回答进行实时、自动化的检测计算,从近200个子类纬度,找到大模型存在的弱点和安全问题,最后生成大模型的安全体检报告。

“生成式大模型是一种‘深黑盒’技术,这种AI对AI的评测是教学相长,好比生成式考官考核生成式运动员,在对抗中双方能力互相提升,进一步提高整个行业的AI安全水位。”蚂蚁集团大安全事业群技术部总裁李俊奎表示。

另一项硬核能力是,“蚁鉴”融入了可解释性检测工具,从完整性、准确性、稳定性等7个维度及20余项评估指标,对AI系统的解释质量量化分析,帮助用户更清晰验证与优化可解释方案。

“蚁鉴”集成了蚂蚁近10年可信AI实践、1000余项可信AI专利,支持零编码测评。开发者通过API接口,将AI模型接入蚁鉴,就可以一键识别和挖掘模型漏洞。

蚂蚁集团宣布,“蚁鉴”全面开放,面向全球开发者免费提供AIGC安全性、AI可解释性、AI鲁棒性三项检测工具,可服务于数字金融、教育、文化、医疗、电商等领域的大规模复杂业务场景。

当然,大模型是对是错的标准如若只是“一家之言”,是没有说服力的。于是,中国信通院、上海人工智能实验室、武汉大学和蚂蚁集团等多家单位共同发起《AIGC可信倡议》。该倡议得到数十家单位参与,围绕人工智能可能引发的经济、安全、隐私和数据治理等问题,提出构建AIGC可信发展的全球治理合作框架,采用安全可信的数据资源、技术框架、计算方法和软件平台等提升AIGC可信工程化能力,最大限度确保生成式AI安全、透明、可解释。

云的下一步是天空计算

上榜WAIC 2022“八大镇馆之宝”之一的是蚂蚁另一项产品:可信隐私计算隐语技术栈。该技术栈历时6年研发,今年,蚂蚁将该隐私计算技术栈里的两大产品开源,分别是“隐语开源框架”和首个国产金融安全级TEE方案“HyperEnclave”。

“隐语开源框架”是“隐语技术栈”中的计算引擎层,HyperEnclave是其可信基座。该技术栈是蚂蚁自研,积累了千余项专利,集合了隐语开源框架、Occlum TEE开源操作系统,HyperEnclave等隐私计算技术产品,孵化了可信密态计算(TECC)等新型隐私计算技术。此次开源两个新产品功能,有望为隐私计算在易用、通用性上带来跨越式提升。

隐语框架去年7月首次开源,历时1年升级到版,更好地实现了“拎包入住”式服务。新版本有三大优势:解决与第三方系统互通等问题,打造黑白盒全栈互联互通能力,推出“开箱即用”轻量化部署体验包,降低了隐私计算应用门槛。

TEE是隐私计算的技术路线之一,被认为是数据安全上云和隐私保护计算的最有效技术手段。此次开源的HyperEnclave的优势是安全、兼容。它支持国内外主流CPU硬件平台,提供统一TEE抽象,核心代码经过形式化验证。同时,它满足国产自研要求,已具备规模化商业场景的落地经验。

一些技术“软基建”也有了重要进展。IEEE(电气与电子工程师协会)发布了行业首个“可信执行环境安全”国际标准IEEE2952-2023。该标准由蚂蚁集团牵头,制定了基于TEE技术的安全计算系统的技术框架,中国信通院、中国移动、中国联通、中国电信、蚂蚁集团和洞见科技联合发布了《隐私计算 跨平台互联互通开放协议 第2部分:SS-LR》。该协议将搭建更加开放、透明、安全的隐私计算互联互通平台,保护数据安全。

“云的下一步将是天空计算”,在蚂蚁集团副总裁、首席技术安全官韦韬看来,隐私计算可以摆脱云的束缚,实现云与云的互通,计算、大数据和数据要素密态化是必经的三大阶段,核心是降低数据流通和安全保障的成本。

产业数字化是最大的确定性机会

在一个不确定的时代,大家都在找一个确定性机会。“产业数字化是数字经济的核心领域,是最大的确定性机会。”蚂蚁集团资深副总裁蒋国飞在WAIC 2023上说道。

蚂蚁区块链(蚂蚁链)一直在挖掘一条Web3之路,今年WAIC 2023上,蚂蚁链宣布隐私协作平台 AntChain FAIR 全新架构升级,引入零知识证明(ZKP)为核心的可验证计算技术,从可信数据流转拓展到计算过程、数据属性以及身份的可验证。

目前,FAIR 已经在杭数交、贵数所等多家数据交易所应用。

零知识证明被业内看作是 Web3 下一个 5 年最关键的技术之一,它指的是证明者能够在不向验证者提供任何有用信息的状况下,使验证者相信某个论断是正确的。相较于隐私计算强调在保护数据隐私基础上进行数据分析和计算,零知识证明的特点在于“可验证”。

元宇宙不能建立在沙滩上,AI大模型训练、 身份验证、 数据流转、资产交易、链上链下协同等 也要基于全流程可信,这将 加速 Web3从数字世界向更复杂的产业场景渗透。

零知识证明最关键的环节是“证明生成阶段”,即对数据、身份、计算过程等生成一个“证明”。蚂蚁链通过在软件算法优化,“证明生成”端到端加速了原有基线的倍。

作为国内最早布局 Web3 技术的厂商,蚂蚁链在 Web3 技术领域全面自主可控,区块链、隐私计算等授权专利全球第一。

AI走进田间地头

AI训练师走出大山

对于来百姓来说,蚂蚁根植多年的“根技术”或许晦涩难懂。不过这几年,蚂蚁一直将技术落地的重点放在实体经济,尤其是帮小微群体创造更大的价值,而这正是老百姓能切身体会到的AI。

AI走进了田间地头,以前,农村网贷的授信调查都是要靠双腿去跑的。现在,网商银行基于“AI+遥感”技术研发的大山雀系统,首次将卫星遥感技术应用于农村金融领域,解决农户在无抵押、无担保、不提交纸质材料的情况下的授信问题。在贷款授信环节,大山雀系统通过深度学习等人工智能技术来观察和解析卫星图像,识别作物的种植面积、种类和长势,预测产量产值,从而给予合理的额度。目前大山雀系统已覆盖31省市自治区,服务超过120万种植户。

来自甘肃省积石山县的人工智能训练师张娟走出县城,像她一样,更多的AI训练师来到WAIC这个世界舞台,与大模型企业们面对面。在AI越来越聪明的背后,少不了AI训练师一步步教它,把图片、语言、文本、视频等原始数据标注成AI能理解的结构化语言。

2019年,蚂蚁集团、蚂蚁公益基金会联合中国妇女发展基金会等共同发起“数字木兰|AI豆计划”,至2022年底,该计划已支持在陕西、山西、甘肃、贵州、宁夏等地建立了17个县域数字就业中心,累计帮助4000人在地就业,成为“人工智能训练师”,其中超过6成员工为女性。相关数字就业中心所开展的标注业务,已经涵盖200余个具体应用场景,年数据标注量过亿,多个中心成为当地最大用工企业。

从征服天空的殿堂科技,到走出大山的就业工具,AI的意义是在自我学习中成就社会,而企业也该从自我调整中越过高峰和低谷,创造更多机会与未来。

排版/ 季嘉颖

图片/ 蚂蚁集团

来源/《IT时报》公众号vittimes

E N D

请加「 星标 」不错过我们


关键词: