人工智能下一階段 為啥要看互聯(lián)網巨頭?
回顧過去的十余年,人工智能的進步可謂“耀眼”。尤其是從2015年“阿法狗”橫空出世之后,人工智能行業(yè)的發(fā)展速度一騎絕塵。歸根結底,是人類在人工智能領域探索50余年,最終才在半導體技術和軟件技術的幫助下,找到了機器學習領域的突破口。
從2015年起,人工智能行業(yè)的發(fā)展主題就是把機器學習突破這條“小路”拓寬。安防監(jiān)控、證券自動交易、文字翻譯等一批領域,首先迎來了人工智能的“覺醒”,這與它們自身的數(shù)據(jù)屬性有很大的關系:安防監(jiān)控的數(shù)據(jù)都是圖像畫面;證券行業(yè)本身就是數(shù)字游戲;人類歷史上翻譯過的書籍不計其數(shù)。
可隨著時間的推移,人們發(fā)生事情開始轉變——在越來越多的應用場景下,數(shù)據(jù)反倒成為了阻礙人工智能的最大因素。一來越來越復雜的人工智能需要的數(shù)據(jù)量直線上升,二來現(xiàn)實中的數(shù)據(jù)孤島、數(shù)據(jù)隱私問題難以解決。
對于人工智能行業(yè)、亟待人工智能幫助升級的各個產業(yè)而言,這都是一個避無可避的挑戰(zhàn),下一階段的智慧產業(yè)必須找到在種種數(shù)據(jù)限制下繼續(xù)前進的路徑。
目前,“聯(lián)邦學習”是目前行業(yè)內公認最靠譜的解決方法,通過將機器學習與其他數(shù)據(jù)技術結合,為多方數(shù)據(jù)特征合作構建一個完全由計算機掌控、高效進行數(shù)據(jù)價值挖掘的系統(tǒng)。
近日騰訊安全發(fā)布的聯(lián)邦學習應用服務(FLAS),是國內“聯(lián)邦學習”技術在應用領域的最新成果。通過低成本快速迭代的聯(lián)合建模服務,F(xiàn)LAS能夠在保護所有參與方隱私的同時,有效釋放出各方大數(shù)據(jù)生產力,廣泛適應于業(yè)務創(chuàng)新的應用場景。
數(shù)據(jù),當下人工智能發(fā)展的“暗坎”
在機器學習這條路徑當中,數(shù)據(jù)一直扮演著相當重要的角色。雖然各個應用場景存在很多差異,但有兩點是一致的:數(shù)據(jù)越多越好;數(shù)據(jù)的維度越多越好。
數(shù)據(jù)量的需求可以參考AlphaGo,Google旗下的DeepMind總共花了兩年時間,最終創(chuàng)造出強大、全面超越人類的圍棋人工智能Alpha Zero。相比最早期使用了16萬盤人類棋局數(shù)據(jù)、能夠戰(zhàn)勝入門職業(yè)選手的AlphaGo,Alpha Zero使用了286億盤、包含人類和機器生成的棋局數(shù)據(jù),兩者相差達到18000倍。
數(shù)據(jù)的維度也相當重要,圍棋絕對算是一次艱巨的挑戰(zhàn),但棋局實際上都發(fā)生在半米見方、只有16行16列黑白子的棋盤之上。圍棋相比現(xiàn)實中的問題,實在是太“簡單”了,所以在解決現(xiàn)實問題的過程中,往往會用到數(shù)倍于簡單場景的數(shù)據(jù)維度。
從數(shù)據(jù)需求的角度出發(fā),人工智能的應用落地顯然應該把所需要的一定量、一定維度的數(shù)據(jù)聚集到一起,然后用足夠的計算力將它們變成可以執(zhí)行的神經網絡。很可惜,這樣的操作是不現(xiàn)實的。
現(xiàn)實世界中,人工智能所需的數(shù)據(jù),大多都會以“數(shù)據(jù)孤島”的方式分布。行業(yè)與行業(yè)、企業(yè)與企業(yè),甚至部門與部門之間,都會存在現(xiàn)實的“數(shù)據(jù)鴻溝”。對于自身數(shù)字經營過程中產生的新型資產,每個主體的數(shù)據(jù)都是寶貴的,更不要提其中涉及到的用戶隱私問題。
近些年愈發(fā)嚴厲的數(shù)據(jù)法規(guī)也帶來了很大的挑戰(zhàn),2018年歐盟帶頭建立新法案《通用數(shù)據(jù)保護條例》(GDPR),對企業(yè)使用用戶數(shù)據(jù)進行了仔細而全面的規(guī)定。隨之而來的,是對于企業(yè)的實際處罰。截止至2019年9月24日,22家歐洲數(shù)據(jù)監(jiān)管機構對共87件案件作出了總計3.7億歐元的行政處罰決定。
中國也在2017年起實施《中華人民共和國網絡安全法》和《中華人民共和國民法總則》,明確了網絡運營者不得泄露、篡改、毀壞其收集的個人信息。同時,新的《個人信息保護法》、《數(shù)據(jù)安全法》也在從草案落實成法案的過程中。這些新數(shù)據(jù)法規(guī)的落地實施,必然會對人工智能數(shù)據(jù)的收集與使用造成了直接的影響。
現(xiàn)實中的種種情況,讓人工智能技術落地這一征程,從最早的核心技術驅動,轉向了應用中現(xiàn)實問題的解決,也就是如何克服現(xiàn)有的人工智能數(shù)據(jù)問題。
人工智能行業(yè)其實早早地給出了解決方案——“聯(lián)邦學習”,即在基礎的人工智能機器學習核心能力,與一系列數(shù)據(jù)技術、系統(tǒng)邏輯架構結合,打造出一套系統(tǒng)化的解決方案。利用額外的計算力和網絡資源,來實現(xiàn)多方數(shù)據(jù)價值的匯總,同時實現(xiàn)原始數(shù)據(jù)不出本地、實際的應用效果還能逼近于直接匯總數(shù)據(jù)的機器學習。
聯(lián)邦學習應用服務,幫助銀行業(yè)解決現(xiàn)實問題
在實際的應用中,金融行業(yè)成為聯(lián)邦學習應用服務的重點落地領域。銀行等金融機構長期以來都面對著數(shù)據(jù)難以融合的問題:作為提供資金往來、各種金融服務的商業(yè)機構,并不缺乏數(shù)據(jù)量。但這些數(shù)據(jù)大部分都是用戶的交易數(shù)據(jù),維度相對單一,導致數(shù)據(jù)的價值很難挖掘。
無論是識別信用卡使用中的違規(guī)現(xiàn)象、風險提示,抑或是為用戶提供特定的營銷推薦,促進業(yè)務發(fā)展,它們最終服務的對象都是真實的人類客戶。后者在實際的生活中其實會源源不斷產生各種數(shù)據(jù):社交、消費、金融、空間。想要更好地挖掘銀行客戶的價值,就必須把這些不同類別的數(shù)據(jù)都加入分析,進而形成對客戶的整體性認識。
跨多個行業(yè)、很有可能涉及用戶隱私風險,這顯然是聯(lián)邦學習發(fā)揮自身能力最好的舞臺。而騰訊安全最新推出的“騰訊安全聯(lián)邦學習應用服務”就是聯(lián)邦學習應用落地領域最新、最有潛力的“舞者”。
騰訊安全聯(lián)邦學習應用服務是一套典型的縱向聯(lián)邦學習解決方案,這一類方案通過融合多個機構對相同樣本的不同觀察進行AI聯(lián)合建模,最終形成一套針對擁有異構數(shù)據(jù)的機構,如銀行、電商等的聯(lián)合建模服務。通過采用這套應用服務,最終的數(shù)據(jù)提供用戶隱私得到保障,且各方的數(shù)據(jù)安全更加可靠,同時全面釋放出大數(shù)據(jù)生產力。
作為一家覆蓋眾多用戶應用領域的互聯(lián)網巨頭公司,以及“聯(lián)邦學習”本身所具有的前沿技術特性,讓騰訊安全聯(lián)邦學習應用服務從一開始就具備了與目前各種聯(lián)邦學習項目不同的特點。
首先是“經驗”,得益于騰訊自身眾多產品、服務,騰訊安全20余年來累積了大量的黑灰產庫,形成了包含百億點、千億邊的黑灰產知識圖譜,安全服務已經覆蓋中國99% 的網民。
其次是騰訊先進的云計算技術能力,整套騰訊安全聯(lián)邦學習應用服務既可以基于公有云、也可以基于私有云部署,在具體的部署方式上還支持輕量、便捷、易拓展、易管理的容器技術。
最后是騰訊的互聯(lián)網“內功”,在騰訊打造聯(lián)邦學習應用服務的過程中,充分發(fā)揮了騰訊內部的互聯(lián)網產品和工程能力,針對聯(lián)合建模過程中的通信、穩(wěn)定性進行了專門的優(yōu)化:通過通信次數(shù)優(yōu)化、中間結果壓縮,減少了聯(lián)合建模過程中需要傳輸?shù)臄?shù)據(jù)量,提高效率;另外對于網絡環(huán)境造成的傳輸中斷,專門打造了模型的斷點備份功能,即便數(shù)據(jù)傳輸中斷也能斷點重啟,而無需再從零開始。
目前,騰訊安全聯(lián)邦學習應用服務在實際業(yè)務實踐中,聯(lián)合建模新模型的AUC值提升10%-15%,最大KS值提升50%左右。已經與江蘇銀行、濟寧銀行、湖北消金、玖富數(shù)科、嘉銀金科等金融機構達成合作,實現(xiàn)了數(shù)據(jù)價值的雙向賦能。
互聯(lián)網巨頭,下一階段人工智能的領路人?
放眼人工智能的整體發(fā)展趨勢,2000年后取得重大突破的機器學習,還將作為人工智能的主要“突破口”,數(shù)據(jù)也將扮演整個人工智能實現(xiàn)過程中的關鍵角色。
在人工智能持續(xù)的落地中,機器學習這把“大錘”的發(fā)展已經開始放緩,在解決了各行各業(yè)當中的許多“小釘子”之后,必然需要面對更加難解決的“大釘子”。在短時間內沒有辦法快速把“錘子”變大的前提下,要通過多人協(xié)作——讓多個“錘子”勁往一處使的操作方法,來保持、甚至加速人工智能的發(fā)展。
但聯(lián)邦學習終究只是一項技術,它需要面對一系列前提,應用方需要具備:基礎的人工智能技術研究實力、多方共同聯(lián)邦學習系統(tǒng)的工程能力、多方實際操作中的積極參與、相當?shù)那捌谕度肱c失敗風險。這些對于普通公司和組織不可能的前提條件,對于騰訊這樣的互聯(lián)網巨頭就簡單多了。
就像騰訊安全聯(lián)邦學習應用服務一樣,騰訊不僅為客戶構建了實現(xiàn)聯(lián)邦學習的通路,同時也將自己積累的寶貴安全黑灰產庫加入到了產品服務當中,這種開放、共享合作的心態(tài)與行為,很可能會成為未來人工智能發(fā)展的重要推動力。
來源:安防展覽網
- 相關推薦
- 體檢排隊叫號系統(tǒng)功能要點
- 分診排隊叫號系統(tǒng)讓醫(yī)生/護士隨時掌握
- 全視通ICU探視對講解決方案:讓重癥患者與家屬更加親近
- 全視通智能導診系統(tǒng),解決醫(yī)院患者排隊叫號難題
- 如何用信息化手段解決醫(yī)療廢物管理難題?全視通給你答案!
- 全視通智慧機構養(yǎng)老方案助力養(yǎng)老機構星級評定,提升服務質量和效率
- 如何打造智慧校園的同步時鐘系統(tǒng)?全視通給你答案
- 高考考場時間同步問題引發(fā)廣泛關注,全視通考場時鐘同步系統(tǒng)解決難題
- 醫(yī)院時鐘同步系統(tǒng):精準的“生命鐘”守護患者安全
- 考場時鐘同步系統(tǒng),讓考試更公平、更安全、更高效