谷歌TensorFlow 2.0:新增兩大模塊保護(hù)用戶數(shù)據(jù)隱私
TensorFlow是由谷歌人工智能團(tuán)隊(duì)“谷歌大腦”開(kāi)發(fā)和維護(hù)的一個(gè)基于數(shù)據(jù)流編程的符號(hào)數(shù)學(xué)系統(tǒng),擁有多層級(jí)結(jié)構(gòu),是一個(gè)人工智能框架。TensorFlow 可部署于各類服務(wù)器、PC終端和網(wǎng)頁(yè)并支持GPU和TPU高性能數(shù)值計(jì)算,被廣泛應(yīng)用于各類機(jī)器學(xué)習(xí)算法的編程實(shí)現(xiàn),其前身是谷歌的神經(jīng)網(wǎng)絡(luò)算法庫(kù)DistBelief。自2015年11月9日起,TensorFlow依據(jù)阿帕奇授權(quán)協(xié)議(Apache 2.0 open source license)開(kāi)放源代碼。
3年多后,谷歌發(fā)布了TensorFlow 的第二代版本,不僅提升了可用性,增加了Eager Execution的支持,讓TensorFlow 2.0可以更快地啟動(dòng)AI模型,同時(shí)還新增了兩大互補(bǔ)模塊保護(hù)用戶數(shù)據(jù)隱私。
3月初,谷歌推出了其人工智能框架TensorFlow的2.0版本,以及兩個(gè)能夠讓算法更負(fù)責(zé)任地處理用戶數(shù)據(jù)的互補(bǔ)模塊。
首先,TensorFlow 2.0重點(diǎn)提高了可使用性。為此,其中還接入了基于Keras的簡(jiǎn)化應(yīng)用編程接口。Keras是一種開(kāi)源工具,能夠使人工智能開(kāi)發(fā)框架更易于使用,它允許工程師在一個(gè)位置訪問(wèn)以前分布在多個(gè)API中的功能,并提供更多自定義開(kāi)發(fā)工作流程的選項(xiàng)。
此外,TensorFlow 2.0的另一個(gè)關(guān)鍵升級(jí)是增加了Eager Execution的支持。這讓TensorFlow 2.0可以更快地啟動(dòng)AI模型,通過(guò)更短的測(cè)試運(yùn)行延遲,讓工程師們可以嘗試不同的模型變量。考慮到機(jī)器學(xué)習(xí)開(kāi)發(fā)的高度迭代性,這將節(jié)省大量的時(shí)間成本。
值得一提的是,盡管TensorFlow 2.0在功能上有了顯著的提升,但這次發(fā)布最引人關(guān)注的卻是另外兩個(gè)互補(bǔ)模塊,這兩個(gè)模塊旨在幫助開(kāi)發(fā)人員直接在AI軟件中構(gòu)建隱私控制,從而更好地保護(hù)用戶信息。
其中,第一個(gè)模塊是TensorFlow Privacy。通過(guò)自動(dòng)過(guò)濾與算法通常接收的信息不同的輸入,機(jī)器學(xué)習(xí)模型就能夠自動(dòng)篩除潛在敏感數(shù)據(jù)。例如,基于AI的拼寫檢查工具往往將字母作為輸入,這意味著它可以輕松識(shí)別和過(guò)濾諸如信用卡號(hào)之類的長(zhǎng)數(shù)字序列。
“TensorFlow Privacy并不要求使用者必須具備隱私或基礎(chǔ)數(shù)學(xué)方面的專業(yè)知識(shí),那些使用標(biāo)準(zhǔn)TensorFlow的開(kāi)發(fā)者也不需要改變他們的模型架構(gòu)、培訓(xùn)程序或流程就可以正常使用。”谷歌工程師Carey Radebaugh和Ulfar Erlingsson在博客中這樣說(shuō)。
另一個(gè)新的隱私模塊名為TensorFlow Federated,它主要針對(duì)越來(lái)越多依賴于AI支持核心功能的移動(dòng)服務(wù)。
由于移動(dòng)設(shè)備的處理能力有限,應(yīng)用通常會(huì)將用戶數(shù)據(jù)發(fā)送到云的后端進(jìn)行分析,然后通過(guò)機(jī)器學(xué)習(xí)對(duì)數(shù)據(jù)進(jìn)行處理。而TensorFlow Federated讓應(yīng)用可以直接在用戶手機(jī)上執(zhí)行分析。然后,開(kāi)發(fā)人員可以收集所得到的分析結(jié)果,并利用這些結(jié)果改進(jìn)AI算法,而無(wú)需再訪問(wèn)基礎(chǔ)數(shù)據(jù)。這將大大保護(hù)消費(fèi)者的隱私。
“通過(guò)TFF [TensorFlow Federated],我們可以展示我們所選擇的機(jī)器學(xué)習(xí)模型架構(gòu),然后對(duì)所有數(shù)據(jù)進(jìn)行訓(xùn)練,并保持每個(gè)編寫器的數(shù)據(jù)的獨(dú)立和本地化。”谷歌參與這個(gè)項(xiàng)目開(kāi)發(fā)的兩位工程師Alex Ingerman和Krzys Ostrowski在博客文章中這樣寫道。
據(jù)了解,與TensorFlow本身相似,這兩個(gè)新模塊將以開(kāi)源許可的形式提供給用戶。
本文章選自《AI啟示錄》雜志,閱讀更多雜志內(nèi)容,請(qǐng)掃描下方二維碼
