online gambling singapore online gambling singapore online slot malaysia online slot malaysia mega888 malaysia slot gacor live casino malaysia online betting malaysia mega888 mega888 mega888 mega888 mega888 mega888 mega888 mega888 mega888 聯合學習(Federated Learning)如何解決數據隱私問題?

摘要: 在資料共享的大數據時代下,個人資料隱私問題也逐漸被大家重視,現在 AI 面臨的最大挑戰,就是要想出怎麼解決隱私問題,同時優化中心模型演算法。如今「聯合學習」(Federated Learning),做到了!

 


images/2021-05-10_110042.png

▲圖片標題(來源:Flickr)

我們都知道,要成為一個領域的專家,「經驗」正是其中關鍵 ,而 AI(人工智慧)演算法正是基於這樣的概念不斷突破進步。2015 年 10 月,電腦圍棋程式 AlphaGo 擊敗中國出生的法國職業二段圍棋棋士,樊麾,成為第一個無需讓子即可在 19 路棋盤上擊敗圍棋職業棋士的 AI,寫下了歷史,該事件更在 2016 年 1 月發表在知名期刊《Nature》上。

經過這件事後,AI 演算法被大量廣泛運用,科技的進步讓數據無所不在。

隱私法案的出現,讓資料取得出現重重阻力!

2018 年,臉書爆出 劍橋分析事件 後,各國更加重視資料隱私權,並紛紛祭出嚴格的隱私條款。

像歐盟就在 2018 年 5 月通過 GDPR(General Data Protection Regulation)法案, 明確規定所有與個人相關的資訊都是個人數據,對數據的使用行為必須要有用戶的明確授權與同意,這讓數據使用、整合與共享難上加難。

在這樣的挑戰下,Google 於 2016 年推出一項嶄新概念:「聯合學習」(Federated Learning)。

聯合學習(Federated Learning):改變醫療科技樣貌

聯合學習這項技術的優點特別適合用在醫療生態系統,徹底改變訓練人工智慧模型的方式。

過去為了保護病患隱私,醫院只能依賴自己收集的資料,很難取得大量的疾病資料,但是在聯合學習的協助下,多個組織可以合作開發模型,又不用彼此直接分享機密的臨床資料。

在經過多次訓練反覆運算的過程中,醫療機構之間的共用模型接觸到的資料量,會比任何單一組織內部擁有的資料量還要更多。

文章開頭提到「要成為專家一定要累積經驗」之談,運用在醫療情境中,就代表要成為醫學專家,少說也要工作 15 年才能培養出特定醫學專業能力,而這樣的專家一年大概要看 1.5 萬個病人,也就是說,這 15 年中醫生總共讀 22.5 萬個病例才能夠達到臨床等級的準確性。

但是如果今天是罕見疾病,就算是一位有 30 年經驗的專家,在醫學生涯中頂多也只能接觸到 100 個病患。

用去中心化的數據強化中心模型

為了訓練出與醫學專家水準相當的模型, 我們需要將大量病例投到 AI 演算法中,但是為了保護病患隱私,聯合學習不用把資料集中到一處,而是在分散的地方進行多次反覆運算,以訓練深度學習模型。

例如,有三間醫院決定合作開發一個自動分析腦瘤影像的模型。他們就需要使用客戶端伺服器, 省去建立「單一資料湖訓練模型」的過程 , 各參與的醫院只需從每個終端裝置傳送分析結果到「中央伺服器」就能訓練,還能將資料集存放在自己的安全基礎設施中。

中央伺服器再匯總各參與醫院送回的模型,同時將更新後的參數分享給參與的醫院,以便它們能夠繼續在客戶端進行訓練。

如果其中一間醫院決定要離開訓練團隊,模型訓練事宜也不會中斷,因為它並不依賴任何特定資料,新醫院也能選擇隨時加入這項訓練活動。

這只是聯合學習的多種作法之一,而這些作法的共通點是各參與者都能投入自己資料,又獲得完整知識,可謂是各方皆贏的作法。

轉貼自: 科技報橘

若喜歡本文,請關注我們的臉書 Please Like our Facebook Page:    Big Data In Finance

 


留下你的回應

以訪客張貼回應

0
  • 找不到回應