首頁 > 資訊 > 科技 > 正文

快訊:數(shù)據(jù)匿名化或難以保護(hù)個(gè)人隱私

2019-07-24 14:11:59來源:科技日報(bào)

僅僅已知有限幾個(gè)屬性,就可以在數(shù)據(jù)海洋中準(zhǔn)確識別你的身份嗎?據(jù)英國《自然·通訊》雜志23日發(fā)表的一項(xiàng)研究,英國科學(xué)家利用一種新開發(fā)的...

僅僅已知有限幾個(gè)屬性,就可以在數(shù)據(jù)海洋中準(zhǔn)確識別你的身份嗎?據(jù)英國《自然·通訊》雜志23日發(fā)表的一項(xiàng)研究,英國科學(xué)家利用一種新開發(fā)的統(tǒng)計(jì)方法,評估了一個(gè)人的身份能否從一個(gè)不完整的匿名化數(shù)據(jù)庫中被識別出來。結(jié)果認(rèn)為,目前的匿名化和數(shù)據(jù)共享方法,可能不足以保護(hù)個(gè)人隱私或滿足數(shù)據(jù)保護(hù)法律法規(guī)的要求——如歐盟的《通用數(shù)據(jù)保護(hù)條例》(GDPR)。

數(shù)據(jù)科學(xué)和人工智能有望變革我們?nèi)粘I畹姆椒矫婷妫玑t(yī)療、衛(wèi)生保健、商業(yè)和治理。這些方法依賴于大規(guī)模的詳細(xì)個(gè)人數(shù)據(jù),但是收集和共享個(gè)人數(shù)據(jù),已經(jīng)引發(fā)了有關(guān)個(gè)人隱私的擔(dān)憂。針對這個(gè)問題,目前的解決措施包括匿名化處理和公布不完全的數(shù)據(jù)集。但是,近期已經(jīng)發(fā)生了利用匿名數(shù)據(jù)集,包括瀏覽歷史記錄、手機(jī)和信用卡數(shù)據(jù),成功重新識別出個(gè)體身份的情況,這表明上述措施還不夠充分。

為了進(jìn)一步證明這一問題的嚴(yán)重性,英國帝國理工學(xué)院研究團(tuán)隊(duì)新開發(fā)了一種統(tǒng)計(jì)方法,能夠準(zhǔn)確估算通過匿名數(shù)據(jù)集正確地重新識別個(gè)體身份的可能性。研究人員發(fā)現(xiàn),只需要知道少數(shù)幾個(gè)屬性,如郵政編碼、出生日期、性別和子女?dāng)?shù)量,一般就能夠以高可信度重新識別出個(gè)體身份——即使數(shù)據(jù)集是不完整的。而已知屬性越多,識別的可能性越大。例如,99.98%的馬薩諸塞州人口,可以通過15個(gè)人口統(tǒng)計(jì)學(xué)屬性識別出來。

因此,研究團(tuán)隊(duì)總結(jié)認(rèn)為,目前通常所采用的只公布取樣數(shù)據(jù)集或不完全數(shù)據(jù)集,尚不足以很好地保護(hù)個(gè)人隱私。

責(zé)任編輯:孫知兵

免責(zé)聲明:本文僅代表作者個(gè)人觀點(diǎn),與太平洋財(cái)富網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實(shí)相關(guān)內(nèi)容。
如有問題,請聯(lián)系我們!