審視人臉識別:一種AI技術的全球性濫用( 三 )


抵制人臉識別的關鍵詞之二:
隱私
除了放大人類現有社會系統的偏見 , 對侵犯個人隱私的擔憂 , 形成另一股強大的反對聲浪 , 矛頭直指大型科技公司 。
眾所周知 , 一個人臉識別系統要發揮作用 , 還需要通過大型圖像數據集進行訓練和測試 。 理想情況下 , 需要在不同的光照條件下和不同的角度多次捕獲人臉圖像 。 沒有大量數據的情況下訓練人臉識別算法的普適方法 , 仍未出現 。
那么 , 這些數據從哪來?
1990 年代和 2000 年代 , 科學家們收集研究所需的數據一般會通過招募志愿者的方式 。 但現在 , 這個光榮傳統幾乎退出歷史主舞臺了 , 大多數機構未經許可就進行人臉數據采集 。
2015 年 , 斯坦福大學的科學家基于舊金山一家咖啡館的網絡攝像頭 , 發布了一組 12000 張圖像集 。 第二年 , 杜克大學的研究人員發布了超過 200 萬個視頻幀(85 分鐘) , 記錄了在大學校園中行走的學生的鏡頭 。
2016 年 , 雷德蒙德微軟研究院發布了世界上最大的公眾人物數據集 MS Celeb , 包含從互聯網上搜刮的近 100000 個人的 1000 萬張圖像 , 其中包括采訪人員、音樂家和學者 。
微軟是通過知識共享許可協議(Creative Commons license)抓取和收錄這些照片的 。 按照知識共享許可協議 , 照片的版權所有者許可后 , 微軟可以將照片用于學術研究 。 微軟自己也聲稱 , MS Celeb 的發布旨在促進學術研究 , 鼓勵研究人員開發最好的人臉識別技術 。
版權所有者許可 , 并不等同于照片中的被拍攝者許可 。 人臉照片屬于生物識別數據 , 按照歐盟 GDPR 的規定 , 處理此類數據須征得當事人的明確同意 。 不僅如此 , MS Celeb 發布之后 , 有研究人員發現 , 其所收錄的已不僅僅是名人照片 , 還有一些普通人的照片 。 《金融時報》曝光稱 , 信息安全采訪人員 Kim Zetter、技術作家 Adam Greenfield、負責消費者隱私保護事務的原美國聯邦貿易委員會專員 Julie Brill 等人都在其中 。
這些人完全沒有意識到自己的人臉照片被收錄到了這些數據集中 。 這就像是 , 你永遠都不知道 , 你在何時何地 , 在經過哪一個攝像頭的時候 , 成為了某個訓練數據集一部分 。
“我并不是公眾人物 , 沒有任何道理放棄自己的隱私權 。 ”Adam Greenfield 聲討道 。
微軟回應 , MS Celeb 僅被用于學術用途 。 但公開資料顯示 , 多家公司使用過 MS Celeb 進行算法訓練 , 如英偉達、IBM、松下、日立等 。 在那次風波中 , 微軟表示已經刪除 MS Celeb , 但 Adam Harvey 指出 , 這些數據并不會完全消失 。 他說 , 一旦數據被發布、被下載 , 它就存在于全世界的硬盤上 , 微軟根本無法阻止人們根據自己的目的發布和使用數據 。
現在 , 美國的一些州已經確定 , 商業公司未經其同意使用人臉這樣的個人生物識別數據是非法的 。 伊利諾伊州還允許個人對此提起訴訟 。
例如 Fcebook 就已同意支付 6.5 億美元 , 以解決伊利諾伊州集體訴訟案 , 該訴訟案涉及一系列被用于人臉識別的非公開照片 。 總部位于紐約 Clearview AI(傳該公司的人臉系統已經抓取到 30 億張在線照片 , 并為警方和富豪提供定制服務) , 也正在面臨人臉數據違規采集和使用的集體訴訟 。
【審視人臉識別:一種AI技術的全球性濫用】“我不擔心政府 , 我擔心谷歌和臉書” 。 北卡羅萊納州威爾明頓大學的教授 Karl Ricanek 曾如此說道 。
“我認為 , 他們比政府擁有更多的公民信息 , 而且我們無法動搖這些公司的領導地位 。 我認為我們的政府至少還有著良好的使命 。 從學術角度來看 , 我們正在努力解決一些問題以讓世界變得更好 , 而不是大多數人想著賺錢 。 ”

推薦閱讀