蘋果將偵測兒童色情影像 用戶上傳iCloud - 手機討論

Table of Contents

我只能說不管怎樣 他們一定會侵犯隱私

人工審核照片的

如果是我來設計抓未成年影像的AI

我會先判斷年齡,用臉或是體形,判斷是否為未成年

再判斷圖片是否有裸露,性行為

當符合的特徵越多,就越有可能是未成年色情

你用hash抓到,當然毫無疑問,不需人工審核就知道是犯罪圖片

但未成年色情不只有那些已存在的,可以用hash辨識

還有新拍攝的,需要靠AI找出來的

像我上面講的,越多符合特徵的圖片篩出來,

再經由人工審核才有辨法判斷是否違法

hash是一種低效率手段,光是整理資料庫就是大工程

更別說數千萬計的圖片都要一張一張掃過,這個只能偶爾排程跑一次

或是先用AI抓出可疑圖片,再用hash掃過,

掃不到再交給人工審核

這樣才能縮小範圍,快速抓到違法圖片

我只能說雲端相簿都是沒隱私的

會怕的人可以把照片zip起來再丟雲端

或是自架NAS,自己的資料自己管


--

All Comments

Kumar avatarKumar2021-08-08
你在上傳圖片的時候就會算 hash 值記在資料庫了...
Zanna avatarZanna2021-08-09
你傳上去的圖片hash值又不會變 = =
Michael avatarMichael2021-08-10
如果你有看過大公司 Storage System 的 paper 的話基本上都會存 data 的 sha-1
Lauren avatarLauren2021-08-11
我說的是色情圖片的資料庫 每張圖都要loop這資料庫
Ursula avatarUrsula2021-08-12
一次吧
Todd Johnson avatarTodd Johnson2021-08-13
Apple 現在的作法就是在你手機丟個 hash 資料庫你手機晶片都能運算的檢查 你覺得這樣會沒效率嗎
Ida avatarIda2021-08-14
現代資料庫也不會用 loop 一個一個比對你的想法是 hash 比對這件事情是 O(N) N=資料筆數可是實際上資料庫不是這樣運作的
Eden avatarEden2021-08-15
資料庫不要太大的話 比對的效率可以趨近於 O(1)
Franklin avatarFranklin2021-08-16
你如果有興趣可以看一下 HashMap 跟 B-TreePS B-Tree 不是 O(1)
Zora avatarZora2021-08-16
這也不算現代了 幾乎都是二三十年前就有的東西現在都是在這上面做優化 所以肯定查的速度更快
Christine avatarChristine2021-08-17
可是根據我逛過暗網看過的東西 應該不會是O(1)
Jack avatarJack2021-08-18
這不用暗網啊 資工大二的資料結構就有教了 = =
Susan avatarSusan2021-08-19
資料結構是必修課 算是資工系的常識吧
Eartha avatarEartha2021-08-20
https://i.imgur.com/NS9fpbe.png你可以不信我 但你要信一下 Google
Robert avatarRobert2021-08-21
其實我覺得非蘋果員工在那邊幫蘋果擔心運算資源不足還蠻有趣的
Elizabeth avatarElizabeth2021-08-22
抓有兩種方式,兩種都對,一種的確是FBI資料庫,但
Tristan Cohan avatarTristan Cohan2021-08-23
另一種就是FB那種方式,偵測後自動判斷,連泳裝都能被當猥褻照片,只要多加幾個參數,就是原PO講的人工
Edwina avatarEdwina2021-08-23
審核,至於蘋果要用哪種沒講,也應該不會講。所以考慮隱私,兩種加總才是答案,這也就是為什麼說,別用
Selena avatarSelena2021-08-24
手機拍小孩,這也不是危言聳聽,想拍小孩記得買相機
Dora avatarDora2021-08-25
另外運算資源?FB雖很不穩,但有聽過是因為運算太兇出包嗎?中國那種審更兇地也都沒問題,不用你擔心啦
Tristan Cohan avatarTristan Cohan2021-08-26
喔,原文有講犯罪資料庫喔。但還是老話,別太相信那些人講法,今天他們不注重隱私,未來也不可能注重,
Quintina avatarQuintina2021-08-27
像google已經好幾起抓好幾年前的人了,他們改變政策
Harry avatarHarry2021-08-28
的話,被抓也不意外,雲端基本上沒隱私可言,不管哪個國家都一樣,而且別以為只有這類犯罪,版權物也一
Irma avatarIrma2021-08-29
樣,放上雲端最好還是加密,不然你用10幾年帳號被凍就欲哭無淚了。
Mia avatarMia2021-08-30
相似度搜尋並不是純hashmap的O(1)複雜度喔。詳情可以搜An optimal Algorithm for Approximate NearestNeighbor Searching in Fixed Dimensions這篇論文
Freda avatarFreda2021-08-31
hashmap適用的條件是找物件“本身“ 但這裡的功能是在做相似度的尋找
Ophelia avatarOphelia2021-08-31
使用k-d樹的話找相似度的複雜度是O(log N)