在個(gè)人信息日益敏感化的網(wǎng)絡(luò)時(shí)代,用戶會(huì)習(xí)慣用“模糊”或“馬賽克”來(lái)遮蓋照片上的敏感信息,該技術(shù)還因?yàn)槟承┍娝苤脑颍粦?yīng)用于小電影上,令人性趣大減!
不過(guò)這一手段以后可能不再適用了,得克薩斯大學(xué)的研究者日前開發(fā)出了一套“反馬賽克”手段,可以突破馬賽克和模糊的遮擋,準(zhǔn)確地辨認(rèn)圖片信息。
1心中無(wú)碼易,眼中無(wú)碼難
從技術(shù)角度看,有人以為馬賽克是后期做上去的,不是原始拍攝時(shí)有的,所以就像兩個(gè)圖層,理論上是可以拿掉的。
其實(shí)不然,相片打印出來(lái),再用鉛筆給臉部“打碼”,這張紙是可以通過(guò)橡皮“去除馬賽克”的,但是如果將這張紙復(fù)印了能打馬賽克的修圖軟件,就無(wú)論如何都還原不了的,“碼”已經(jīng)成為了圖像的一部分了。
換一種說(shuō)法,馬賽克是把特定范圍內(nèi)的像素值平均化,100個(gè)像素的平均數(shù)是100,而要以一個(gè)平均數(shù)準(zhǔn)確還原出那100個(gè)像素對(duì)應(yīng)的數(shù)值,簡(jiǎn)直難如登天!
所以這個(gè)恢復(fù)是反卷積,是需要機(jī)器學(xué)習(xí)先驗(yàn)條件的,需要有本來(lái)就沒打碼的原圖片文件,不然直接對(duì)馬賽克圖片是沒辦法反向復(fù)原的能打馬賽克的修圖軟件,文中說(shuō)的技術(shù)是在整個(gè)數(shù)據(jù)庫(kù)(網(wǎng)絡(luò))找相似的匹配,所以離百分百必然有不小差距和漏洞。
2最牛老司機(jī)——大數(shù)據(jù)
在大數(shù)據(jù)時(shí)代,一切都變了,許多技術(shù)的實(shí)現(xiàn)雖然過(guò)程復(fù)雜,但借助電腦也不復(fù)雜了——不怕做不到,就怕想不到。。。
反馬賽克技術(shù)的出現(xiàn),許多人以后不用"心中無(wú)碼"了,對(duì)不少網(wǎng)民來(lái)說(shuō)這算不算是21世紀(jì)最偉大的發(fā)明之一,并授予諾貝爾個(gè)什么獎(jiǎng)呢!
一般人對(duì)照片進(jìn)行的馬賽克涂抹并不徹底,人眼辨認(rèn)不出其下的信息不代表機(jī)器也辨認(rèn)不出。
因此,研究者建立了一個(gè)用于面部識(shí)別和文字識(shí)別的軟件系統(tǒng),可以相當(dāng)準(zhǔn)確地識(shí)別被模糊或馬賽克遮掉的內(nèi)容。而且它識(shí)別能力相當(dāng)強(qiáng)悍,無(wú)論是上的視頻模糊,還是馬賽克修圖,都不在話下。
3識(shí)別卻不能復(fù)原
不過(guò)這里要說(shuō)明的是這套工具目前還只能“識(shí)別”而不能“復(fù)原”。也就是說(shuō)它能在一大堆圖像中匹配到和馬賽克下面的內(nèi)容相符的圖像,而無(wú)法做到真正的“反馬賽克”。
盡管有如此的遺憾,不過(guò)這項(xiàng)技術(shù)的面世還是令人相當(dāng)震驚。因?yàn)樗梢匀绱撕?jiǎn)單地被實(shí)現(xiàn)。開發(fā)人員使用了Torch,這是一個(gè)可以在網(wǎng)上輕易獲得的開源軟件。用來(lái)測(cè)試的圖片也都來(lái)源于網(wǎng)絡(luò)。研究人員調(diào)試軟件對(duì)模糊前后的圖片進(jìn)行辨認(rèn),結(jié)果輕易達(dá)到了很高的準(zhǔn)確度。
實(shí)驗(yàn)中,計(jì)算機(jī)對(duì)模糊視頻的識(shí)別率達(dá)到了80~90%。而即使經(jīng)過(guò)最嚴(yán)重涂抹的馬賽克圖片,識(shí)別準(zhǔn)確度仍然能達(dá)到50~70%。而通過(guò)P3手段修改過(guò)的圖片識(shí)別率最低,只有17%。P3(- Photo )是南加州大學(xué)開發(fā)的一個(gè)圖片加密工具,專為互聯(lián)網(wǎng)時(shí)代的圖片傳播而生。對(duì)JPEG格式的圖片有很好的加密效果。
雖然目前大家還不必為自己散布在網(wǎng)上的圖片感到擔(dān)心,不過(guò)提前做好防范并非杞人憂天。前文中的實(shí)驗(yàn)人員僅僅使用現(xiàn)成的軟件,沒費(fèi)多大力氣就實(shí)現(xiàn)了90%的識(shí)別準(zhǔn)確度。而且由于軟件是開源的,也就意味著任何有想法的人,也許稍加努力就可以達(dá)到更高的識(shí)別準(zhǔn)確度。
雖然徹底復(fù)原并不現(xiàn)實(shí),對(duì)于十分擔(dān)心自己個(gè)人信息泄露的網(wǎng)民,研究人員的建議是:棄用“模糊”和“馬賽克”,改用徹底涂黑的方法來(lái)保護(hù)自己的隱私。雖然照片上一個(gè)黑方塊不太美觀,不過(guò)用來(lái)保護(hù)安全相當(dāng)有效。