谷歌推全新人工智能系統(tǒng) 史上最強(qiáng)人臉識(shí)別技術(shù)
來源:數(shù)字音視工程網(wǎng) 編輯:上善如水 2015-03-25 14:11:12 加入收藏 咨詢
![](http://static.dav01.com/site/onlineExhibition/mould1/images/close.png)
所在單位: | * |
姓名: | * |
手機(jī): | * |
職位: | |
郵箱: | * |
其他聯(lián)系方式: | |
咨詢內(nèi)容: | |
驗(yàn)證碼: |
|
有些人總喜歡夸口說:“我從來不會(huì)忘記別人的長相。”在人工智能研究突飛猛進(jìn)的今天,還要這么夸口就有點(diǎn)奇怪了。事實(shí)上,現(xiàn)在有些電腦能記住2.6億張臉。上周,谷歌公司的三位研究人員發(fā)表了一篇有關(guān)全新人工智能系統(tǒng)的研究論文。這一系統(tǒng)名為FaceNet,谷歌號(hào)稱它是迄今為止最精確的人臉識(shí)別技術(shù)。
姿勢(shì)和光線一直都是人臉識(shí)別的大難題。該圖顯示了兩張臉在不同組合中所體現(xiàn)出來的“差距”(差距為0.0意味著兩張臉完全一樣)。
面對(duì)一個(gè)名為“人面數(shù)據(jù)庫”(Labeled Faces in the Wild)的常用人臉識(shí)別數(shù)據(jù)庫時(shí),F(xiàn)aceNet識(shí)別的準(zhǔn)確率近乎百分之百。這個(gè)數(shù)據(jù)庫容納了網(wǎng)上搜集的一萬三千多張人臉照片。而在面對(duì)一個(gè)含有2.6億張人臉照片的龐大數(shù)據(jù)庫時(shí),這個(gè)系統(tǒng)的準(zhǔn)確率也超過86%。
研究人員聲稱,面對(duì)“人面數(shù)據(jù)庫”時(shí),他們主要測(cè)試該系統(tǒng)的“確認(rèn)能力”。就本質(zhì)而言,他們衡量的是這套算法在判斷兩張照片是否同屬一人時(shí)到底有多準(zhǔn)確。
去年12月,一個(gè)中國研究團(tuán)隊(duì)也聲稱,對(duì)這套數(shù)據(jù)庫的識(shí)別準(zhǔn)確率超過99%。去年,F(xiàn)acebook公司的研究人員發(fā)表論文稱,他們也能做到超過97%的準(zhǔn)確率。根據(jù)這篇論文援引的一些研究人員的說法,人類對(duì)該數(shù)據(jù)庫的識(shí)別準(zhǔn)確率僅有97.5%。
不過,谷歌研究人員采用的方法絕不只是確認(rèn)兩張臉是否一樣這么簡單。這套系統(tǒng)還能將人名和臉匹配——經(jīng)典的人臉識(shí)別技術(shù),甚至能把看起來最像或最不像的臉歸集在一起。
目前這還僅僅是研究而已,但它預(yù)示著,在不遠(yuǎn)的將來,我們經(jīng)常在網(wǎng)上視頻或大片里看到的那種能懲治犯罪、加強(qiáng)監(jiān)控的電腦將更加觸手可及。比起在交友應(yīng)用Tinder上劃來劃去,它可能會(huì)使網(wǎng)上交友更加簡單(也更停留于表面)。
很喜歡1998年左右時(shí)的布拉德 皮特?這個(gè)數(shù)據(jù)庫里有500張看起來很像他的臉。
一開始,我們會(huì)看到谷歌的FaceNet及Facebook的DeepFace系統(tǒng)在各自的網(wǎng)絡(luò)平臺(tái)上運(yùn)行。它們會(huì)讓用戶更加方便地(或者說更加自動(dòng)化地)給照片貼上標(biāo)簽,找到要找的人,因?yàn)檫@些算法知道照片中的這個(gè)人是誰,即使這些照片并沒有姓名標(biāo)記。此外,這類系統(tǒng)還能讓網(wǎng)絡(luò)公司更加方便地基于照片人物的身份,來分析它們的用戶社交網(wǎng)絡(luò),評(píng)判全球流行趨勢(shì)及名人的受歡迎程度。
盡管谷歌和Facebook在人臉識(shí)別技術(shù)上最近才取得這類進(jìn)步,但與之類似的電腦系統(tǒng)早就無處不在。它們都含有一種名為“深度學(xué)習(xí)”的人工智能技術(shù)。事實(shí)證明,這種技術(shù)能夠極其有效地完成識(shí)別物體(按照某些標(biāo)準(zhǔn)來看,機(jī)器在這方面已經(jīng)比人類要強(qiáng)了)、識(shí)別語音及理解書面文字等機(jī)器辨別任務(wù)。
除了谷歌和Facebook外,微軟、百度和雅虎也在“深度學(xué)習(xí)”研究上投入重金。這種算法已經(jīng)應(yīng)用在一些我們常用的功能上了,比如智能手機(jī)語音控制、Skype實(shí)時(shí)翻譯、短信預(yù)測(cè)輸入法及先進(jìn)的圖像搜索等(如果你已經(jīng)將一些圖片上傳至Google+賬戶里,你就可以試試用它們來搜索特定目標(biāo))。Spotify和Netflix公司正在研究如何利用深度學(xué)習(xí)技術(shù)更智能地推薦視頻。貝寶公司則將其用于打擊欺詐。
還有幾家科技創(chuàng)業(yè)公司正將深度學(xué)習(xí)技術(shù)用于實(shí)時(shí)分析醫(yī)療圖像,并提供諸如文本分析、計(jì)算機(jī)視覺及語音識(shí)別這類云計(jì)算服務(wù)項(xiàng)目。近年來,Twitter、Pinterest,、Dropbox、雅虎和谷歌等公司都收購了一些專攻深度學(xué)習(xí)技術(shù)的創(chuàng)業(yè)公司。IBM公司剛剛收購了一家位于丹佛,名為AlchemyAPI的初創(chuàng)企業(yè),用以提升其Watson超級(jí)計(jì)算機(jī)的智能水平,并支持其全新的Bluemix云平臺(tái)(該平臺(tái)的理念是:開發(fā)者可以方便地將移動(dòng)和網(wǎng)絡(luò)應(yīng)用與云服務(wù)連接起來,借以打造一些智能應(yīng)用,而無需再鉆研人工智能背后復(fù)雜的計(jì)算機(jī)科學(xué))。
不止于此。隨著消費(fèi)級(jí)機(jī)器人、無人駕駛汽車及智能家居逐漸成為現(xiàn)實(shí),深度學(xué)習(xí)技術(shù)也將如影隨形,為我們這些新玩具提供耳目和一些頭腦功能。美國國防部高級(jí)研究計(jì)劃局(DARPA)也在探索如何借助深度學(xué)習(xí)技術(shù)來實(shí)時(shí)理解龐大的情報(bào)信息流。
我猜想,DARPA正在關(guān)注谷歌的FaceNet系統(tǒng),并為之激動(dòng)。
評(píng)論comment