服務熱線
歡迎訪問西莫羅(北京)智能科技有限公司網(wǎng)站
日期:2017-06-01瀏覽:664次
北京西莫羅閘機一個動態(tài)的場景當中能夠做到的人臉檢測
1:N的部分也會分為三個階段,大家zui了解的可能是后面的人臉識別,前面的兩個階段還是很重要的。
首先,我們要在一個動態(tài)的視頻流當中找到人臉的位置。
然后我門找到人臉位置以后,還要知道這個人臉可能有側(cè)臉、逆光和模糊的情況出現(xiàn),所以還會有一個判斷的過程,我這張臉每秒25幀里面哪一幀圖片是適合去做人臉識別的,zui終會抽取一張比較適合去做人臉識別的照片,zui后再去做人臉識別真正的比對,所以是三個步驟。
這是給大家展現(xiàn)一個能力,其實是在一個動態(tài)的場景當中能夠做到的人臉檢測,也就意味著是說做*個步驟,中間你會看到是有連續(xù)性的,如果斷掉有可能會抓第二次的人臉,抓到兩張照片到底哪張人臉做識別,所以這里面就會涉及到一個質(zhì)量判斷。后面的話,其實給大家也會做一個游戲,這個底下是個底庫的照片,上面是現(xiàn)場抓拍的照片,我不知道大家用多長時間用7個人能夠真正的連線起來。10秒鐘已經(jīng)過完了,我相信大家基本上10秒還沒有連完,底下的底庫照片是我們在杭州真正的在逃人員,這里面有*逃犯,下面是現(xiàn)場抓拍到的照片,基本上的話,其實容貌差別還是可以看到的。通過人去判斷,*效率和實效性還是有一定的影響,第二人的判斷多多少少還是有一些差別會比較大的,也不一定能夠認得出來,比如說中間的老太太,差別還是很大的。
所以可以看到用到這種機器的方式和機器視覺、人臉識別,更多的方式現(xiàn)在還是要提升人員的效率,降本增效的概念。大家比較關(guān)心的是說這個東西到底現(xiàn)在能不能用,或者說只是展示了一個demo還是一個技術(shù)能力?我們認為我們會從幾個點來分析,到底現(xiàn)在到不到實用的階段。
首先從技術(shù)上來看,首先我們在識別的領域當中,現(xiàn)在大家是可以做到萬分之十的誤識別的概率,所謂的誤識別識別率是有幾個定義的,包括識別成功率、誤識、漏識是有概念的,這是業(yè)界通用的幾個標準。
第二活體驗證。這部分之前2016年有一則新聞,當時說的是趙薇的老公司機套用了他的信息包括他的照片,zui后把他的房子還是車給賣了,那個時候確實是做了實名的比對,但是其中少了一個環(huán)節(jié)是活體驗證,用的是趙薇老公的照片直接做了實名,所以通過了整個的審計環(huán)節(jié)和風控環(huán)節(jié),所以在活體驗證階段已經(jīng)有比較完善的活體技術(shù),包括像支付寶現(xiàn)在也在用的,為什么他們敢用是有很多的活體技術(shù)促成的,在你們驗證過程中,有的時候你會發(fā)現(xiàn)會讓你做一些配合性的動作,這些動作也是為做一個活體驗證做的資料的準備。
第三,逆光的場景。在我們真正用的時候,像今天這個陽光就很強烈,真正用的時候到底能不能用的起來,不像一個實驗室,標準上我識別的成功率是在99%或者是幾個9的概念,真正的逆光的場景下,有可能*就變成零,*是不可用的狀態(tài)。
所以在很多的 角度講,2016年很多公司會講在這些關(guān)鍵技術(shù)上已經(jīng)有了突破,另外一個比較好的方式是說,人臉識別的生物識別技術(shù),其實是相對于用指紋、虹膜和其他的掌紋來的會更加便捷。
*臉是一個*的標識。比如說用指紋識別,有時候會有油膩,手指也比較臟,掌紋和虹膜的采集又是比較復雜的過程,所以從技術(shù)角度講,我們認為它已經(jīng)具備了商業(yè)化的能力。
第二,我們從時間軸來看一下。其實任何一家人臉識別和人工智能的公司都會經(jīng)歷五個階段,*階段和第二階段主要是在實驗室階段,這個階段其實大家也比較了解,基本上會去刷榜,大家會看到我參加了LFW的一些第三方的公共的公開數(shù)據(jù),我已經(jīng)變成了世界*,我超過了 、Facebook,這是刷榜的環(huán)節(jié),大家也知道其實是有很多的手段的。
第二個階段會到我能證明我學術(shù)的方式能夠做到非常*的水平,我想讓所有人都會去用,這個時候會產(chǎn)生SDK,給大家去裝。SDK的過程中和實驗室算法階段特點都會比較輕,覆蓋范圍也會比較目前廣,問題就是說,如果我們做人臉識別只給一個SDK給到所有的合作伙伴的時候,合作伙伴真正裝了SDK,到底能不能把他的場景業(yè)務跑的起來這件事情,其實沒有人知道。比如說你在SDK裝進去的時候,會不會遇到逆光的場景,會不會遇到識別距離的問題、會不會遇到陰暗面的問題,其實很多的東西是判斷不出來的。
第三個階段,由我們來輸出一些單一的功能性產(chǎn)品或者是單一的功能性解決方案。所以是跟場景結(jié)合的,比如說跟門禁結(jié)合、考勤結(jié)合,跟線上的實名結(jié)合,真正的風控可能我們不做,但是實名的業(yè)務是一個單一的功能點,這是可以做的,解決一個真正問題的環(huán)節(jié),但是全流程業(yè)務我們現(xiàn)在覆蓋不了。
第四個階段,會是一個解決方案的層級,在人臉識別或者是人工智能視覺的領域中會提供一個端到端的解決方案,由我們來替客戶去想象我前端的硬件設備是什么樣,后端的算法處理器是什么樣,算法是跑在云端還是本地的,是智能化前移還是云計算處理的,這個時候更多的合作伙伴應該想象的是他的上層業(yè)務,比如說直業(yè)務,所有的快手這些直播平臺,其實直播應該想到的是怎么維護主播,來運營平臺,來創(chuàng)造不同的事件,但是直播里面的兔耳朵這些工具,其實不應該是自己開發(fā)的,而且又耗時耗力。所以這些是不同層級的解決方案。
第五個階段,就是一個綜合平臺,因為任何一項技術(shù)都不是的,而且也是單一的功能點,所以除了人臉識別之外,有可能還會結(jié)合不同的API的接口調(diào)用,有時候里面會涉及到指紋、門禁開關(guān),所以會是一個綜合性的平臺。
現(xiàn)在任何一家公司基本上都要經(jīng)歷這五個階段,北京西莫羅是成立比較早,所以時間窗上相對來講會有一定優(yōu)勢,其他家現(xiàn)在是在紅色部分的區(qū)域范圍之內(nèi)。