文|鄭思芳封面來源|視覺中國
從移動機器人的視覺導(dǎo)航、工業(yè)機器人的手眼系統(tǒng),到刷臉支付、機場火車站的安檢閘機的人臉識別,這些計算機視覺技術(shù)被廣泛應(yīng)用于視覺領(lǐng)域。
作為人工智能的一個重要方向,計算機視覺技術(shù)通過代替人眼的圖像傳感器獲取物體圖像,并轉(zhuǎn)化成數(shù)字圖像以分析,讓計算機擁有類似人類提取、處理、理解和分析圖像以及圖像序列的能力。簡言之就是結(jié)合用攝像機模擬人眼,用計算機模擬人對事物的認識和思考。
計算機視覺技術(shù)主要依賴于圖像處理方法,在改善圖像視覺效果的同時,又便于計算機對圖像進行分析、處理和識別。在技術(shù)層面,計算機視覺技術(shù)涵蓋了以下關(guān)鍵技術(shù):
圖像分割:將圖像分成若干部分,每一部分對應(yīng)于某一物體表面,并以灰度或紋理作為每一部分的測度度量,本質(zhì)是將像素進行分類。
圖像識別:利用識別算法來辨別景物中已分割好的物體,并賦予這些物體特定的標記,是車牌識別、人臉識別、網(wǎng)絡(luò)內(nèi)容審核等應(yīng)用中最主要的技術(shù)。
圖像增強:用于調(diào)整圖像對比度,突出圖像中的重要細節(jié),改善視覺質(zhì)量。
圖像平滑:去除實際成像過程中因成像設(shè)備和環(huán)境所造成的圖像失真,提取有用信息,去除噪聲,以恢復(fù)原始圖像。
圖像編碼和傳輸:通過圖像數(shù)據(jù)的編碼和變換壓縮來實現(xiàn)對圖像數(shù)據(jù)的壓縮,在處理龐大的數(shù)字圖像數(shù)據(jù)時,能夠大大降低信道投資成本和普及難度。
邊緣銳化:加強圖像中的輪廓邊緣和細節(jié)圖片相似度檢測軟件,形成完整的物體邊界,達到將物體從圖像中分離出來或?qū)⒈硎就晃矬w表面。
隨著深度學(xué)習(xí)技術(shù)不斷取得進步,計算存儲的擴大、可視化數(shù)據(jù)的激增,計算機視覺技術(shù)目前已經(jīng)成為人工智能率先取得較大突破、應(yīng)用場景較為明確的關(guān)鍵技術(shù)之一,在醫(yī)療保健、零售業(yè)、汽車業(yè)、餐飲業(yè)及能源和公用事業(yè)等行業(yè)大受歡迎。
著名零售商亞馬遜就正在利用計算機視覺技術(shù),通過圖像識別,使得人工智能檢測能夠在購物者找到商品后,無需掃描商品或付款便可離開,系統(tǒng)會自行向他們的亞馬遜賬戶收費。這大大減少了結(jié)賬過程中的人工成本和提升了用戶的購物體驗,讓購物者和零售商在結(jié)賬上都更加省心。
除此之外,計算機視覺技術(shù)在提升庫存管理、開發(fā)防盜機制、跟蹤顧客在商店中的移動及衡量店面關(guān)注時間等方面,給零售業(yè)還提供了不少門店優(yōu)化解決方案。
選擇好用的圖像識別產(chǎn)品,就來36氪企服點評平臺:
36氪企服點評平臺支持客戶規(guī)模、評分、滿意度等分類篩選查看相關(guān)軟件,另外還有軟件對比更多功能。更多詳情歡迎點擊上方圖片進入36氪企服點評。
為此,36氪企服點評整理出15款適用于不同行業(yè)領(lǐng)域的計算機視覺技術(shù)產(chǎn)品,供企業(yè)選型參考。
1. 阿里云×達摩院視覺智能開放平臺
阿里云×達摩院視覺智能開放平臺是一個視覺智能開放的低代碼平臺,提供人臉檢測與五官定位、人物動漫化、車牌識別、通用分割等服務(wù),能夠低門檻調(diào)用190+視覺AI能力,高效部署不同平臺的客戶端圖片相似度檢測軟件,搭建企業(yè)自己的AI場景應(yīng)用。
2. 百度大腦AI開放平臺圖像技術(shù)
百度大腦AI開放平臺圖像技術(shù)圖像識別、圖像搜索、圖像內(nèi)容安全、內(nèi)容安全方案、圖像特效、車輛分析等服務(wù)。圖像識別可識別超過10萬類常見物體和場景,接口返回大類及細分類的名稱,并支持獲取識別結(jié)果對應(yīng)的百科信息;還可使用定制訓(xùn)練平臺,定制識別分類標簽。廣泛適用于圖像或視頻內(nèi)容分析、拍照識圖等業(yè)務(wù)場景。
3. 騰訊云人臉與人體識別
騰訊云神圖·人臉識別基于騰訊優(yōu)圖面部分析技術(shù),提供包括人臉檢測與分析、比對、搜索、驗證、五官定位、活體檢測等多種功能,為開發(fā)者和企業(yè)提供高性能高可用的人臉識別服務(wù)。可應(yīng)用于在線娛樂、在線身份認證等多種應(yīng)用場景,充分滿足各行業(yè)客戶的人臉屬性識別及用戶身份確認等需求。
4. 商湯科技
商湯科技是一家計算機視覺技術(shù)研發(fā)商,基于人臉檢測跟蹤、人臉身份認證、人臉聚類等技術(shù),研發(fā)了人臉動態(tài)比對服務(wù)器、視圖情報研判系統(tǒng)等產(chǎn)品,可以在移動設(shè)備和個人電腦上實現(xiàn)毫秒級別的人臉檢測,同時能有效分辨高清照片、PS、三維模型、換臉等仿冒欺詐,廣泛應(yīng)用于金融、移動互聯(lián)網(wǎng)、安防監(jiān)控等行業(yè)。
5. 京東人工智能開放平臺
京東人工智能開放平臺提供人臉與人體識別、圖像及視頻理解、內(nèi)容審核、商品理解等服務(wù),基于京東相關(guān)業(yè)務(wù)數(shù)億級圖片數(shù)據(jù)訓(xùn)練模型,支持自定義商品圖圖庫,可在各種場景下圖庫中搜索相同或者相似的圖片。提供完整圖片庫增刪改查服務(wù),支持快速創(chuàng)建專屬的圖片庫,支持億級圖片入庫。支持在億級的自定義的圖庫中檢索相同或相似的圖片,并返回相應(yīng)的相似度。
6. 滴滴AI開放平臺
滴滴人工智能實驗室主要探索AI領(lǐng)域技術(shù)難題,重點發(fā)力機器學(xué)習(xí)、自然語言處理、計算機視覺、語音識別、運籌學(xué)、統(tǒng)計學(xué)等領(lǐng)域的前沿技術(shù)研究及應(yīng)用,積極布局下一代技術(shù),不斷提升用戶出行效率并且優(yōu)化出行體驗,用技術(shù)構(gòu)建智能出行新生態(tài)。提供人臉識別、文字識別、車輛識別、人體識別、內(nèi)容識別等視覺智能服務(wù),同時兼?zhèn)湔Z音識、合成、增強和喚醒等語音智能服務(wù)。
7. 云從科技
云從科技高效人機協(xié)同操作系統(tǒng)和行業(yè)解決方案提供商,依托于計算機視覺技術(shù),通過機場攝像機、安檢窗口以及第三方平臺接入作為感知點,以航班信息和旅客信息為核心,結(jié)合機場的各個應(yīng)用場景,為機場的安全保障、生產(chǎn)運行、旅客服務(wù)提供支撐。基于云從自主可控的高準確度人臉識別算法,結(jié)合民航業(yè)務(wù)服務(wù)場景特點進行業(yè)務(wù)設(shè)計和算法優(yōu)化,具備高準確率;采用分布式架構(gòu),每個服務(wù)都有相應(yīng)的負載均衡策略和備份機制,保證平臺的高可用、高穩(wěn)定性。
8. 曠視Face??
曠視Face?? 是以 API 或 SDK 的形式,面向開發(fā)者的開放平臺。提供了最新的人臉算法,不只提供人臉識別的能力,更提供了證件識別、圖像識別、文字識別的能力。提供控制臺,讓開發(fā)者實時監(jiān)控服務(wù)質(zhì)量與狀態(tài),開發(fā)者可盡情調(diào)用各項開放能力。
9. 格林深瞳
格林深瞳是一家將計算機視覺和深度學(xué)習(xí)技術(shù)應(yīng)用于商業(yè)領(lǐng)域的科技公司,自主研發(fā)的深瞳技術(shù)應(yīng)用在人和車的檢測、跟蹤與識別等方面,公司借助海量數(shù)據(jù),致力于讓計算機像人一樣看懂這個世界,實時獲取自然世界正在發(fā)生的一切,打造自然世界的搜索引擎。
10. 漢王科技
漢王科技專注模式識別與智能交互領(lǐng)域的研發(fā),累計了多項自主知識產(chǎn)權(quán)的核心技術(shù),形成了軟硬件結(jié)合的發(fā)展模式。具有豐富的產(chǎn)品鏈,識別技術(shù)應(yīng)用廣泛,在電子政務(wù)、個人辦公、移動通信、數(shù)字家電等方面實現(xiàn)普及化和規(guī)模化處理信息。
11. 美圖Ai開放平臺
美圖Ai開放平臺是美圖公司推出的Ai服務(wù)平臺,提供多樣化解決方案,協(xié)助企業(yè)實現(xiàn)業(yè)務(wù)升級。專注于人臉技術(shù)、人體技術(shù)、圖像識別、圖像處理、圖像生成等核心領(lǐng)域,為客戶提供經(jīng)市場驗證的專業(yè)Ai算法服務(wù)和解決方案。其技術(shù)體驗包括人臉技術(shù)、圖像處理、圖像識別和人體技術(shù)等。
12. 諦聽
諦聽基于大數(shù)據(jù)和深度學(xué)習(xí)實現(xiàn),可精準識別圖像中的視覺內(nèi)容,包括上千種物體標簽、數(shù)十種常見場景等,包含圖像打標、場景分類、鑒黃等在線API服務(wù)模塊,應(yīng)用于智能相冊管理、圖片分類和檢索、圖片安全監(jiān)控等場景。
13. 虹軟視覺開放平臺
虹軟專注于圖像與視頻處理技術(shù)領(lǐng)域,技術(shù)已經(jīng)廣泛應(yīng)用到各式平臺設(shè)備,提供人臉采集、人臉比對、活體檢測、人證核驗、人臉屬性、人臉質(zhì)量檢測等功能,適應(yīng)各類應(yīng)用場景。能夠本地注冊人臉庫、無需依靠網(wǎng)絡(luò),保證數(shù)據(jù)安全性;適配市場主流鏡頭模組、芯片方案,幫助快速兼容落地。
14. 中科視拓
中科視拓是一家人臉識別技術(shù)服務(wù)提供商,自主研發(fā)了人臉檢測、面部特征點定位、人臉屬性分析、監(jiān)控視頻結(jié)構(gòu)化等技術(shù),通過漏斗型全姿態(tài)人臉檢測技術(shù)可以檢測出復(fù)雜場景中的各種人臉,同時可以實現(xiàn)人物性別、年齡、表情、膚色、等不同人臉屬性的判別。
15. 圖普科技
圖普科技是一家站在人工智能前沿的創(chuàng)業(yè)科技公司,專注于圖像識別整體解決方案,致力于打造新一代的計算機視覺理解和人工智能引擎,讓計算機可以識人、識物,教會計算機看懂這個世界。圖普科技主要為企業(yè)提供智能審核、圖片增值、圖像搜索、深度定制服務(wù)。
免責聲明:以上排序主要根據(jù)36氪企服點評站內(nèi)外熱度的綜合評價,排名不分先后。