操屁眼的视频在线免费看,日本在线综合一区二区,久久在线观看免费视频,欧美日韩精品久久综

新聞資訊

    作者介紹

    冀永楠博士畢業(yè)于英國(guó)諾丁漢大學(xué)計(jì)算機(jī)系。2004年起從事機(jī)器學(xué)習(xí)的研究和應(yīng)用開發(fā)工作。對(duì)機(jī)器學(xué)習(xí)在時(shí)間序列,圖像識(shí)別,數(shù)據(jù)處理等領(lǐng)域的應(yīng)用有著豐富實(shí)際經(jīng)驗(yàn)。現(xiàn)就職于騰訊云大數(shù)據(jù)及人工智能產(chǎn)品中心負(fù)責(zé)人工智能產(chǎn)品的落地工作。

    4月13日結(jié)束的計(jì)算機(jī)視覺沙龍圓滿落幕。本期沙龍從構(gòu)建圖像識(shí)別系統(tǒng)的方法切入,講述騰訊云人臉識(shí)別、文字識(shí)別、人臉核身等技術(shù)能力原理與行業(yè)應(yīng)用,為各位開發(fā)者帶來了一場(chǎng)人工智能領(lǐng)域的技術(shù)開拓實(shí)踐之旅。下面是冀永楠老師關(guān)于淺談構(gòu)建圖像識(shí)別系統(tǒng)方法的總結(jié)。

    講師介紹:冀永楠博士畢業(yè)于英國(guó)諾丁漢大學(xué)計(jì)算機(jī)系。2004年起從事機(jī)器學(xué)習(xí)的研究和應(yīng)用開發(fā)工作。對(duì)機(jī)器學(xué)習(xí)在時(shí)間序列,圖像識(shí)別,數(shù)據(jù)處理等領(lǐng)域的應(yīng)用有著豐富實(shí)際經(jīng)驗(yàn)。現(xiàn)就職于騰訊云大數(shù)據(jù)及人工智能產(chǎn)品中心負(fù)責(zé)人工智能產(chǎn)品的落地工作。

    自我介紹一下,我叫冀永楠,畢業(yè)于諾丁漢大學(xué)計(jì)算機(jī)系,我一直做圖像相關(guān)和機(jī)器學(xué)習(xí)不同領(lǐng)域的應(yīng)用,目前在騰訊云的大數(shù)據(jù)AI產(chǎn)品中心擔(dān)任高級(jí)研究員的職位,我今天跟大家簡(jiǎn)單介紹一下關(guān)于計(jì)算機(jī)視覺的一些基本原理和應(yīng)用。

    簡(jiǎn)單來講,計(jì)算機(jī)視覺就是先通過一些方法把一些現(xiàn)實(shí)中的東西轉(zhuǎn)化為圖像,通過對(duì)圖像做分析,得到一些我們想要的結(jié)果。最常見的圖像其實(shí)就是我們拍照,常見的這種任務(wù)分為物體識(shí)別、對(duì)象的檢測(cè)、對(duì)象的追蹤、語義上的分割,還有三維重建、知識(shí)問答等等,最后通過這些組合來完成我們經(jīng)常常見的人臉識(shí)別的這些任務(wù)。

    我這邊把整個(gè)圖像從成像到實(shí)際的應(yīng)用層分這么四層,最基本的是一個(gè)成像層,因?yàn)楝F(xiàn)在騰訊也是要做產(chǎn)業(yè)互聯(lián)網(wǎng),其實(shí)在互聯(lián)網(wǎng)領(lǐng)域的時(shí)候,我們最常用的圖像是視頻和普通的RGB圖像,進(jìn)入產(chǎn)業(yè)互聯(lián)網(wǎng)之后就會(huì)接觸不同的成像方式,比如工業(yè)相機(jī)的成像,還有比較火的3D人臉模型之后用3D的結(jié)構(gòu)光、TOF等等這種圖像成像方式。在上面,我們這是一個(gè)成像的輸入圖,它的輸入往往是一些采集過來的信號(hào),它的輸出一般是圖像或者人可以看懂的東西。

    再往上,會(huì)對(duì)這些圖像進(jìn)行一般的簡(jiǎn)單的分析,大部分都是一些幾何性的,這些東西就能提出一些幾何的點(diǎn)、線、面這些特征,這是低等級(jí)的特征或者低等級(jí)的處理方式。再往上會(huì)構(gòu)建出一些物體的檢測(cè)、物體的分割、還有配準(zhǔn)。

    小班數(shù)學(xué)按物體名稱分類教案_按物體的數(shù)量分類ppt_氣浮法分類按氣泡產(chǎn)生分類

    還有一些高等級(jí)的應(yīng)用,等等這些。

    先從成像簡(jiǎn)單講,最近這幾種我們常見的成像方式,除了RGB之外,上面有紅外,還有距離的成像,下面是CT成像,它本身的成像方式是通過感測(cè)器,繞一個(gè)物體一周,根據(jù)信號(hào)計(jì)算出這個(gè)物體內(nèi)部對(duì)于X光的吸收程度所產(chǎn)生的一個(gè)成像。醫(yī)療成像,它本身的成像方式是我要攝入一些有放射性的東西,并且從外部感受這些東西,所產(chǎn)生的密度,疊加在原有的CT成像上。再往下是有一個(gè)紅外廣譜,這兩個(gè)是放大的圖像方式。

    遙感圖像,它比較大的特點(diǎn)是它的頻譜比較寬一點(diǎn),它的通道會(huì)比普通通道多一點(diǎn)。最后一個(gè)比較火的黑洞,當(dāng)然大家可能最近比較熱的一個(gè)話題,因?yàn)閯傞_始的時(shí)候我看新聞的時(shí)候,第一張黑洞的照片,其實(shí)我希望的會(huì)是一種類似這種照片,但其實(shí)往往得到這個(gè)圖片,在我們來看更像一個(gè)map,它是根據(jù)很多的數(shù)據(jù)不斷的去搜集這個(gè)數(shù)據(jù)之后,然后在建立了一個(gè)物理模型,再通過這些數(shù)據(jù)訓(xùn)練這些模型,得到這么一個(gè)能源的圖。

    這就是我們現(xiàn)在目前為止比較常見的一些成像的方式吧,那么在接觸任何解決方案的時(shí)候,其實(shí)無論是做醫(yī)療也好,或者現(xiàn)在做多媒體,還是說做天文,各種領(lǐng)域的圖像的解決方案里面,往往了解成像過程是第一步,這個(gè)會(huì)告訴你看到的圖像是什么,還有傳統(tǒng)的解決方案是什么,無論你想把AI或者模型應(yīng)用到這里面,這都是建立整個(gè)系統(tǒng)理解的第一步。

    我們最常見的圖片,它的成像方式就比較簡(jiǎn)單一點(diǎn),可能大家都知道有一個(gè)光源,照射到物體之后產(chǎn)生反光,反光通過成像系統(tǒng),比如相機(jī),它會(huì)映射到一個(gè)傳感器上,在傳感器上產(chǎn)生強(qiáng)度信號(hào),如果有三重傳感器就會(huì)產(chǎn)生RGB的圖像,現(xiàn)在很多的格式里還有α,α就是一個(gè)透明度的圖像。那么之前的話,記得英特爾做過一個(gè)應(yīng)用,把某一個(gè)數(shù)據(jù)和它所形成的圖像進(jìn)行一個(gè),這個(gè)也在很多的相機(jī)里有一些專業(yè)的暗光相機(jī)里進(jìn)行使用。

    低level呈現(xiàn)的以De-noise為主,黑的地方黑,暗的地方暗,一般是線性影射,映射到人的可見范圍內(nèi)。這個(gè)過程是非常常見的,甚至這個(gè)可以單做成一個(gè)小工具來調(diào),所以我們看到醫(yī)療圖像一般它的深度是2048的,壓縮在一個(gè)圖上是完全看不見的,或者經(jīng)常是截取其中一部分來看你具體想要看的位置是什么,想看的器官是什么。像這種去噪,是一個(gè)非常常見的應(yīng)用,因?yàn)閹缀跛械南到y(tǒng)都會(huì)有噪聲。

    到中一層就涉及到一部分物體里面的內(nèi)容,包括分類,和,我認(rèn)為這個(gè)圖像里到底有幾個(gè)我的前景目標(biāo),你圖像的數(shù)據(jù)數(shù)量沒有多少,直接指望用一個(gè)分類方法就搞定的話這是不太現(xiàn)實(shí)的,這是你在拆解問題沒有拆解好的話,你在后面用其它的底層技術(shù)方法去彌補(bǔ)的話往往會(huì)于事無補(bǔ)而且會(huì)浪費(fèi)很多時(shí)間糾結(jié)在這上面。有時(shí)候反過來講,這是拆解問題導(dǎo)致后期的中層問題彌補(bǔ)不了的。反過來你在成像時(shí)候遇到的一些問題,你用中層的技術(shù)也是彌補(bǔ)不了的。比如我以前做的醫(yī)療圖像,經(jīng)常出現(xiàn)CT里面放一個(gè)金屬,整個(gè)圖片就壞掉了,那個(gè)金屬會(huì)非常亮,把周圍的射線全部吸走,這時(shí)候在后處理里建模是基本無用的。

    我們現(xiàn)在其實(shí)有很多的問題,常見的問題上在上或者開源社區(qū)上都會(huì)有一些端到端的,如果不做這些分解的話,結(jié)果怎么提都提不上去。

    氣浮法分類按氣泡產(chǎn)生分類_小班數(shù)學(xué)按物體名稱分類教案_按物體的數(shù)量分類ppt

    這是高等級(jí)的圖像應(yīng)用,比如人臉識(shí)別、自動(dòng)駕駛,還有中間那個(gè)圖是圖像中的物體和語言的一種對(duì)應(yīng)關(guān)系。右面是一個(gè)冠狀動(dòng)脈的標(biāo)注,如果心臟有問題去醫(yī)院的話會(huì)先掃一個(gè)CT,會(huì)重建出你的八根冠狀動(dòng)脈,之后根據(jù)狹窄情況再去考慮是否下支架,這個(gè)過程原來是手動(dòng)的,必須醫(yī)生一根一根看,看完之后給出診斷,現(xiàn)在有計(jì)算機(jī)輔助的,有一個(gè)公司是專門做這一部分。

    講完分層,再講一下不同層面所對(duì)應(yīng)的方法,圖象處理方法,像我比較早接觸是2000年上下,那個(gè)時(shí)候還沒有深度學(xué)習(xí),那個(gè)時(shí)候講到圖像,大部分都是講圖像濾波器,濾波器就是常見的空間濾波器、頻率濾波器、傅里葉、小波濾波器,后來用對(duì)稱等等,這是低層的方法。中層的方法,就是涉及各種各樣的,通過加分類器,再給一個(gè)表現(xiàn),要么是圖片,要么是通過滑窗截取到的一小片圖片,然后再放到分類器里面看它是不是你想要的目標(biāo),當(dāng)時(shí)基本上是這樣做的。當(dāng)時(shí)的分割方法,還有l(wèi)evel-set,就是用一個(gè)函數(shù)限制它的變化方法,實(shí)際上我們大部分接觸到分割,大部分想要的分割結(jié)果都是比較規(guī)整的,這種規(guī)整程度用什么描述?可以用level-set函數(shù)表述,也可以用其他,大部分都是采用這種思路。

    簡(jiǎn)單介紹幾個(gè)圖像數(shù)據(jù)的,這是邊緣的,它要求在一個(gè)簡(jiǎn)單的場(chǎng)景下做到一個(gè)非常穩(wěn)定的效果,那么它本身映射到一個(gè)高危空間里,這個(gè)空間維度并不是那么高也并不是那么復(fù)雜,但是我就要求它的穩(wěn)定性比較好,基本上都是采用這種簡(jiǎn)單的方法來處理。這是最早用來做圖像檢測(cè)的,它設(shè)計(jì)了幾個(gè)進(jìn)行分類,然后檢測(cè)出人臉。

    局部對(duì)稱性,這是當(dāng)你需要檢測(cè)的物體有一定對(duì)稱性的時(shí)候,比如檢測(cè)一個(gè)股骨頭,股骨頭大部分圓的,這個(gè)時(shí)候用對(duì)稱性會(huì)給一定的加分。

    SIFT是最早一個(gè)把SIFT引入到里面的,它能把你的目標(biāo)物體,當(dāng)你的拍攝角度不一樣的時(shí)候,它是第一個(gè)能做到有效的對(duì)應(yīng)關(guān)系的。到后來的話,當(dāng)時(shí)很多的檢測(cè)和分類的算法里面都會(huì)加入這個(gè),之后的很長(zhǎng)時(shí)間都是用HoG的。一個(gè)整體的部分,比如一個(gè)人,可能不太可能只用一個(gè)part來描述,因?yàn)榻?jīng)常是組合性的,其實(shí)最簡(jiǎn)單的,人的手經(jīng)常是在不同位置上的,完全用一個(gè)不可能區(qū)隔的,所以在那時(shí)候是最好的一個(gè)檢測(cè)效果。

    按物體的數(shù)量分類ppt_小班數(shù)學(xué)按物體名稱分類教案_氣浮法分類按氣泡產(chǎn)生分類

    剛才上面講的是目標(biāo)檢測(cè)的傳統(tǒng)方法,后面這兩個(gè)主要是分割的方法。分割方法最常見的是分水嶺方法,其實(shí)就是抽一個(gè)維度,其實(shí)和一個(gè)圖也沒有太大本質(zhì)的區(qū)別,然后根據(jù)條件看出不同的區(qū)域。到后來的話還會(huì)有其他的,比如極大穩(wěn)定區(qū)域,它定義了一種極大穩(wěn)定區(qū)域的度量,就是這個(gè)區(qū)域內(nèi)怎么算極大穩(wěn)定,在這個(gè)極大穩(wěn)定區(qū)域里它的均一性好一點(diǎn)。它本身是要把圖像分為幾塊進(jìn)行檢測(cè),但后來發(fā)現(xiàn)這個(gè)東西做分割也蠻好的,現(xiàn)在OCR這種傳統(tǒng)仍然常用的,因?yàn)镺CR尤其在一些場(chǎng)景下,比如廣告牌,廣告牌會(huì)給一個(gè)比較強(qiáng)的背景反射,比如白墻加紅字或者黑墻加白字,它的目標(biāo)區(qū)域是非常穩(wěn)定的,用它做一個(gè)初步的檢測(cè)結(jié)果,效果往往是非常好的。

    還有一個(gè)是ASM,主觀形狀模型,其實(shí)很多思想在后面深度學(xué)習(xí)領(lǐng)域里面仍然被使用,像這個(gè)ASM以及后來這一系列的想法。它的主要想法是在分割的時(shí)候大概知道分割區(qū)域的格式是什么樣,設(shè)計(jì)一個(gè)變化的范圍,分割的接口不會(huì)太多的超出這個(gè)范圍。像這個(gè)人臉的話,當(dāng)時(shí)的人臉分割,比如我可以采集十個(gè)人臉或者更多的一百個(gè)人臉,把一百個(gè)人臉都做一個(gè)很好的標(biāo)注,建一個(gè)人臉的模型。做一千個(gè)人臉,做一個(gè)平均的人臉按物體的數(shù)量分類ppt,現(xiàn)在也有亞洲人長(zhǎng)什么樣、非洲人長(zhǎng)什么樣,美洲人長(zhǎng)什么樣,其實(shí)基本就是這樣,取平均值,然后做一個(gè)平滑,形成這么一個(gè)人臉的效果。

    深度學(xué)習(xí)在圖像中的應(yīng)用,在2011、2012年前后逐漸流行起來,早期的時(shí)候深度學(xué)習(xí)是達(dá)不到這樣一個(gè)深度,我們當(dāng)時(shí)稱之為MOP,MOP當(dāng)時(shí)用的時(shí)候效果并不好。有幾個(gè)原因吧,第一個(gè)是當(dāng)時(shí)訓(xùn)練不了太深,非線性擬合做不了那么高的高度,第二是訓(xùn)練難度比較大,每次訓(xùn)練結(jié)果和前次都不一樣,為了彌補(bǔ)這個(gè)缺陷,統(tǒng)計(jì)上得到一個(gè)一致的結(jié)果,比如隨機(jī)N個(gè)初始條件然后開始訓(xùn)練,這樣的話最后的效果并沒有好,訓(xùn)練的時(shí)間反而很長(zhǎng)。

    那么到后來,因?yàn)樵趫D像上加入了卷積神經(jīng)網(wǎng)絡(luò)GPU的技術(shù),還有一些關(guān)鍵性的技術(shù),使得第一它的訓(xùn)練可以訓(xùn)練更深,可以得到更高的擬合性。第二是不需要對(duì)最后的結(jié)果影響并不那么大,在此之后又一個(gè)使它應(yīng)用比較廣泛的前提是,我們有了很多的預(yù)訓(xùn)練的網(wǎng)絡(luò),這樣的話其實(shí)使我們現(xiàn)在很多做計(jì)算機(jī)視覺的人都能有幸站在巨人的肩膀上,開發(fā)自己的應(yīng)用。但是因?yàn)榫奕穗S時(shí)會(huì)撤掉了,我們希望能做一個(gè)什么呢,希望做一個(gè)有一定高度的平臺(tái),這個(gè)平臺(tái)就不用考慮平臺(tái)會(huì)不會(huì)倒的問題,大家會(huì)穩(wěn)穩(wěn)站在上面開發(fā)自己的應(yīng)用。

    深度學(xué)習(xí)在圖像中的應(yīng)用,前面是特征層,到后面會(huì)有一些比較高一級(jí)的特征,到后來會(huì)進(jìn)行一個(gè)全連接,再進(jìn)行分類。簡(jiǎn)單的說,分類的話是最簡(jiǎn)單的一個(gè)網(wǎng)絡(luò)吧,就是卷積之后加幾個(gè)全鏈接,輸出就可以了。在檢測(cè)上的話,除了一個(gè)基本的網(wǎng)絡(luò)之外,會(huì)加一些這一部分的結(jié)構(gòu)。在分割上,我覺得最早的,讓我印象比較好的第一個(gè)是U型網(wǎng)絡(luò),其實(shí)現(xiàn)在有很多也在用這個(gè)思想。

    氣浮法分類按氣泡產(chǎn)生分類_按物體的數(shù)量分類ppt_小班數(shù)學(xué)按物體名稱分類教案

    最后講一下騰訊云的能力,騰訊云,我們其實(shí)開放的大部分是高等級(jí)結(jié)果層,主要分三塊,OCR、Video、Image。包括人臉上我們會(huì)輸出一些人臉的檢測(cè)點(diǎn),現(xiàn)在已經(jīng)開放一百個(gè)標(biāo)注點(diǎn)了,根據(jù)這些標(biāo)注點(diǎn)可以做一些自己的應(yīng)用,我們也希望或者在有余力的情況下開發(fā)一些更偏下游的,讓開發(fā)者有更多的開用工具,這樣開發(fā)的自由度更高一點(diǎn),但坦率講這個(gè)對(duì)我們工作壓力是非常大的。在底層,像平臺(tái)這一面,平臺(tái)更多的是虛擬機(jī),一些計(jì)算資源,計(jì)算資源上搭了一些通用的軟件,這部分應(yīng)該還是比較容易獲得的,現(xiàn)在一個(gè)是從下往上,另一個(gè)角度從上往下,爭(zhēng)取把結(jié)果進(jìn)行一個(gè)更好的覆蓋,開發(fā)者從粗粒度到細(xì)粒度的工具,能夠開發(fā)出我們更想要的應(yīng)用場(chǎng)景。

    這是一個(gè)例子,我們做一個(gè)人臉融合,把一張模板的圖片和一個(gè)用戶的圖片揉合在一起,先是定位,之后是配準(zhǔn),之后把臉部分割出來,融合是沒有進(jìn)行開放也不太好開放的地方,這里涉及到一些渲染的方法,再加上光照的廣大,形成最后的融合圖。

    還有一個(gè)案例,是最近工業(yè)性的一個(gè)應(yīng)用案例,現(xiàn)在用的手機(jī)屏幕的生產(chǎn)線是一個(gè)高自動(dòng)化的生產(chǎn)線系統(tǒng),涉及的人力非常少,用他們的話說只要機(jī)器不壞我們是不進(jìn)去的,唯一涉及到人的部分,可能就是看它有沒有缺陷的部分。這個(gè)缺陷的部分,像黑點(diǎn)、光斑的部分是缺陷的部分。

    這一塊主要的問題,要解決這個(gè)視覺應(yīng)用的話,第一個(gè)問題是你能看到的,其實(shí)一個(gè)切入點(diǎn)是你需要把你幾個(gè)缺陷部分和背景度相分離出來,至于背景后面的分析,其實(shí)用傳統(tǒng)的一些方法可能更為可靠一些,因?yàn)楸尘盎旧献兓秶浅I伲夷阕屗趺醋兓赡墚a(chǎn)生的變化因素是什么,比如聚焦、失焦,產(chǎn)品的更迭,這樣是可以有預(yù)備而來的。而且他們?cè)诟呔S空間里可以找到一個(gè)映射空間把它的前景和背景進(jìn)行一個(gè)有效的分離。

    最后是給希望在圖象和計(jì)算機(jī)視覺進(jìn)行進(jìn)一步學(xué)習(xí)的同學(xué)們一點(diǎn)意見吧,介紹給大家這幾本書,第三本書可以構(gòu)建出一個(gè)圖像分析的框架,第二本是講深度神經(jīng)網(wǎng)絡(luò)的,包括在圖像上的一些應(yīng)用。上面有一些課程,他們?cè)谏嫌幸恍┱n程,對(duì)編程能力和解決實(shí)際問題還是有很大幫助的。

    Q:我看到您最后給我們推薦機(jī)器視覺的入門資料,我很想問一下,您覺得機(jī)器視覺和計(jì)算機(jī)視覺的區(qū)別在哪兒?或者您覺得它是一個(gè)東西嗎?

    A:這個(gè)很有意思,你去找機(jī)器視覺,可能發(fā)現(xiàn)現(xiàn)在機(jī)器視覺都偏向在工業(yè)上的應(yīng)用,所以更多的是采用一些比較傳統(tǒng)的方法。計(jì)算機(jī)視覺我覺得應(yīng)該比這種所謂定義的視覺范圍廣一些的,至于他們倆是不是同樣的東西,很多的學(xué)術(shù)名稱都不是互斥的,都包括很多共同的東西,也包括有差異性的東西,那么在機(jī)器視覺上,至少實(shí)際應(yīng)用里提到機(jī)器視覺的話你會(huì)得到一批廠商,他們主要服務(wù)的對(duì)象是誰誰誰。你提到計(jì)算機(jī)視覺的時(shí)候,會(huì)得到另外一些,包括蘋果、微軟、英特爾,這是另外一個(gè)圈子。所以從這個(gè)角度上是有一定分類的按物體的數(shù)量分類ppt,但如果從技術(shù)角度或者從從業(yè)者的角度,或者從一個(gè)學(xué)習(xí)者的角度來講,他們有很多東西是共性的。

    小班數(shù)學(xué)按物體名稱分類教案_按物體的數(shù)量分類ppt_氣浮法分類按氣泡產(chǎn)生分類

    Q:冀老師您好,我想問您兩個(gè)問題,第一個(gè)問題是就技術(shù)方面來看,您會(huì)覺得計(jì)算機(jī)視覺,像圖像分類或者是目標(biāo)檢測(cè)已經(jīng)到達(dá)一個(gè)穩(wěn)定水平了嗎?

    A:在一些通用的場(chǎng)景還是比較穩(wěn)定的,換句話說調(diào)用的接口,得到的結(jié)果是能滿足百分之六七十、七八十的場(chǎng)景,在一些特定的場(chǎng)景,更像是端到端的解決方案,我們現(xiàn)在已經(jīng)開放的接口恐怕很難達(dá)到一個(gè)很好的效果,總結(jié)來講,一些通用的場(chǎng)景或者一些通用的問題,絕大多數(shù)場(chǎng)景給一個(gè)方案,給一個(gè)平臺(tái),那么這個(gè)是比較穩(wěn)定的。對(duì)于一些差異化的場(chǎng)景,只靠這些開放平臺(tái)肯定是不夠的。

    Q:可以檢測(cè)出哪個(gè)階段產(chǎn)生缺陷嗎?

    A:因?yàn)樯a(chǎn)階段有不同的站點(diǎn),可以通過站點(diǎn)之前進(jìn)行回溯,避免產(chǎn)生資源浪費(fèi)。還有多少種,我只能說這個(gè)種數(shù),要求的種數(shù)是非常多的,至少上百種吧。我們現(xiàn)在理論上正在做的過程,有一部分是成熟的,有一部分不太成熟。

    Q:我現(xiàn)在在做一個(gè)特殊字符的識(shí)別,我現(xiàn)在遇到一個(gè)問題,我沒有那么多的訓(xùn)練數(shù)據(jù),它給了我一部分測(cè)試數(shù)據(jù),但每個(gè)字符只有一百個(gè),就算全部拿來訓(xùn)練也達(dá)不到那種效果。我的訓(xùn)練數(shù)據(jù)非常少,我想問一下怎么生成那種數(shù)據(jù),盡量和測(cè)試數(shù)據(jù)能達(dá)到那種效果。

    A:其實(shí)你遇到的問題,我們經(jīng)常遇到,我們做一個(gè)東西,給你十個(gè)例子,又不告訴你上下文,又不告訴你到底用在什么位置。從這個(gè)角度來講,我會(huì)做什么,我們會(huì)跟需求方,無論需求方是客戶還是產(chǎn)品經(jīng)理聊這個(gè)到底干嗎用?這個(gè)字符所產(chǎn)生可能的范圍是什么樣的。

    Q:我們現(xiàn)在做那個(gè)字符是學(xué)生用手寫了一個(gè)數(shù)字,畫了一個(gè)圈,問題是他給我的圖里,有的是可以把圈全部截到里面去,有的就截一半的圈。

    A:就是一個(gè)數(shù)字的手寫體。

    Q:又加了一個(gè)圈,但會(huì)有干擾。

    A:這個(gè)還好,這個(gè)問題不是特別大。

    Q:我想問一下生成這個(gè)問題。

    A:生成的話,你可以采用不同的,比如是不是都是手寫的?還是也有印刷的?也有印刷的。我覺得你還是新定義一個(gè)sgop(音),看它的變數(shù)是什么,再去仿照一些樣本。如果這個(gè)sgop定義不了的話,效果肯定不好,這是必然的,所以先看一下到底想解決這個(gè)問題的范圍、邊界在哪里。

網(wǎng)站首頁   |    關(guān)于我們   |    公司新聞   |    產(chǎn)品方案   |    用戶案例   |    售后服務(wù)   |    合作伙伴   |    人才招聘   |   

友情鏈接: 餐飲加盟

地址:北京市海淀區(qū)    電話:010-     郵箱:@126.com

備案號(hào):冀ICP備2024067069號(hào)-3 北京科技有限公司版權(quán)所有