人類認知世界的信息中80%多的信息來自于視覺,而在人工智能時代,計算機視覺則是機器認知世界的基礎。如何為計算機裝上細膩靈敏的眼睛,從而更好地服務人類生活?潮新聞記者在烏鎮峰會期間,專訪了北京交通大學教授魏云超。
作為2023年世界互聯網大會烏鎮峰會的重要活動之一,2023年世界互聯網大會領先科技獎頒獎典禮于11月8日舉行,15項領先科技成果正式亮相。其中,由北京交通大學、南開大學帶來的“視覺媒體的層次化內容感知”入選基礎研究組獎項。
魏云超和趙耀教授出席頒獎典禮。 圖源:受訪者供圖
北京交通大學教授魏云超作為團隊成員之一,向記者介紹說:“簡單地講,就是讓計算機從圖像級、物體級到像素級來由粗到細地去識別。”
“對于圖像或視頻里的物體,從粗粒度來講,我們可以知道里面有什么物體,但并不知道這些物體在什么地方;細粒度的話,我們能夠知道物體在哪個準確的位置,甚至是物體每個部件的位置,比如對于人體來講,可以解析出面部和頭發等信息。”
這就回答了“圖像有何物體,物體有何像素,像素是何類別,類別如何細分”的系列問題。
從2014年開始,魏云超和同事們將基于深度學習的神經網絡算法作為架構,進行不斷的研究和改進,設計能夠滿足不同層次化視覺內容理解任務的網絡框架,使得計算機能夠“感知世界”,從而輸出正確的類別預測。
“我們是做基礎研究的,在計算機視覺領域,國際上有很多知名的公開數據集,我們的研究成果主要是在這些公開的數據集進行測試,并同國際知名的團隊進行PK。”魏云超告訴潮新聞記者,“雖然我們的視覺媒體的層次化內容感知屬于基礎研究組獲獎項目,但我們的成果也跟實際應用緊密結合,我們的合作方南開大學程明明教授團隊開發的物體感知技術很早就被應用到了華為旗艦手機上,我們自己也跟國際知名的圖像處理軟件Picsart公司有深入合作。”
然而,原本跟深度學習相關的像素級理解算法都依賴大量的標注樣本。
如何讓算法能夠減少對人工標識的依賴,盡可能降低人力成本?魏云超和同事們嘗試了多種策略,包括弱監督學習、領域自適應學習、交互式學習等等,“在弱監督學習方面,我們在僅僅利用圖像標簽作為監督信息的情況下,提出了‘識別-擦出相對抗’的策略,使得我們可以利用分類網絡不斷挖掘圖像中可以支持類別標簽的證據,從而建立出語義和物體像素的對應關系,并訓練分割網絡。”
此外,他們還通過將人的點擊位置和對應圖片顯示的內容一起輸入到網絡中區,訓練網絡學習當點擊不同的位置應該輸出怎樣的物體區域。“以前標注一張圖片可能需要一個多小時,現在我們訓練的交互標注,可以讓模型自動去感知標注員想標注的物體區域。通過智能標注,能夠大大減少人力、提高效率。”魏云超表示,目前的成果已經成為歷史,未來還有更多的機遇和挑戰。今后,團隊還將在基礎研究外和工業界展開廣泛的合作,希望可以助推視頻編輯、電子商務、智能交通等領域的發展。
“轉載請注明出處”
章來源:視遠惟明 · 惟視眼科
編者按
醫學驗光檢查是眼科學與視光學臨床實踐中非常重要的檢查手段之一,無論是驗光配鏡還是各種屈光手術都需要進行醫學驗光檢查。醫學驗光檢查一般包括三個階段,即初始階段、精確階段和終結階段。電腦驗光儀以其簡單、快速、穩定的特點而在初始階段的客觀驗光中得到了廣泛應用。
電腦驗光儀能夠通過紅外光線,利用類似于間接檢眼鏡的原理,通過使無限遠的物象精準投射在視網膜上而計算被檢查眼的屈光度。
做完電腦驗光后,機器會給出一張驗光單。那么這張電腦驗光單上的諸多字母和數字究竟代表著什么意思呢?今天的文章給大家科普如何看懂驗光單!
這些字母什么意思?
“R”是“Right”的首字母,代表右眼;在有些機器中,也會用拉丁文Oculi Dexter的縮寫“OD”表示右眼;
“L”是“Left”的首字母,代表左眼;在有些機器中,也會用拉丁文Oculi Sinister的縮寫“OS”表示左眼;
“S”是“Spherical”的首字母,代表近視或遠視的度數,這些度數都用D 來表示,1.00D就是通常所說的100度;其中,“S”下面對應的數值前如果是“-”表示這里用到了負鏡(凹透鏡),也就是說,驗光結果提示近視,一般來說,小于300度的我們叫做低度近視,而300-600度的近視稱為中度近視,高于600度的就是高度近視。相反的,如果是“+”則表示這里用到了正鏡(凸透鏡),也就是說驗光結果提示遠視,遠視按照度數分類和近視并不一樣——在300-500度之間的為中度遠視,低于這一范圍的叫做低度遠視,高于這一范圍的則叫做高度遠視。“C”是“Cylindrical”的首字母,代表散光的度數;“A”是“Axis”的首字母,代表散光的軸位;
“VD”是“vertex distance”的縮寫,代表著鏡片與眼睛之間的距離,標準的VD應當為12毫米,如果實際使用的鏡片后頂點距離有所變化,那么可能會影響佩戴的體驗。
“PD”是“Papillary Distance”的縮寫,代表瞳距(也就是兩個瞳孔之間的距離),測量兩只眼瞳孔之間的距離后,我們在制作眼鏡時才能保證鏡片的中央(后頂點)與瞳孔位置相對,保證我們佩戴的眼鏡實際使用度數與理論度數一致;
“VA”是“Visual Acuity”的縮寫,表示我們戴上眼鏡之后的視力。
在電腦驗光(客觀驗光)的時候,這些數據一般會連續測量3次,出現3行數據,緊接著第4行數據為前3次測量數據的平均值,所以一般來說,我們只需要注意看第四行即可。
比如上面那張示例圖,就表示測量的結果是:右眼二百七十五度近視,一百度遠視散光,散光軸位是174度,矯正視力為1.0。左眼一百七十五度近視,沒有散光,矯正視力1.0。兩眼瞳距60mm。
實戰練習
看完了驗光單上的說明,我們來進行一個小練習吧。下面這張驗光單代表什么意思呢?
右眼:兩百二十五度近視,25度遠視散光,散光軸位為163度;
左眼:四百度近視,50度近視散光,散光軸位為175度。
有陽光 有未來 防控近視科普常識”已經以口袋書、宣傳海報等多種形式開始發放給廣大兒童青少年、家長及教師,希望廣大家長、教師朋友共同參與,助力科學防控近視,讓孩子們擁有一個光明的未來。同時我們也聯合“北京眼視光學會”共同創立了科普抖音號,為廣大的家長、教師朋友提供移動信息科普,讓大家可以隨時獲得最新的眼健康常識,在這里我們也會不定期的邀請王凱醫生等知名眼科專家為大家共同科普
敬請期待下期資訊,關注【北京大學人民醫院眼視光中心】,為您解決心里的煩惱,歡迎留言、評論,謝謝
,伙伴們!潔修哥又來跟大家分享電腦知識啦。今天咱們的話題是:“電腦怎么看有沒有顯卡?”,別擔心,我會用最接地氣的方式,讓大家秒懂如何判斷自己的電腦是否配備了顯卡,以及顯卡的具體型號。
方法一:系統信息查詢
方法二:設備管理器查看
方法三:硬件檢測軟件鑒別
幽默解讀時刻: 想象一下,顯卡就像電腦的眼睛,你要確認電腦是不是真的“開了眼界”,只需通過上述三種方式“對視”一下就知道了。如果是雙目炯炯有神(雙顯卡),單眼看世界(集成顯卡),還是戴了眼鏡(外接顯卡),一查便知!
實用小貼士: 如果你的電腦只有處理器自帶的集成顯卡,但在玩游戲或者處理大型圖像時覺得卡頓,可能就需要考慮升級為獨立顯卡了。而如果你的電腦明明有獨立顯卡,但在上述方法中卻沒有顯示,那可能顯卡驅動出現問題或者硬件故障,這時候潔修哥建議你尋求專業人員的幫助。
總結一下,想知道電腦是否裝有顯卡,以及顯卡的具體型號,只需要幾個簡單的步驟就能查明真相。跟著潔修哥的指引,從此告別電腦硬件小白的身份,輕松掌握自己電腦的“眼力”程度!快去試試吧,別讓電腦的“視力”問題耽誤了你暢享游戲或者高效辦公的美好時光哦!