操屁眼的视频在线免费看,日本在线综合一区二区,久久在线观看免费视频,欧美日韩精品久久综

新聞資訊

    “請在安靜環境下錄制,請勿佩戴口罩,請勿使用耳機,正對手機麥克風大約10厘米,一次性咳嗽四聲以上。”

    近日,一款名為“智能聲音識別”的小程序出現在社交平臺。點擊進入小程序,會有新冠肺炎檢測的選項。錄音結束后自動識別,有“正常”和“疑似新冠肺炎”兩種結果。小程序有新冠肺炎聲音采集和多病種聲音采集兩個選項。

    聽咳嗽聲識別新冠肺炎?對于測試結果,小程序也有文字提示“科研試用,測試結果僅供參考,并不代表最終結果,請以醫學檢測手段為準”。

    用咳嗽聲檢測新冠 小程序截圖

    “基于聲音的新冠檢測研究”

    研發方稱:并非醫學診斷器材,結果僅供參考

    小程序介紹稱,其“利用中國科學院聲學研究所、地壇醫院、北京大學第三醫院、大連市公共衛生臨床中心聯合自主研發的人工智能技術自動識別疑似新冠”,賬號主體為北京中科信利技術有限公司。天眼查顯示,北京中科信利技術有限公司成立于2002年,中國科學院聲學研究所成員。經營范圍包括開發、生產語音、人機交互通信技術產品等。法定代表人顏永紅,系中科院聲學所研究員、博士生導師。

    12月9日上午,中國科學院聲學研究所一名工作人員告訴紅星新聞記者,該小程序和聲學研究所“沒有關系”,并提供了一個電話請記者進一步咨詢。截至發稿前,該電話未能撥通。記者在聲學研究所官網查詢發現,在聲場聲信息國家重點實驗室2021年度學術委員會會議上,顏永紅研究員作了題為《基于咳嗽音的新冠檢測研究》的報告。

    隨后記者通過郵件聯系顏永紅。9日中午,顏永紅回復記者一份文件資料。該資料稱,肺部和呼吸道的物理結構會隨著呼吸道感染而改變,而新冠肺炎以一種獨特的方式感染呼吸系統,這些改變與其他常見的非新冠肺炎呼吸系統疾病不同。國際上自2020年10月已有基于咳嗽聲診斷新冠肺炎的相關研究。資料還稱,中科院聲學所語音團隊自2020年3月開始研究基于聲音的新冠檢測,并于2021年初得到北京市科委(醫藥處)的項目支持。目前已構建了原理系統,對200余個國外新冠患者咳嗽音(非洲)和800個正常人咳嗽音測試,系統敏感性和特異性均超過了90%。系統以微信小程序的方式,可實時獲得識別結果,對于新冠無癥狀感染者小樣本集測試正確檢出率超過70%。

    該文件資料表示,目前團隊還在持續研究試圖提高精度。目前的測試版僅供個人用戶試用,小程序并不是醫學診斷器材,測試結果僅供參考。

    媒體報道國外相關研究:

    有觀點稱:“聽音識病”有效性需進一步驗證

    紅星新聞記者查詢發現,國外也確實有一些研究。據《科技日報》2020年報道:麻省理工學院(MIT)的研究人員發明了一款新人工智能模型,可以通過傾聽健康人和新冠肺炎患者之間咳嗽的細微差別,發現新冠肺炎無癥狀病例。這一AI算法基于他們先前開發的用于檢測肺炎、哮喘甚至阿爾茨海默癥等疾病的模型,能識別與新冠肺炎特有的4個特征相關的咳嗽差異:肌肉退化、聲帶強度、情緒(例如懷疑和沮喪)、呼吸和肺功能。結果表明,該AI模型識別出新冠肺炎病患的準確率為98.5%;識別出無癥狀感染者的準確率為100%。

    另據《科技日報》今年9月報道:9月4日在西班牙巴塞羅那舉行的歐洲呼吸學會國際會議上公布的一項研究,人工智能(AI)可通過手機應用程序從人們聲音中檢測出新冠肺炎感染,它比快速抗原測試更準確(達到89%),且更便宜、快速和易于使用。《科技日報》12月2日消息:ResApp公司開發的應用程序能夠根據病人的咳嗽錄音檢測新冠病例和其他呼吸道疾病,其中檢測新冠病毒的準確率高達92%。

    與此同時,也有媒體引用專家觀點指出,盡管“聽音識病”市場方興未艾,但其有效性仍需進一步驗證,同時還要警惕相關技術被濫用。

    欄目主編:張武 文字編輯:宋慧 題圖來源:圖蟲 圖片編輯:曹立媛

    來源:作者:紅星新聞

    在隔壁小眾軟件看到了一款有意思的工具-“Const-me/Whisper”。

    原版Whisper是OpenAI做的一個神經網絡模型,它可以在本地實時語音轉文字,用來翻譯和做字幕等等,而Const-me的版本將Whisper做成了Windows的版本,還添加了GPU加速。


    在官方的GitHub頁面上,可以看到這個工具還有不少特點,比如說項目采用純C++實現,除了系統基本組件沒有運行依賴、內存占用低、支持大多數音頻和視頻格式、支持大多數音頻捕獲設備、比OpenAI的實現還快。


    主要的使用限制是系統版本,Windows 8.1以下和32位的系統是用不了的。

    軟件的使用很簡單,一個用于啟動的界面環境,解壓出來1MB不到,一個用于識別的語言模型,模型有多個版本,想要正常使用得用1G以上的模型,下載文件之后,直接運行啟動器即可。


    打開之后就能看見這樸實無華的界面,軟件沒有幾個按鈕,雖然是英文的,但是模型路徑和高級設置一看就明白。

    在高級設置里面可以設置要調用的GPU,這個保持默認就行。

    之后就能看到軟件的主界面了,點開選擇語言,可以看到支持的語言還是挺多的,這里就先來試試中文。

    在測試的時候發現用1.42GB的模型,默認出來的是繁體,用2.88GB模型出來的是簡體,這個也可能是系統環境的原因,大家可以自己測試一下。


    測試用的顯卡是GTX1660,轉換速度在可接受范圍之內,上面這種簡短的句子,用大的識別模型,在某些簡單的語境條件下,以及加上最重要的因素——運氣好的話,竟然有100%的準確度。

    除了音頻文件,直接放視頻也是可以的,但是只要涉及的內容一廣,這個在本地運行的缺點就暴露出來了,生成的文本一言難盡,在有數字的時候會自己轉換成阿拉伯數字,有英文混雜的時候也會自己嘗試首字母大寫,但是在轉換效果上,一眼望過去有不少同音字錯誤,對于中文的前后文聯想能力比較差。

    支持實時錄制音頻。

    這個比Windows自帶的語言輸入效果要好一點,同樣的音頻速度,這個工具不會出現丟字的情況。

    官方給出的Whisper識別能力圖如下,主要還是用來識別英文。

    其他功能上,可以添加時間標記和直接翻譯成英文。


    想要控制具體的參數,也可以使用控制臺的版本,還會展示對應數值的置信度。


    輸出中文的話會出現一堆問號,這個不是控制臺的編碼顯示問題,但是在輸入轉換指令后,在對應路徑下面的文本生成是沒有問題的。

    有了這個,就可以配合像是Quicker一類的快捷工具,做到本地一鍵轉換成文本了。

    比較遺憾的是,這個小工具目前只支持將轉換的音頻轉換為英文,要是未來可以轉換成任意語言的話,那可玩性就很高了。

網站首頁   |    關于我們   |    公司新聞   |    產品方案   |    用戶案例   |    售后服務   |    合作伙伴   |    人才招聘   |   

友情鏈接: 餐飲加盟

地址:北京市海淀區    電話:010-     郵箱:@126.com

備案號:冀ICP備2024067069號-3 北京科技有限公司版權所有