操屁眼的视频在线免费看,日本在线综合一区二区,久久在线观看免费视频,欧美日韩精品久久综

新聞資訊

    【摘要】:語音是人類獲取信息的主要來源之一,也是最方便、最有效、最自然的交流工具。說話人識別技術在近三十多年的時間里取得了很大的進步,這種技術的應用為人類的日常生活帶來很大的便利。本文構建了一個基于高斯混合模型的說話人識別系統。在完成了多項基本性能的測試和比較的基礎上,對模型參數初始化和系統判別中的某些環節進行了改進,提高了系統的識別率。本文的工作主要有以下幾個方面:(1)系統構建:采用C++和混合編程方式,并在VC++6.0的環境下架構了基于高斯混合模型的說話人識別系統。包括聲音讀取和采集模塊、預處理模塊、特征參數提取模塊、參數訓練模塊和識別模塊。(2)性能研究:主要研究了特征選取和高斯混合模型參數選擇對系統性能的影響。在特征參數提取方面,研究了LPC、LPCC、MFCC三種主流特征參數,實驗表明,采用MFCC特征參數比采用其他兩種特征參數有更好的識別效果;針對高斯混合模型,研究了模型的階數對系統識別率的影響,分析了階數過大或過小對系統的負面影響說話人識別 模型包括,并結合實際情況進行了選擇;提出在EM算法的迭代過程中設置協方差閾值,并對不同閾值條件下的識別率進行實驗對比,證明了將協方差閾值設置為0.1的普適性和可行性。(3)系統改進:考慮到少量的孤立點數據就會對K-均值算法的聚類結果產生很大的影響。因此,提出了聚類均值點與聚類種子相分離的思想,并對K-均值算法進行了相應地改進。實驗表明說話人識別 模型包括,改進后的算法比傳統K-均值算法具有更高的準確性。同時,采用三角不等式原理,解決了K-均值算法的時間開支問題;在識別階段,由于說話人的個性特征時長變動性以及受到噪聲等干擾的影響,某些語音測試幀對于非目標模型的得分反而大于目標模型,從而導致誤判。因此,針對系統判別準則中常用的傳統概率打分法,提出了對語音幀得分進行加權的改進方法,并驗證了該方法的有效性。

    一次性金融服務識別要點包括_說話人識別模型與方法_說話人識別 模型包括

網站首頁   |    關于我們   |    公司新聞   |    產品方案   |    用戶案例   |    售后服務   |    合作伙伴   |    人才招聘   |   

友情鏈接: 餐飲加盟

地址:北京市海淀區    電話:010-     郵箱:@126.com

備案號:冀ICP備2024067069號-3 北京科技有限公司版權所有