用戶也可以使用電腦語音來查找系統(tǒng)中的文件、或者搜索相關(guān)的圖片、郵件,也可以直接打開軟件程序,直接播放視頻文檔,做到與微軟語音助手一樣的設(shè)備智能控制功能,你還可以讓小愛同學(xué)幫助你查詢各種信息,如新聞資訊、天氣預(yù)報等,還能陪伴你聊天互動,讓你辦公效率更高,協(xié)作成為一句話的事情。
如何下載小愛同學(xué)uwp電腦版,因為官方的限制不能上傳鏈接所有不能放鏈接在文章中,您可以關(guān)注微信公眾號回復(fù)“小愛同學(xué)”即可,一定是關(guān)注微信公眾號回復(fù)小愛同學(xué)才可以哦!
關(guān)注小王科技館獲取最新資訊
素材來源于網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系作者刪除
本地部署語音合成大模型具有以下幾個重要原因:
在本地部署可以更好地控制數(shù)據(jù)的訪問和使用,確保敏感信息不會被傳輸?shù)酵獠糠?wù)器,降低數(shù)據(jù)泄露的風(fēng)險。例如,企業(yè)內(nèi)部的機(jī)密文檔需要轉(zhuǎn)換為語音時,本地部署能保證這些數(shù)據(jù)的安全性。
能夠根據(jù)特定的需求和場景進(jìn)行定制化調(diào)整和優(yōu)化。比如,某些行業(yè)可能對語音的音色、語速、語調(diào)有獨特的要求,本地部署可以更精準(zhǔn)地滿足這些特殊需求。
避免了網(wǎng)絡(luò)延遲帶來的影響,提供更流暢、實時的語音合成服務(wù)。特別是在網(wǎng)絡(luò)不穩(wěn)定的環(huán)境中,本地部署能夠保證服務(wù)的連續(xù)性和穩(wěn)定性。例如,在一些對實時性要求極高的生產(chǎn)環(huán)境中,如自動化控制系統(tǒng)。
長期來看,對于大量的語音合成需求,本地部署可能會節(jié)省與云端服務(wù)提供商的持續(xù)交互所產(chǎn)生的費用。
不受外部服務(wù)提供商的政策、技術(shù)變更或服務(wù)中斷的影響,能夠完全自主地管理和維護(hù)語音合成系統(tǒng)。
https://github.com/FunAudioLLM/CosyVoice
web界面
生成的音頻
暫時無法在飛書文檔外展示此內(nèi)容
本案例部署的環(huán)境:
宿主機(jī):Windows11企業(yè)版
wsl2安裝Ubuntu,默認(rèn)Ubuntu系統(tǒng)
提前準(zhǔn)備:
步驟:
克隆并安裝
git clone --recursive https://github.com/FunAudioLLM/CosyVoice.git
創(chuàng)建python環(huán)境并激活
conda create -n cosyvoice python=3.8
conda activate cosyvoice
# pynini is required by WeTextProcessing, use conda to install it as it can be executed on all platform.
conda install -y -c conda-forge pynini==2.1.5
pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/ --trusted-host=mirrors.aliyun.com
Model download 模型下載
# git模型下載,請確保已安裝git lfs
mkdir -p pretrained_models
git clone https://www.modelscope.cn/iic/CosyVoice-300M.git pretrained_models/CosyVoice-300M
git clone https://www.modelscope.cn/iic/CosyVoice-300M-SFT.git pretrained_models/CosyVoice-300M-SFT
git clone https://www.modelscope.cn/iic/CosyVoice-300M-Instruct.git pretrained_models/CosyVoice-300M-Instruct
git clone https://www.modelscope.cn/iic/CosyVoice-ttsfrd.git pretrained_models/CosyVoice-ttsfrd
或者,您可以解壓縮 ttsfrd 資源并安裝 ttsfrd 包以獲得更好的文本規(guī)范化性能。
請注意,此步驟不是必需的。如果您不安裝 ttsfrd 包,我們將默認(rèn)使用 WeTextProcessing。
cd pretrained_models/CosyVoice-ttsfrd/
unzip resource.zip -d .
pip install ttsfrd-0.3.6-cp38-cp38-linux_x86_64.whl
基本用法
對于zero_shot/cross_lingual推理,請使用 CosyVoice-300M 模型。對于SFT推理,請使用CosyVoice-300M-SFT模型。對于指示推理,請使用 CosyVoice-300M-Instruct 模型。首先,將 third_party/Matcha-TTS 添加到您的 PYTHONPATH 中。
export PYTHONPATH=third_party/Matcha-TTS
開始 Web 演示
您可以使用我們的網(wǎng)絡(luò)演示頁面來快速熟悉 CosyVoice。我們在 Web 演示中支持 sft/zero_shot/cross_lingual/instruct 推理。
# change iic/CosyVoice-300M-SFT for sft inference, or iic/CosyVoice-300M-Instruct for instruct inference
python3 webui.py --port 50000 --model_dir pretrained_models/CosyVoice-300M
打開瀏覽器,輸入網(wǎng)址:http://localhost:50000/
在輸入合成文本欄,輸入文字,如上:
本地部署語音合成大模型具有以下幾個重要原因:
數(shù)據(jù)隱私和安全性:
在本地部署可以更好地控制數(shù)據(jù)的訪問和使用,確保敏感信息不會被傳輸?shù)酵獠糠?wù)器,降低數(shù)據(jù)泄露的風(fēng)險。例如,企業(yè)內(nèi)部的機(jī)密文檔需要轉(zhuǎn)換為語音時,本地部署能保證這些數(shù)據(jù)的安全性。
點擊“生成音頻”,幾秒鐘后,即可成功生成。音頻如下:
如果能正常合成,恭喜你,部署成功了!
歡迎關(guān)注、點贊、收藏,后續(xù)有更多技巧分享,如克隆聲音、多國語言語言生成等。
edmi在2月25日召開了年度新品發(fā)布會,正式推出了Redmi K40系列手機(jī)、RedmiBook Pro系列筆記本和Redmi MAX 86寸電視產(chǎn)品。
其中,RedmiBook Pro筆記本擁有全方位升級,還首發(fā)搭載了小愛同學(xué)語音助手,宣稱“一句話搞定工作與生活”。
現(xiàn)在,小米將小愛同學(xué)擴(kuò)展到了更多設(shè)備上,小米同學(xué)的UWP應(yīng)用正式上架了Win10應(yīng)用商店,任何PC產(chǎn)品均可下載使用。
小愛同學(xué)UWP應(yīng)用上架Win10應(yīng)用商店
小愛同學(xué)是小米研發(fā)的人工智能語音系統(tǒng),目前小米手機(jī)、小米電視、小米手環(huán)、智能音箱等多個品類都內(nèi)置了該AI語音系統(tǒng)。
據(jù)介紹,PC版小愛同學(xué)與其他版本類似,能幫用戶直接通過語音查找文件、搜索郵件、打開程序、播放演示文檔、控制智能設(shè)備,還可以查天氣、講笑話,并陪你聊天。
具體功能如下:查找文件:按照名稱、日期類型搜索電腦中文件
打開程序:通過語音打開系統(tǒng)中已安裝程序
播放演示文檔:進(jìn)入 PPT 模式后,無需喚醒詞,直接語音控制翻頁
控制智能設(shè)備:控制米家設(shè)備
小愛同學(xué)UWP應(yīng)用現(xiàn)支持20多種類別功能
值得注意的是,RedmiBook Pro筆記本上搭載了獨立的語音按鍵,支持一鍵呼出語音助手,與手機(jī)端同樣便捷。
而其他電腦目前僅能通過鼠標(biāo)點擊對話按鈕才能與小愛同學(xué)交流,當(dāng)前的語音喚醒詞也并不支持所有設(shè)備,體驗感有所不足,希望后續(xù)小米能持續(xù)優(yōu)化帶來更好的使用體驗。