操屁眼的视频在线免费看,日本在线综合一区二区,久久在线观看免费视频,欧美日韩精品久久综

新聞資訊

    T之家12月4日消息 12 月 2 日,微軟與周迅 AI 語音紅丹丹公益項目發起人——鹿音苑文化傳播公司、以及來自微軟及各界的 150 名余志愿者,將創作的首批人工智能有聲內容,包括魯迅、老舍、蕭紅、朱自清等作家的一系列經典作品、紅丹丹文化期刊,正式捐贈給北京市紅丹丹視障文化服務中心(下文簡稱 “紅丹丹”)“心目圖書館”。

    這些作品是基于微軟 Azure 云認知服務語音合成平臺 Speech Studio 及其豐富的人工智能(AI)語音創作的,其中包括藝人周迅授權的定制聲音、紅丹丹視障人士播音員董麗娜授權的定制聲音,以及多個微軟智能語音合成平臺聲音(如曉曉、云野等)。

    隨著人工智能時代的到來,語音服務重要性不斷凸顯,微軟在不斷探索突破智能語音極限,加快從研發到產品的落地,希望以科技力量賦能更多人和組織。

    語音技術最新進展視頻:

    媲美專業發音人的智能語音系統

    微軟在智能語音領域已深耕長達二十余年。智能語音作為人工智能的核心技術之一,早已融入于微軟全球產品,這其中包括 Windows 朗讀、Skype、Office 等產品,并隨著微軟云認知服務(CognitiveServices)的推出,形成面向開發者和合作伙伴的開放平臺體系,提供強大而靈活的語音服務。

    近年來,結合深度神經網絡技術的不斷創新,微軟智能語音合成(Text-To-Speech,TTS)技術取得了諸多突破性進展。2018 年 12 月,微軟率先在全球范圍內推出端到端的深度神經網絡語音合成服務,使計算機和智能設備擁有了媲美真人的人工智能聲音。

    IT之家獲悉,在探索提升語音自然度的同時,微軟語音合成技術也不斷挖掘語音的表現力、豐富度和智能度。通過多情感、多角色和情感強度可調節等技術升級,微軟智能語音極大程度地豐富了合成語音的風格。更進一步,為了大大降低有聲內容的創作成本,微軟針對復雜長文本,提供了智能情感和角色的預測功能,讓 AI 語音具有更強的理解力,讓有聲內容創作變得輕松又便捷。

    具體而言,智能語音多情感技術創造性地從人類語音中挖掘出情感語音特征,賦予了合成語音擬人的表現力,讓合成語音不僅可以根據不同場景進行變化,也有了 “自己的喜怒哀樂”。聲音因此更富有表現力,不僅得以更貼切地表達文字內容,也讓語音更容易理解、更生動。

    譬如,中文曉曉的聲音已達到 14 種情感風格,可以用 “抒情”、“新聞”、“聊天”等不同風格來演繹不同使用場景下的作品,也可以用 “開心”、“悲傷”、“生氣”、“恐懼”等多樣情感在對話中表達不同的情緒和態度。

    人的情緒就好比是色譜,色譜的顏色從深到淺,人的情緒也一樣,有從強到弱的變化。微軟智能語音情感強度可調節技術,可以加強或者減弱情感強度,讓情緒的表達更加細膩,從而大大擴展了情感矩陣,豐富了多情感語音的表達;在實際的人與人對話中,情感的變化是微妙的,通過情感程度可控技術,可以讓人工智能對話或聊天機器人變得更流暢、真實,人設也更加統一。

    微軟智能語音提供眾多聲音角色供用戶選擇,覆蓋不同的年齡、性別和個性特征,其中一些聲音還可以扮演不同角色,比如男聲演繹女聲、年輕聲音扮演年老聲音等。通過微軟高質量的聲音家族,用戶可以挑選更符合實際場景的不同音色,滿足自然的對話需求,也可以創作更有趣的多播劇。大大擴展了有聲內容的創作空間。

    微軟智能語音也在探索更加智能、更具理解力的語音系統,在創造出豐富、自然、具有表現力的有聲內容的同時,進一步降低人工的操作成本。根據上下文信息,微軟語音能夠識別出來旁白和對話,人物角色,以及語氣和情緒,并自動推薦一個最合適的聲音。

    為了讓每個人都可以輕松創作有聲內容,微軟提供了一套智能有聲內容創作工具平臺。輸入文本后,工具可以先針對角色和情緒進行預測,然后選擇合適的聲音進行演繹。創作者可以對聲音、情感、韻律、發音等進行調優,創造出不一樣的有聲內容。

    作為情感的延伸,唱歌是人類表達情感的重要方式。微軟語音也在基于神經網絡的唱歌技能上取得了突破。微軟人工智能語音曉曉和朱婧汐一起合唱高難度的《人類零件》歌曲,展示了中英雙語演唱以及說唱能力,合成效果逼真自然。

    微軟云擁有全球覆蓋最多的數據中心,其認知服務智能語音技術面向全球市場,覆蓋語言數量世界領先。目前,微軟的語音合成支持 54 個國家和地區的語言,提供超過 150 個聲音供選擇。

    微軟語音支持深度品牌定制

    在人工智能時代,AI 聲音已經不僅僅是一項基本能力,更被賦予了很多品牌屬性。在諸多行業的實際應用中,客戶往往需要一個具有高識別度的個性化的聲音,而 “深度定制”恰是微軟智能語音平臺的一大強項。

    基于客戶提供的聲音數據,微軟可以實現 “細粒度”的定制,包括語音合成的音色、說話的風格、特殊的發音需求甚至演唱等特色功能等。在使用方面,微軟語音也相當靈活,不僅服務于云平臺,也支持本地化和離線部署等多種場景。

    微軟云計算與人工智能事業部資深產品總監丁秉公認為,個性化時代,聲音即品牌。微軟的語音合成技術可以為企業定制豐富的音色,實現品牌價值的最大化。

    2019 年 11 月,微軟推出了基于深度神經網絡語音合成技術的聲音定制服務(Custom Neural Voice)平臺,將高質量的語音合成引擎開放給第三方,使得微軟合作伙伴和客戶可以通過簡單的自助服務定制有標識度和個性化的聲音。

    微軟語音定制涵蓋了從聲音畫像的設計、到數據的收集和整理、模型的優化和系統部署的方方面面。用戶更可以通過 CustomVoice 聲音定制平臺實現一鍵定制的自助服務。

    傳統技術定制的語音模型,由于需要發音人錄制成千上萬句話,需要耗費幾個月的時間,成本巨大。而微軟基于深度神經網絡技術的定制化語音,可以用更少的數據達到更加高擬人度和自然真實的效果。通過微軟語音涵蓋超過 50 個語言的 UNI-TTS 基礎模型和深度神經網絡強大的遷移學習能力,微軟聲音定制還支持跨語言定制,實現一個音色多個語種的多語言能力。

    據悉,這一技術已經率先在多個知名企業得到應用。這包括新媒體、通信、教育、金融等多個行業,涉及客戶服務、AI 對話和內容生產的多個場景。

    譬如英國廣播公司 BBC 就在微軟聲音定制和語音合成技術的幫助下,打造了一款虛擬助手 Beeb 用于多模態的客戶服務和有聲內容創作。具體而言,BBC 不僅需要 Beeb 發出標準英式發音,甚至細化到英國北部某個特定地區的口音風格,還有多風格的要求,比如在跟真人打招呼時,聲音需要符合個人助理身份的互動風格,而在播報政治、軍事類新聞時,就需要嚴肅的聲音風格。

    面對這一挑戰,微軟在 BBC 提供的不到 2 小時的錄音人數據量中,與語言專家、客戶挑選和分析其中特定口音的發音特點,匯總成模型能識別的規律,最后構建到定制化模型里,生成高質量、多風格的聲音。

    在教育行業,微軟語音團隊協助知名獨角獸公司多鄰國 Duolingo 打造具有多語言能力和豐富角色特征的聲音。據多鄰國藝術總監 GregHartman 介紹,“每一個角色的聲音都是和它的人物性格的一部分。微軟定制聲音平臺基于我們的角色特性,賦予了每一個人物生動的聲音風格?!?/p>

    此外,微軟智能語音團隊還幫助 AT&T 時代華納、Swisscom(瑞士電信)、Progressive 等多家知名企業創建了他們的個性化聲音,實現與用戶的自然對話和交互。

    在中國,目前語音服務也落地到由世紀互聯運營的 Azure 云服務上,中國用戶可以使用和全球一樣質量的語音合成服務。

    2019 年春節前夕,央視新聞聯合微軟推出互動融媒體產品《你的生活 AI 為你唱作》,其中央視主播康輝和微軟 AI 智能語音中文曉曉為用戶唱作專屬歌曲,央視主播康輝的聲音即是利用微軟智能語音的聲音定制技術生成。此外,周迅為紅丹丹圖書館錄制有聲書、知名作家土摩托錄制三聯生活周刊音頻內容時,都用到了微軟定制語音合成技術。微軟以少量真人語音為訓練樣本,為他們合成了專屬于自己的智能 TTS 聲音。

    除語音合成之外,微軟 AIspeech 還能夠提供全面的核心語音能力,例如語音識別、語音評測、語音翻譯,這些能力都支持多語種以及基于不同場景的定制。

    其中,微軟的語音識別支持全球 30 個地區和國家語言,能夠提供近場和遠場識別,在線(real-time)和離線(batch)的靈活調用方式。語音識別還可以支持關鍵詞識別,說話人分離,語言識別,情緒識別等多種功能。

    而微軟語音評測產品可支持包括英語在內的全球 40 多個國家和地區的語言,廣泛適用于教育領域解決方案的合作伙伴、APP 開發者以及語言學校、培訓中心、教育機構、考試中心的各種語言學習、口語練習和考試等場景的開發。

    隨著深度神經網絡算法的突破,數據的爆發,基礎設施的完善,AI 語音技術正在走向大規模應用增長的發展方向。微軟以及其他平臺公司將不斷通過 AI 技術賦能更多場景,可以可以提供無限可能。

    體驗有聲內容創作工具平臺:https://speech.microsoft.com/audiocontentcreation

    2017年被業界視為國內人工智能元年,智能音箱作為智能家居入口和家庭人工智能交互的切入點,自年初以來市場不斷升溫,BAT紛紛進入,成為今年智能硬件市場一大熱點。

    但是智能音箱是智能家居的未來嗎?

    現在談及未來為時尚早,不過從我們的所有經歷過的變革來看,固定終端到移動終端是市場發展不變的法則?,F在智能音箱使用場景固定,即使增加了電池,也和便攜搭不上邊。不過這并不影響智能音箱變成PC一樣,雖然使用的頻率可能不高,但是在家庭場景當中有著不可或缺的地位。

    想要成為不可取代的產品,如何發展很重要,叮咚智能音箱從2015年入場,第二代產品將于9月13日正式發布,IT耳朵提前給大家帶來全方位的體驗測評,新的產品增加怎樣的功能,又能帶來怎么新的交互方式呢?

    《中國有嘻哈》在9月9日終結,PG One和GAI雙冠軍的結局還讓人難以接受,但是通過叮咚2代音箱,我已經找到了把PG One帶回家的方法,而且有求必應,想讓他唱什么唱什么。

    拆箱:體積減小,顏值提升

    叮咚智能音箱

    單單從體積上來講叮咚二代,很小巧,顏值上有很大的提升,放在家里也會顯得很小清新,頂部有一個斜向的LED屏幕,給音箱的交互增加了想象空間。

    音箱底部有兩個接口,一個充電接口,一個耳機接口,離地面非常的近,不過也不用擔心,叮咚的適配插頭剛剛好。

    頂部除了LED功能之外,必要的觸控功能也是必不可少的,通過點擊、滑動不同區域可以實現,上一曲/下一曲、音量加/減等功能。

    布制的外殼一方面把音響的聲音進行了過濾,一方面提升了改變了原來大、拙的產品印象。而且頂部的LED屏幕也讓音箱的表現形式有了更多的想象力。

    叮咚智能音箱

    體驗:PG One是我的了

    叮咚2代音箱的聯網只需在應用商店下載”智能音箱“App,登陸后選擇添加新設備,添加叮咚2代音箱。

    叮咚2代支持5Ghz模式,不用像其他的音箱那樣只支持2.4Ghz。在屏幕上亮起WiFi符號的情況下,通過App進行聯網,很方便。(現在市面上有些音箱只支持2.4Ghz,還有的需要藍牙連接進行網絡設置)

    叮咚2代相對于1代的升級最讓人驚喜的地方就是可以自定義喚醒詞,這個喚醒詞不一定非要是兩個重復的詞語,可以使你的名字,你朋友的名字,明星的名字,或者是某種特殊稱呼。

    想一想,你把男朋友/老公的名字設置成喚醒詞,他不在的時候,你只要呼喚他的名字音箱就可以直接回應你,讓你感覺到有他在身邊的感覺,這種感覺是不是很奇妙,耳朵君除了嘗試耳朵同學,還嘗試了一些《中國有嘻哈》的熱門選手的名字,感覺不要太奇妙,呼喚他們的名字,然后讓他唱他的歌兒。

    PG One為喚醒詞時的語音交互

    不過比較喚醒詞還是要通過評估的,吳亦凡的名字就因為評級太低無法成為有效的喚醒詞,不過”污力凡凡“是可以的哦。喚醒詞現在不支持英文,只支持中文,所有想一些名字是英文的Rapper”PG One“(皮幾萬)”Bridge“(布瑞吉)這些只能把他們的名字音譯成中文在進行喚醒。

    所以你喜歡誰你就可以直接把他的名字設置成喚醒詞,如果你喜歡GAI的話,可以把名字設置成(蓋蓋蓋)這么急切的呼喚誰都知道你喜歡他了。

    除了喚醒詞之外,叮咚二代還可以調節TTS發音人。TTS就是發音人,比如說Siri可以是女聲也可以是男聲。叮咚提供了9款TTS聲音選擇,總有一款適合你,不過現在的叮咚2代的聲音連接上,機械的味道還是有一點重,希望以后可以更人性化。

    叮咚2代還增加了打電話功能,而且在打電話過程中是不占用你的手機資源的,顯示的號碼也為叮咚的企業號碼,聯系人需要用戶先添加到APP當中,比較慶幸的是可以從通訊錄中導入。

    只可以打給App內通信錄中已存的人,不可以通過念電話號碼的方式撥打。這樣的做法,可以把音響作為一個通信設備,打電話直接通過語音進行操控撥打很方便,也可以說是一個小貼心的功能,雖然像是電話座機一樣,我們的使用頻率不高,但是真的很需要的時候,比如說找手機,就可以很自然使用叮咚音箱來呼叫。

    現階段的電話功能延遲比較嚴重,音箱得到反饋的聲音延遲大概要有1秒左右的時間,體驗還有待提升。

    聲紋是一個很特別的東西,這個東西的安全系數耳朵君不敢妄下定論,但增加一層鎖總好過沒有。在確認聲紋過程中叮咚的LED屏幕上會有兩個方塊慢慢合在一起,表示你聲紋確認的過程。

    聲紋確認前,你還要輸入叮咚智能音箱對你的稱呼,這個就很隨意了,完全可以滿足一下大寶這個200斤油膩的胖子的虛榮心。目前聲紋識別還沒有功能支持,叮咚方面表示會做進一步的升級。聲紋識別目前只支持喚醒詞”叮咚叮咚“,不能感受到偶像的呼喚。

    總得來說,叮咚2代增加了屏幕,可以有更好的互動方式,打電話、更改喚醒詞、聲紋識別都間接的提升了智能音箱的喚醒頻率。

    不過,耳朵君還不能因此來確定智能音箱在家庭、客廳使用場景的不可取代的地位。畢竟我們對智能音箱的未來還有更高的期待。

網站首頁   |    關于我們   |    公司新聞   |    產品方案   |    用戶案例   |    售后服務   |    合作伙伴   |    人才招聘   |   

友情鏈接: 餐飲加盟

地址:北京市海淀區    電話:010-     郵箱:@126.com

備案號:冀ICP備2024067069號-3 北京科技有限公司版權所有