優秀的語音輸入,首要任務就是識別準確,在這方面百度輸入法相當有發言權。百度語音技術早在2019年年初便取得了一項對全球學術界和工業界都具備重大意義的突破——流式截斷的多層注意力建模(SMLTA),將在線語音識別精度提升了15%,超越行業最優競品15%,充分保證了用戶語音輸入的精準度與識別速度。
其次,優秀的語音輸入還要照顧到不同用戶群體的需求。例如百度輸入法早早洞察到了各地用戶的方言輸入需求,以及年輕用戶的中英文混合表達方式,在業內最先推出了高精度的“中英自由說”和“方言自由說”功能。無論是“川妹子”、“東北老鐵”還是經常中英文夾雜的外企工作者,打開百度輸入法點擊麥克風,都能用自己最熟悉的表達方式輕松輸入、準確識別,極大提升了溝通效率。
(百度輸入法方言自由說功能)
當然,只保證聯網狀態下的輸入體驗還不夠,優秀的語音輸入還要“克服”各種環境難題。百度輸入法搭載的SMLTA技術也應用于離線語音識別,將離線語音識別精準度提升至在線語音的水平,保證了用戶在電梯、地鐵、隧道等弱網或沒網環境下,依然能夠順暢地使用語音輸入。
不久前,百度輸入法還業內首發了“離線中英自由說”功能,可識別離線狀態下的英文整句、中文整句和中英文夾雜的混合輸入。有AI實力“撐腰”,百度輸入法不僅讓用戶能用最熟悉的語言自在表達,還可以突破外部環境限制隨時隨地實現真正的“自由說”。
(百度輸入法離線中英自由說功能)
在滿足日常交流的基礎上,百度輸入法也十分注重挖掘AI技術的創新應用,將AI功能玩出了更多花樣。據艾媒咨詢發布的《2020中國第三方手機輸入法市場疫期專題報告》(以下簡稱為《報告》)顯示,百度輸入法在AI功能豐富性、創新性上位居業內榜首,語音速記、個性化語音、語音斗圖等功能深受用戶青睞。
(《報告》指出,百度輸入法在AI功能豐富性、創新性上表現突出)
以備受白領群體喜愛的語音速記為例,百度輸入法針對會議、采訪場景下的速記需求推出語音速記功能,該功能既支持單人模式的片段記錄、筆記整理和日常記事,也支持多人模式的會議記錄、采訪等。其中,多人模式通過強大的AI智能聲紋識別技術,可以區分2-3個不同人聲并分別記錄,并擁有業內獨家的長文本語音速記功能,幫助用戶實現高效的語音記錄和信息輸出,提升工作效率。
個性化語音功能則注重人性化體驗,在經過用戶授權后,百度輸入法可對通訊錄人名精準識別,避免用戶用語音輸入聊天時打錯對方人名的尷尬。同時,百度輸入法還可智能學習用戶的語音修改習慣,例如用戶語音說出“chen xi”后被識別為“陳希”,若用戶將“希”字改為“熙”字,百度輸入法會記住這一修改,今后當用戶再次語音說出“chen xi”時,輸入法就將準確識別為“陳熙”,不斷完善輸入體驗。
為滿足年輕用戶的斗圖需求,百度輸入法還推出了腦洞十足的語音斗圖功能。用戶聊天時在語音輸入界面點擊“斗”字圖標即可開啟,將你說的每句話都轉換為對應的表情包,備足“斗圖彈藥”。
據艾媒咨詢此前發布的《報告》顯示,在國內三大輸入法語音輸入滿意度評比中,百度輸入法以8.41的評分位列第一。百度輸入法的語音輸入功能在實用性、創新性和豐富性上,均離不開背后強大的AI技術支持。百度輸入法致力于為用戶的生活和工作帶來更多便捷的體驗,提升輸入法的交互效率。而事實證明,每一次技術上的突破,也都能為用戶帶來新的驚喜。(一鳴)
著數字經濟時代的到來,大數據、云計算技術已經成為生產力發展的主要驅動力,相應的,數據則成為這個時代最關鍵也最普遍的生產資料,數據被不斷地分享、處理、使用,在這個過程中,個人數據的保護,已經成為亟待關注的問題。
在信息化時代,數據產生于你數字生活的方方面面,其中,輸入法作為人機交互最高頻的應用之一,也是產生海量數據的來源,你每天通過輸入法輸出的信息,包括聊天對話、家庭地址、賬號密碼,包含大量個人用戶的信息。可以說,對于輸入法信息的管控,是數字生活以及用戶信息保護的基本功。
在此背景下,國內的訊飛輸入法就在個人信息保護上作出了一項重要舉措。他們最近推出了一套離線輸入方式,保證在不上傳用戶數據提前下,保障用戶輸入體驗。
IT之家此前也為大家報道過,訊飛輸入法最新的離線輸入方式包括完全離線的拼音、語音以及手寫輸入,可以更好地保護好用戶數據安全。
在第一次打開全新版本訊飛輸入法之前,App 就會提示用戶使用方式,包括完整體驗和基礎輸入的模式。基礎輸入在輸入時,僅使用拼音和手寫等基本打字方式,不適用拼音云、語音、翻譯和斗圖等云端輸入服務,不上傳任何個人數據。
完整體驗則可以為用戶提供準確、高效、豐富的輸入體驗,部分輸入的按鍵、文字、語音、圖片和使用場景將會上傳至云端,用于提供拼音云、語音、翻譯和拍照輸入服務。
基礎輸入模式是這次離線輸入方式新功能更新的關鍵特性之一。
如果你一開始選擇的是完整模式,則可以在訊飛輸入法 App 內的【全部設置】-【隱私設置】-【使用方式】選項中開啟基礎輸入模式。
開啟基礎輸入模式后,輸入法皮膚界面相較完整模式沒有太大的變化,只是頂部的 AI 助手功能欄消失了。
但是在使用時可以發現,基礎輸入模式下,除了基本的拼音、手寫方式外,像原來快捷翻譯輸入方式、語音輸入方式等都會提示無法使用,原來的斗圖、表情包、祝福語、拍照識別等輸入功能受限,甚至連個人賬號都無法登錄。
總之就是需要聯網的輸入功能都不能用了,需要調用攝像頭等手機內置傳感器的輸入功能也被默認關閉了,基礎輸入模式下的訊飛輸入法完全成為一款本地運行的打字工具,特別是個人賬戶不能登錄,斷除了上傳用戶數據的可能。
當開啟基礎輸入模式后,對用戶打字的效率是否有影響呢?IT之家對此做了一個小測試,分別在基礎輸入模式和完整輸入模式下輸入相同的一段文本,這段文本中包含一些人名、專業名詞等,并且語義通順,看兩者輸入的過程是否有明顯差別。
從上面的視頻可以看到,拋開小編輸入過程中的停頓、手誤,基礎輸入模式下的文字輸入過程還是十分流暢的,人名、專有的名詞等都能直接打出來,語義聯想功能也在。這說明,基礎輸入模式下,訊飛輸入法的本地詞庫還是比較豐富的,且具備一定的 AI 聯想能力,核心輸入體驗和完整模式并沒有差多少。
在基礎輸入模式下,也可以進行手寫輸入,由于是在不聯網的狀態,用戶手寫的筆跡等數據也不會被上傳到云端。
在基礎輸入模式下進行手寫,識別的準確率也是比較高的,基本上你想要的結果都會在備選框第一欄出現,而且大部分情況下都是前兩個字。
除了基礎輸入模式,本次更新的訊飛輸入法還為大家帶來了 AI 離線語音輸入的功能,大家可以在語音設置的“離線語音”項目中選擇開啟。
AI 離線語音采用最新的 AI 離線識別引擎,不用聯網,也可以對語音進行準確識別,不過目前僅支持普通話,方言和翻譯仍使用在線服務。
開啟 AI 離線語音功能后,IT之家關閉了手機的網絡連接,點擊訊飛輸入法中的語音識別按鈕,可以看到“普通話”后面多了“離線”的標識。
小編對著手機念了一段話,讓訊飛輸入法 AI 離線語音識別進行轉文字處理,能看到,無論識別的速度還是準確率可以讓人滿意,只有個別字句出現了錯誤,可用度較高。
對于 AI 離線語音,你可以選擇具體啟用的情景,訊飛輸入法提供了“網絡不佳時自動開啟”、“未連接 Wi-Fi 時開啟”和“一直開啟”三種選項,讓不同需求的人都能擁有更好的使用體驗。
根據科大訊飛的介紹,后續他們還會為訊飛輸入法帶來 OCR 識別、翻譯等 AI 功能的本地化,讓用戶在離線的安全狀態下也能獲得更好更豐富的輸入體驗。
想要保護用戶數據,最好的方法就是讓數據留在本地,讓服務盡可能地在終端側執行,不把數據交給企業。訊飛輸入法這次各種離線功能的推出,正是因為他們秉持了這種本地化的安全策略,也因而能夠持續強化用戶數據保護,不斷努力提升用戶輸入體驗,
正如文章開頭所說,輸入法作為互聯網世界以及人機交互的基礎應用,應該在用戶隱私安全方面有著非常高的等級,但現實是輸入法的隱私安全問題往往容易被人們忽略。
訊飛輸入法這次在離線化能力上的更新,IT之家見到的第一個真正開始重視用戶數據安全的舉措,這有著特殊的意義。
首先,就是訊飛輸入法可以為用戶營造更加放心、安全的輸入使用體驗。無論是日常用手機輸入文檔,還是聊天、記筆記或者在網絡上發表評論,只要開啟基礎輸入模式,由于數據不會上傳云端,你都不用擔心自己輸入的相關信息會被其他任何人知道,也可以放心地用 AI 離線語音進行快捷輸入,你的聲音信息也只會保留在自己的終端上,這樣的安全體驗會讓我們在互聯網上更加從容自如。
并且即便是在基礎輸入模式下,訊飛輸入法也匹配了表情和顏文字的輸入,只要輸入相關中字,就可以自動匹配 emoji 表情,不用打開表情框睜大眼睛去找,大大提升基礎模式下的聊天效率。
其二,我們知道,訊飛輸入法的核心競爭力是圍繞“AI 交互”打造的一系列輸入體驗,像語音識別輸入、手寫輸入、實時翻譯輸入、拍照輸入等等,都需要強大的 AI 運算支持。而 AI 功能的實現,是需要海量數據支撐的,比如語音識別輸入,數據越豐富,識別的精準度就越高。
因此,用戶數據保護與訊飛輸入法主打的 AI 交互體驗是相輔相成的。想讓輸入法的 AI 輸入體驗更好,就必須將用戶數據保護好。而本次離線化輸入能力的更新,有助于訊飛輸入法進一步發揮 AI 方面的優勢,帶來更智慧化的輸入體驗。
其三,訊飛輸入法 AI 技術的本地化為整個行業的個人信息保護提供了良好的范本。其實不僅是輸入法,未來 AI 技術的應用將會越來越廣泛,海量數據的使用也不可避免,關鍵在于如何使用,在哪里使用。
而訊飛輸入法將與用戶相關的 AI 運算都落在終端側,數據的使用、留存也保持在本地。不上傳云端,就可以極大程度地避免數據泄露的風險,既能提升用戶體驗,也可以保護用戶的數據安全,是一種兩全的方案,也有望成為全行業數據保護的趨勢。
這次離線化輸入功能的升級進一步完善了訊飛輸入法的使用體驗,讓用戶可以更加放心、安心地在網上購物、聊天等等。而訊飛輸入法除了更“安全”之外,也更“好用”,這是其一直以來的優勢。
剛才我們說過,訊飛輸入法的核心競爭力在于強大的 AI 技術帶來的便捷化輸入體驗,例如語音輸入準確,支持拍照輸入等等。
在語音輸入中有一項比較考驗 AI 技術的功能,就是實時翻譯功能。訊飛輸入法的實時翻譯不僅是文字的實時翻譯,更可實現語音的實時識別、翻譯再轉文字,非常強大。
IT之家為大家測試了這個功能,小編對著輸入法連續朗讀一段話,讓訊飛輸入法把這段話從中文翻譯成英文。從結果可以看到,雖然信息相對密集,但訊飛輸入法仍然很好地將小編說的話翻譯并轉文字呈現在便簽上,從語法上看,也挑不出太多毛病。
如果你是和國外的小伙伴聊天,這會大大提升你的效率。
還有拍照識別輸入功能也挺實用,在輸入法的功能主界面找到“拍照輸入”,訊飛輸入法就會調起攝像頭,拍照后選擇要識別的區域,輸入法便會將該區域中的文字識別出來。有了這個功能,你再也不需要下載第三方的掃描軟件了,直接在輸入法中掃描,識別出來后直接輸出,省卻了好多步驟。
除了 AI 技術帶來的便捷化輸入體驗,訊飛輸入法還有很多輔助功能,可以讓你的輸入體驗更加有趣、實用。
比如小編特別喜歡的裝逼神器功能,在這里你可以一鍵生成各種用于裝逼的模板,比如做一張支付寶余額的,可以一鍵生成任意余額數目的支付寶截圖。當你和小伙伴們進入“沙雕模式”時,這個功能非常好用。所以,小編的朋友圈素材每天都安排得妥妥的。
另外值得一提的是,訊飛輸入法還針對老年人使用輸入法的痛點做了適老化改造,擁有專門的長輩模式。在長輩模式下,輸入法界面變得更簡單,圖標、字體都變大,配色對比度變高,且溫和不刺眼,方便老年人觀看。
另外,長輩模式下對手寫輸入和語音輸入都進行了優化改造,手寫識別更準確,且支持疊字連寫,語音輸入則延續了微信發消息的習慣,可長按空格鍵開啟語音輸入,并且支持 23 種方言語音,支持一邊打字一邊朗讀播報,相當于有個小助手在幫長輩時刻檢查輸入的文字。
在長輩模式下,訊飛輸入法的表情入口還集成了老年人常用的表情包,更有內置的祝福語功能,讓長輩們可以通過輸入法輕松地表達情緒。
此外,訊飛輸入法還支持無障礙模式。以小編手上的手機來說,在系統設置的“無障礙”選項中開啟 TalkBack 屏幕閱讀服務。該服務開啟后,訊飛輸入法就會提供語音反饋。
在語音指示下開啟無障礙模式后,訊飛輸入法的輸入面板、菜單面板以及表情面板的屏幕即可隨選朗讀,即便視力不便情況也能打字,待語音輸入完成后輸入法會自動朗讀,用戶便可得知輸入結果是否準確,并且進行修改。
在無障礙模式下的功能子菜單中,用戶也都可以選擇然后進行屏幕朗讀,輸入框、按鈕、滑塊等等都做了適配,大大方便了視障人群的使用。
而且訊飛輸入法的無障礙功能還支持 QQ、微信中一鍵發送表情,即在訊飛輸入法中選擇了斗圖表情后,點按一下,便可以直接發送給當前的好友,免去中間跳轉好友列表、選擇好友的操作,在語音朗讀的情況下,這可以大幅提升視障人群的操作效率,讓視障人群也能通過表情訴說他們的情緒。
在日常玩機的經歷中,IT之家很少看到像訊飛輸入法一樣擁有非常完善功能的輸入類產品。這些豐富的功能構成了訊飛輸入法出色的綜合體驗,并且在使用的時候不會讓你有臃腫感,因為基本每一項功能都是從用戶實際使用的需求出發,為更好的體驗而服務。
作為一款綜合體驗十分強大的輸入法產品,當他將用戶數據安全保護的關鍵屬性補全、并且是在行業內率先做到時,訊飛輸入法可以說真正為用戶考慮更多的輸入法產品。
隨著互聯網發展越來越深入,萬物互聯的時代即將到來,海量智能終端入網,勢必引起人們對個人信息安全保護問題的空前關注,而訊飛輸入法在此之前,已經吹響了數據安全保護的號角,為整個行業做好了典范,相信在此作用下,我們會迎來一個更加安全、可靠的互聯網環境。
文/陳墨 編輯/尹哲)7月16日,訊飛輸入法新版上線,推出離線輸入方式,包括完全離線的拼音、語音以及手寫輸入。
據了解,《信息安全技術移動互聯網應用(App)收集個人信息基本規范》中規定,輸入法類應用程序是為用戶提供鍵盤、手寫、語音等方式輸入字符功能的服務,該服務類型必須遵循知情同意和最小必要原則,明確無須個人信息即可使用基本服務功能。
科大訊飛方面對觀察者網表示,基本規范的實施只是一場歷史性變革的局部,接下來,把個人數據的控制權交給用戶,將會成為互聯網App的主流趨勢。
科大訊飛提到,訊飛輸入法新版通過將AI能力“離線化”,讓輸入法不僅擁有智能化的功能體驗,而且對于用戶數據安全問題也提出一個很好的解決方案。
以離線語音輸入為例,訊飛輸入法升級AI語音識別模型,在不聯網的環境下,無云端數據傳輸,通過手機本地解碼就能為用戶提供轉文字服務,可以滿足在任何場景下進行語音輸入的需求。
用戶可以通過設置自主選擇啟用或停用離線語音輸入。除此之外,訊飛輸入法的手寫和拼音輸入也同樣實現“離線化”,用戶打字數據不會被傳到互聯網上。
后續,訊飛輸入法將對OCR識別、智能翻譯等更多AI功能進行廣泛的“本地化”。
值得一提的是,訊飛輸入法新版還推出“基礎輸入”模式,該模式下不上傳任何數據也能輸入。如果想獲得更多元的輸入體驗,用戶可以設置開啟完整體驗(【全部設置】-【隱私設置】-【使用方式】)。
科大訊飛方面稱,對于“完整體驗”的設計,訊飛輸入法進行嚴格把關,清晰列出系統權限使用說明。在這一舉措下,訊飛輸入法變得更加“透明”、“可控”,方便用戶安心使用。
“有理由相信,隨著訊飛輸入法離線功能的不斷增強,輸入法用戶的個人數據將得到進一步保護。從行業角度看,訊飛輸入法積極運用AI在數據安全和用戶體驗上的探索實踐,有力推動整個行業在合規利用數據、保護數據安全方面的良性發展”。
6月11日,科大訊飛盤中閃崩,接近跌停,最終收盤跌幅超6%。
對于網傳“訊飛輸入法因違法收集非業務相關用戶信息,被各大App應用商店下線”一事,科大訊飛隨后向觀察者網回應稱:“訊飛輸入法App因未完全滿足5月1日國家網信辦關于個人信息收集違規問題通報的整改要求被應用商店下架”。
另外,科大訊飛內部人士透露,截至6月11日,訊飛輸入法App已完成整改,正在配合相關部門檢測,確保合規后重新上架。
截至7月16日午間休盤,科大訊飛市值報1410億元,較6月11日累計上漲6%。