據(jù)了解,針對春節(jié)后招聘市場旺季,58同城啟動“快找好工作”招聘季活動,重點服務(wù)于中基層招聘市場,以企業(yè)反饋信息快、名企入駐等特點,打通平臺服務(wù)雙方,提供垂直精準化服務(wù),同時充分利用平臺規(guī)模及移動端的優(yōu)勢為中基層勞動者提供更多求職選擇。針對今年招聘季活動呈現(xiàn)的上述新特點,58同城招聘平臺相關(guān)負責(zé)人解釋到,“隨著國內(nèi)經(jīng)濟的快速發(fā)展和中基層招聘市場的龐大需求空間以及移動互聯(lián)網(wǎng)的快速滲透,國內(nèi)招聘求職市場也在不斷呈現(xiàn)新的特征和需求,最明顯的就是通過移動端招聘的企業(yè)和求職的個人都在大量增長。“
58同城數(shù)據(jù)顯示,此次招聘季活動求職者累計投遞簡歷超2.1億次,其中移動端投遞占比達57%。累計新增簡歷超過2700萬,其中移動端占比43%。而在企業(yè)方面,參與此次招聘季的企業(yè)累計達2676萬,通過58同城移動端58幫幫招聘人才的企業(yè)占比達到51%。同時創(chuàng)造了24小時內(nèi),累計有3億4千萬人次收到企業(yè)的面試反饋的新高峰。
“還有一個數(shù)據(jù)可以看出移動端招聘求職的優(yōu)勢“,上述負責(zé)人介紹,”招聘季活動期間,求職者投遞簡歷后接到企業(yè)反饋的最短時間為1分鐘,是1家企業(yè)通過58幫幫確認并對求職者發(fā)出了面試邀約。58幫幫是58同城方面開發(fā)的一款主要服務(wù)于中小型企業(yè)的移動招聘應(yīng)用,58幫幫招聘版聚焦于小微企業(yè)招聘最大痛點——招聘效果和效率,基于幫幫APP,為國內(nèi)4千萬小微招聘方構(gòu)建了一套與全新、極簡而高效的招聘模式。應(yīng)用大數(shù)據(jù)匹配推薦、跨平臺實時免費邀約體系,使小微企業(yè)和求職者連接成本大幅降低,溝通效率得到大幅提升“。
每逢“金三銀四”到來時,招聘市場就會迅速升溫,傳統(tǒng)線下一場場的招聘會輪番進行的同時,越來越多的求職者和企業(yè)開始把戰(zhàn)場延長到線上。從58同城招聘季的數(shù)據(jù)可以看出,相比往年,越來越多的求職者和雇主對互聯(lián)網(wǎng)求職,尤其是移動端招聘的青睞愈發(fā)明顯,移動端招聘已經(jīng)漸成招聘求職“主戰(zhàn)場“。行業(yè)人士指出,在移動互聯(lián)網(wǎng)浪潮席卷下,手機在人們?nèi)粘I钪邪l(fā)揮的作用越來越大,占據(jù)的時間也越來越多,得移動端者得天下。互聯(lián)網(wǎng)思維所引發(fā)的行業(yè)人人自危形勢下,引領(lǐng)招聘行業(yè)的下一個風(fēng)口或許就是移動端招聘。
張張漂亮的照片,顯示著房屋干凈整潔,看著就想住進去。不過,令人失望的是,這些照片或許是虛假的。
11月1日至2日,紅星資本局親測發(fā)現(xiàn),在58旗下的58同城、趕集網(wǎng)和安居客平臺上就出現(xiàn)了上述虛假信息。其中包括:平臺上的租房照片與現(xiàn)實租房不符、租房信息為杜撰信息。對此,有租房經(jīng)紀人解釋稱:這樣做是為了吸引客源。
記者親測:照片是假的,房源還不存在
“您好,請問您在58同城上發(fā)布的位于猛追灣附近的1室1廳1衛(wèi)的房子出租了沒?”“還沒有!不過,你看到網(wǎng)上的照片是假的哦!”……11月1日上午,當紅星資本局以租客的身份,撥打了一位租房經(jīng)紀人電話后出現(xiàn)了上述對話。無獨有偶,紅星資本局隨即撥打的4名租房經(jīng)紀人電話后發(fā)現(xiàn),有3個自稱網(wǎng)上的租房圖片為虛假的。
與此同時,紅星資本局在趕集網(wǎng)、安居客上撥打租房經(jīng)紀人電話證實,也有上述問題存在。
一位在趕集網(wǎng)上發(fā)布信息的租房經(jīng)紀人告訴紅星資本局,“你所說的那套房源根本不存在。”該經(jīng)紀人稱,在猛追灣附近想找1室1廳1衛(wèi)的房子、價格在500元左右,幾乎很難。“一環(huán)路內(nèi)這樣的房子,價格基本上在1500元/月左右。”
除了使用假照片外,租房價格也有不符。11月2日上午,當紅星資本局在趕集網(wǎng)上看到一間位于猛追小區(qū)的房屋時,隨即撥打了該房屋的租房經(jīng)紀人電話。無語的是,該經(jīng)紀人在電話里聲明,網(wǎng)上公布的租房價格有變,以前的價格為500元/月,現(xiàn)在漲到750元/月。
經(jīng)紀人:為了引流,租房業(yè)務(wù)壓力大
那么,線上的租房圖片與現(xiàn)實中的圖片差距到底有多大呢?
11月2日中午,紅星資本局與一位華筑萬家的租房經(jīng)紀人約定,一起來到了猛追灣街60號1棟附1號三單元的一間出租房內(nèi)。從網(wǎng)上的照片來看,房屋寬敞明亮、干凈整潔、陽光充足,還有大床等家具。不過,當紅星資本局卻發(fā)現(xiàn),在不足100平米的房間內(nèi)共有四個單間,其中三間已經(jīng)出租,但沒有上述圖片中那么漂亮,更沒有圖片中的場景。
58同城上虛假圖片房源的實景圖
對于如此大的差距,該經(jīng)紀人稱,盡管實景中的房屋也很好,但如果將其圖片上傳至租房平臺,點擊量肯定不會很高,也不會吸引客流。該經(jīng)紀人補充道,為了吸引客流,他們在發(fā)布信息時,除了講究文字的描述外,圖片也會挑選比較精美的,有時選擇的圖片會與實景中的房源無關(guān)。
隨后,該經(jīng)紀人還給紅星資本局發(fā)來了在平臺上發(fā)布的與上述房源無關(guān)的照片。在署名為“朗御”的文件中,紅星資本局發(fā)現(xiàn),在平臺上發(fā)布的8張租房圖片,竟然全部來自于該文件。紅星資本局查閱發(fā)現(xiàn),朗御毗鄰成都市大慈寺附近,是新嘉置地在成都的開山之作。
對于該文件來自哪里、使用其照片是否得到授權(quán)、是否有欺騙消費者等問題,該經(jīng)紀人并未給予回復(fù)。
另外,一位從事了10多年的租房經(jīng)紀人告訴紅星資本局,此類現(xiàn)象其實已經(jīng)存在多年。“基本上是小公司的經(jīng)紀人在這樣操作。”對于其原因,該經(jīng)紀人分析認為,主要是房屋租賃業(yè)務(wù)壓力大所致。“他們由于沒有自身影響力、知名度和品牌力等因素,租房業(yè)務(wù)本來就不好,如果不作假就更難了。”
平臺回應(yīng):發(fā)現(xiàn)請舉報,會定期抽檢
對此,58同城一位工作人員在接受紅星資本局采訪時表示,“我們平臺只是提供租房信息,定期會對信息進行抽檢。一旦發(fā)現(xiàn)不合格或者虛假的就會刪除信息,嚴重者會封掉信息發(fā)布者的賬號。”
隨后,該工作人員還給紅星資本局發(fā)來的房源抽檢應(yīng)檢文件中看到,為了保障房源的真實性,平臺會不定期對房源進行抽檢,被抽檢到的房源,經(jīng)紀人需應(yīng)檢。從抽檢應(yīng)檢整體流程來看,主要有平臺抽檢、通知經(jīng)紀人應(yīng)檢、經(jīng)紀人響應(yīng)應(yīng)檢、迎檢成功等。“應(yīng)檢失敗或者超時未應(yīng)檢的,房源下架并記一次嚴重警告。”
與此同時,紅星資本局以租客身份,將上述信息反映給趕集網(wǎng)在線客服時,該客服回復(fù)稱:如發(fā)現(xiàn)信息存在虛假行為,可在產(chǎn)品頁面上舉報,審核人員收到投訴信息后會盡快核實,并針對舉報信息進行相關(guān)處理。
律師分析:主要責(zé)任在經(jīng)紀機構(gòu),平臺承擔(dān)連帶責(zé)任
對此,泰和泰律師事務(wù)所程穎律師向紅星資本局分析認為,從發(fā)布主體來看,房地產(chǎn)經(jīng)紀人發(fā)布的信息是虛假的,就會違反多個法律法規(guī)的規(guī)定:
第一、涉嫌違反消保法的相關(guān)規(guī)定,涉及到欺詐。根據(jù)規(guī)定,對發(fā)布商品服務(wù)或者因人誤解的信息,相關(guān)的責(zé)任人及單位將會分別受到罰款和吊銷營業(yè)執(zhí)照的處罰。
第二、涉嫌違反廣告法,涉及虛假宣傳。根據(jù)規(guī)定,商品或者服務(wù)不存在的廣告為虛假廣告。發(fā)布虛假廣告的,處廣告費的3倍以上5倍以下罰款;如果廣告費偏低或者無法計算,則給予20萬以上100萬罰款;嚴重者吊銷營業(yè)執(zhí)照。
第三、涉嫌違反《房地產(chǎn)經(jīng)紀管理辦法》。據(jù)介紹,房地產(chǎn)經(jīng)紀機構(gòu)和人員不得有隱瞞、欺詐等不正當手段招攬業(yè)務(wù)。“如果存在上述行為,機構(gòu)和從業(yè)人員均有處罰。”其中,房地產(chǎn)經(jīng)紀人員處以1萬元罰款,機構(gòu)將取消網(wǎng)簽資格和3萬元罰款。
另外,四川華敏律師事務(wù)所鄭逢生律師還認為,平臺涉嫌違反《電子商務(wù)法》的相關(guān)規(guī)定。“電子商務(wù)經(jīng)營者應(yīng)當全面、真實、準確、及時地披露商品或者服務(wù)信息,保障消費者的知情權(quán)和選擇權(quán)。電子商務(wù)經(jīng)營者不得以虛構(gòu)交易、編造用戶評價等方式進行虛假或者引人誤解的商業(yè)宣傳,欺騙、誤導(dǎo)消費者。”鄭律師稱。
不過,到底是由經(jīng)紀人和機構(gòu)承擔(dān)的問題,程穎認為應(yīng)由經(jīng)紀機構(gòu)來承擔(dān)。“這是一種典型的職務(wù)行為,應(yīng)由經(jīng)紀機構(gòu)而不是經(jīng)紀人員工來承擔(dān),畢竟經(jīng)紀人不能以個人身份從業(yè)。”不過,程穎稱,經(jīng)紀人本身也不是完全無責(zé)。
另外,程穎指出,平臺本身的職責(zé)是發(fā)布信息,但平臺上有虛假信息,平臺會承擔(dān)一定的監(jiān)管責(zé)任。“如果平臺發(fā)布的信息比較海量,同時平臺采取了一定合理的監(jiān)管措施,并收到投訴后對相關(guān)的信息進行了及時處理,那么,平臺就不會承擔(dān)相關(guān)的責(zé)任。但如果收到投訴后沒有及時處理,造成擴大損失,就會受到相應(yīng)的連帶責(zé)任。“程穎說。
那么,如果消費者面臨這種情況又該怎么辦呢?對此,程穎建議:第一、可以找相關(guān)的行政職能部門解決;第二、可以通過消協(xié)進行調(diào)解;第三、可以通過起訴等司法程序維權(quán)。鄭逢生也提醒,消費者租房時一定要實地查看;提高辨別能力、時刻保持警惕,切勿因“價格便宜、照片漂亮”等外在因素而上當受騙。
負面纏身:神奇網(wǎng)站,不再神奇
對于58同城,或許更多的人是從“這是一個神奇的網(wǎng)站”廣告語知曉。
紅星資本局從多個業(yè)內(nèi)人士獲悉,58同城、趕集網(wǎng)和安居客均為58旗下平臺。“他們是三網(wǎng)統(tǒng)一、一家公司。”一位業(yè)內(nèi)人士稱。根據(jù)媒體報道,早在2015年4月時,58同城與趕集網(wǎng)合并。同時,2016年10月,58同城、趕集網(wǎng)、安居客房產(chǎn)實現(xiàn)一號通融。即:房產(chǎn)經(jīng)紀人只需一個賬號,即可管理58同城、趕集網(wǎng)、安居客三個房產(chǎn)平臺,實現(xiàn)三個網(wǎng)站的經(jīng)紀人移動APP統(tǒng)一、PC后臺統(tǒng)一、用戶管理統(tǒng)一。
包括房產(chǎn)、招聘、家政、旅行、教育、二手物品買賣、汽車生活服務(wù)在內(nèi),58同城雖然涉及業(yè)務(wù)越來越多,但始終被虛假信息所纏繞。
2018年,58同城因為發(fā)布違規(guī)房源,多次被北京市住建委點名批評和整改。財新發(fā)布也曾報道,有詐騙公司在58同城上發(fā)布大量虛假信息,致千人受騙,涉嫌詐騙金額超過數(shù)百萬元;更有媒體曾暗訪發(fā)現(xiàn),在58同城上,一家已通過“企業(yè)認證”的spa商家,提供的居然是色情交易。甚至,還有媒體通過12309中國檢察網(wǎng)搜索發(fā)現(xiàn),一年內(nèi),通過58同城平臺發(fā)布虛假信息的詐騙案件近500條,其中包括發(fā)布虛假售賣信息騙錢、發(fā)布虛假招工信息騙錢、發(fā)布虛假租房信息騙錢等。
天眼查APP顯示,58同城注冊于2005年,所屬公司為北京五八信息技術(shù)有限公司,法人代表為姚勁波,其企業(yè)業(yè)務(wù)包括58同城速聘、58車商通、招才貓、58幫幫、酷車網(wǎng)。
紅星新聞記者 李偉銘 李晨 實習(xí)生 陳曦
編輯 白兆鵬
部分圖由記者拍攝
(下載紅星新聞,報料有獎!)
文根據(jù)58同城AI Lab負責(zé)人詹坤林在2018年DataFunTalk人工智能技術(shù)沙龍所分享的《五八同城智能客服系統(tǒng)“幫幫”技術(shù)揭秘》編輯整理而成,在未改變原意的基礎(chǔ)上稍做整理。
導(dǎo)讀:58同城提供租房、二手房、找工作、二手車、黃頁等信息,這些業(yè)務(wù)分布于房產(chǎn)、招聘、二手車、黃頁等不同業(yè)務(wù)部門,不同業(yè)務(wù)部門都有各自獨立的客服團隊,我們的目標是設(shè)計一套通用的智能客服平臺來解決所有客服問題,以提高客服效率。
今天的分享將從以下幾個方面展開:首先介紹智能客服的背景,然后介紹總體技術(shù)架構(gòu)、算法和工程架構(gòu),最后做一下總結(jié)。主要想通過這次分享使大家了解到智能客服系統(tǒng)中的技術(shù)全貌,希望對大家有些啟發(fā)。
01
智能客服的背景
傳統(tǒng)客服工作模式包括客服網(wǎng)站和電話客服兩種:
(1)公司提供一個客服網(wǎng)站給用戶,用戶通過網(wǎng)站提交問題反饋,這些反饋信息會通過一個系統(tǒng)展示給客服人員,客服人員每天逐個解決這些問題,解決后通過站內(nèi)信或者短信回復(fù)用戶。這種模式下,用戶在客服網(wǎng)站上的操作往往較繁瑣,并且問題解決流程周期長,可能會耗時數(shù)小時甚至數(shù)天,用戶體驗差。
(2)公司提供一個客服電話給用戶,用戶通過電話咨詢客服。這種模式盡管直接,但是可能存在問題描述不清、溝通成本高的問題,例如客服在解決某個問題時往往需要用戶提供額外信息,一通電話會持續(xù)較長時間。一般一個客服每天能完成60-80個電話的接線,服務(wù)效率較低,而且客服人力成本高。
大部分客服問題其實是高頻重復(fù)問題,這些問題往往都有標準的答案,這可以利用機器去解決,可以構(gòu)建一套智能問答系統(tǒng)去自動回答用戶的提問,當用戶對答案不滿意時,他可以再尋求人工客服的幫助。這種機器自動問答和人工客服輔助的模式下,大部分客服問題通過機器解決了,只有少部分機器解決不了的復(fù)雜問題才會由人工客服來解決,這不僅提升了用戶體驗也提高了客服人員的人效。
58同城舊有客服體系就是通過客服網(wǎng)站和客服電話來提供客服服務(wù),我們需要重塑這種模式,構(gòu)建一套新的客服體系。在新的客服體系下,用戶所有的客服咨詢首先都會經(jīng)過智能客服系統(tǒng)“幫幫”,由“幫幫”來自動回答用戶的問題,若用戶對答案不滿意,他可以轉(zhuǎn)接人工客服。人工客服包括舊有的電話客服和新設(shè)計的IM(即時通訊)在線客服,IM在線客服是指通過IM聊天的方式提供客服服務(wù),用戶可以和客服人員通過聊天窗口直接一對一進行溝通,智能客服和IM在線客服會無縫整合在同一個聊天窗口中。轉(zhuǎn)接人工客服時我們會首先轉(zhuǎn)接到IM在線客服上,若用戶仍不滿意才會通過電話的方式解決問題。新的客服體系下,用戶可以獲取到業(yè)務(wù)咨詢、投訴建議、產(chǎn)品反饋、閑聊以及工單處理等客服服務(wù)。
這種新的客服模式相比舊有模式的優(yōu)點有:
(1)用戶體驗好。傳統(tǒng)客服網(wǎng)站的方式用戶獲取答案周期長,這是因為客服人員需要手動解答客服網(wǎng)站上收集的每個用戶問題,由于每日問題量大而且客服人員數(shù)量有限,大部分用戶的問題不能即時得到解答。新的模式下用戶可以通過IM聊天窗口咨詢問題并即時獲取答案,簡單高效。
(2)客服人效高。“幫幫”能夠自動回答大部分問題,人工客服只需要利用IM在線客服聊天工具去解答少部分復(fù)雜問題,機器和人工處理問題的比例大約是8:2。每個IM客服人員一天大約能處理120-150個用戶的咨詢,這遠比電話客服每天處理60-80個用戶的咨詢要高,因此我們會盡量讓用戶咨詢先流轉(zhuǎn)至IM在線客服,只有最復(fù)雜的問題才會流轉(zhuǎn)至電話客服。通過這種智能客服到IM在線客服再到電話客服的方式,我們可以利用有限的客服人員處理更多的用戶咨詢。
--
02
幫幫智能客服系統(tǒng)
“幫幫”智能客服系統(tǒng)是一套基于深度學(xué)習(xí)和自然語言理解技術(shù)實現(xiàn)的自動問答對話機器人,產(chǎn)品界面如圖所示,用戶通過聊天窗口的形式和“幫幫”進行對話。對話機器人一般分為業(yè)務(wù)咨詢類、任務(wù)類和閑聊類三種,“幫幫”也支持這三種功能:
最主要的是提供業(yè)務(wù)咨詢功能,幫助用戶解決業(yè)務(wù)類問題;其次支持任務(wù)類型的回答,用戶可以實現(xiàn)查詢帖子被刪除原因、注銷賬號等任務(wù);此外,為豐富“幫幫”的功能,也支持閑聊功能,用戶可以在聊天窗口與機器人寒暄閑聊。
“幫幫”整體技術(shù)架構(gòu)如圖所示,包括基礎(chǔ)服務(wù)層、應(yīng)用服務(wù)層、編輯運營層、接入層以及在線客服系統(tǒng)。
基礎(chǔ)服務(wù)層提供對話系統(tǒng)的基礎(chǔ)技術(shù)能力,系統(tǒng)需要對用戶輸入的一段語句進行理解,這里需要自然語言理解模塊,對語句進行分詞、詞性標注、實體識別、關(guān)鍵詞抽取和句法分析等;同時需要識別用戶的意圖,包括通用意圖和業(yè)務(wù)意圖,通用意圖是指用戶是來做業(yè)務(wù)咨詢還是閑聊,業(yè)務(wù)意圖是指若用戶是做業(yè)務(wù)咨詢,具體咨詢什么業(yè)務(wù),這里會使用文本分類的技術(shù)去識別用戶意圖。
基礎(chǔ)服務(wù)之上是應(yīng)用服務(wù)層,這一層具體實現(xiàn)了KB-Bot基于問答知識庫的機器人、Task-Bot任務(wù)對話型機器和Chat-Bot閑聊類型機器人,這是“幫幫”系統(tǒng)的三種核心能力。編輯運營層是指有一個編輯團隊支撐著“幫幫”的算法策略迭代,主要完成數(shù)據(jù)標注、問答運營、數(shù)據(jù)分析和效果評估的工作,這些工作輸出會作用到基礎(chǔ)服務(wù)層和應(yīng)用服務(wù)層。基于應(yīng)用服務(wù)層,對外提供通用的接口服務(wù)以便于業(yè)務(wù)方接入,我們支持Android、iOS和web端的接入。此外,機器不是萬能的,用戶有很多復(fù)雜的問題仍需要人工解決,這里有一套在線客服系統(tǒng)提供了人工在線客服的能力,應(yīng)用服務(wù)層會和這套在線客服系統(tǒng)做無縫對接。
“幫幫”系統(tǒng)的核心是提供KB-Bot、Task-Bot和Chat-Bot三種能力,下面分別介紹下這里使用到的技術(shù)。
KB-Bot是指基于問答知識庫的對話機器人,它主要實現(xiàn)了“幫幫”最重要的能力——提供業(yè)務(wù)咨詢類服務(wù)。
58的用戶使用幫幫主要是來進行業(yè)務(wù)咨詢,例如詢問賬號為何被鎖、帖子為何被刪、如何購買帖子置頂服務(wù)等等。業(yè)務(wù)咨詢類的回答需要基于問答知識庫來實現(xiàn),這里的問答知識庫是一個包含眾多問答對的數(shù)據(jù)集。我們將問題劃分為標準問題和擴展問題,例如“為什么刪除我的帖子”這個是一個標準問題,語句表達很標準,它會有一個標準答案,其近似的問法我們稱之為擴展問題,例如“為什么刪我貼”、“告訴我為啥刪帖”等,這些都表達的是一個意思,這些問題同樣對應(yīng)的是相同的標準答案。有了問答知識庫,用戶來詢問時就是一個問題匹配的過程了,只需要將用戶輸入的問題和知識庫中的問題做匹配,得到意思最相近的那條問題,然后將對應(yīng)的答案返回給用戶,這就完成了一次問答操作。問答知識庫的構(gòu)建非常關(guān)鍵,這里會首先對客服團隊歷史積累的問題數(shù)據(jù)進行抽象,形成標準問題,然后結(jié)合算法和標注對標準問題做擴展,形成初始問答知識庫,在系統(tǒng)上線后,對新產(chǎn)生的數(shù)據(jù)又會進行挖掘,不斷擴充知識庫。
基于知識庫的問答可以使用檢索或者分類模型來實現(xiàn)。
檢索式回答的流程是:首先對用戶的輸入問題做處理,如分詞、抽取關(guān)鍵詞、同義詞擴展、計算句子向量等;然后基于處理結(jié)果在知識庫中做檢索匹配,例如利用BM25、TF-IDF或者向量相似度等匹配出一個問題集合,這類似推薦系統(tǒng)中的召回過程;由于我們是一個問答系統(tǒng),最終是直接返回給用戶一個答案,因此需要從問題集合中挑出最相似的那個問題,這里會對問題集合做重排序,例如利用規(guī)則、機器學(xué)習(xí)或者深度學(xué)習(xí)模型做排序,每個問題會被打上一個分值,最終挑選出top1,將這個問題對應(yīng)的答案返回給用戶,這就完成了一次對話流程。在實際應(yīng)用中,我們還會設(shè)置閾值來保證回答的準確性,若最終每個問題的得分低于閾值,會將頭部的幾個問題以列表的形式返回給用戶,最終用戶可以選擇他想問的問題,進而得到具體的答案。
這里還可以使用分類模型來實現(xiàn)問答,一個標準問題有多種擴展問法,每個標準問題可以看做是一個分類,將用戶的輸入映射到標準問題上即可完成回答,因此可以將問答看做是一個大規(guī)模短文本分類的問題。我們采用了多特征、多模型、多分類結(jié)果融合的方式來完成短文本分類,在特征層嘗試使用了單字、詞、詞性、詞語屬性等多種特征,在模型層應(yīng)用了FastText、TextCNN和Bi-LSTM等模型,各模型的結(jié)果輸出最終會做融合得到最終分類結(jié)果。
Task-Bot任務(wù)型機器人是在特定條件下提供服務(wù),為了滿足帶有明確目的的用戶,例如查天氣、查物流、訂機票等任務(wù)型場景。用戶的需求一般較復(fù)雜,通常需要機器人和用戶做多輪互動以幫助用戶明確目的。我們實現(xiàn)了一個標準的多輪會話系統(tǒng),首先自然語言理解模塊會識別出當前輸入問題的意圖和槽位,然后輸入到對話管理器去決定下一步的回答動作,最終再通過自然語言生成模塊生成答案返回給用戶。
這是一個具體的應(yīng)用實例,用戶輸入“為啥刪我貼”,經(jīng)過自然語言理解處理后,意圖識別模塊會將其識別為任務(wù)類型的服務(wù),用戶是想詢問刪除帖子的原因,通常情況下問答系統(tǒng)會反問用戶,要求用戶提供帖子ID才能查詢,這里我們通過另一種設(shè)計來完成:首先調(diào)用發(fā)布中心接口拉取用戶已發(fā)布的貼子列表展示給用戶,讓用戶去自主選擇相應(yīng)的帖子,用戶點擊具體帖子之后,帖子ID會傳遞給問答系統(tǒng),問答系統(tǒng)會再調(diào)用相關(guān)接口查詢到帖子刪除原因返回給用戶。這一整套流程是用戶的自助查詢過程,相比以往用戶需要查詢自己的帖子ID給客服人員,客服人員登錄相關(guān)系統(tǒng)并輸入貼子ID查詢結(jié)果要高效很多。
閑聊服務(wù)是基于一個閑聊語料庫,采用模板匹配、檢索式回答以及生成式對話等多種技術(shù)來實現(xiàn)的。模板匹配使用了AIML和正則表達式匹配;檢索式回答類似KB-Bot中的方式首先檢索然后利用模型排序;當模板匹配和檢索式回答都不能給出閑聊回答時,我們會采用SeqSeq生成式對話,我們使用了一個標準的Seq2Seq模型,問題會首先輸入到一個雙向LSTM編碼器,然后加入Attention機制,最終使用一個單層LSTM做解碼,從而得到結(jié)果輸出。生成式對話往往會生成一些讓人難以理解的答案,這也是業(yè)界難以解決的問題。
當“幫幫”給出的答案用戶不滿意時,用戶會尋求人工服務(wù)。“幫幫”支持人工在線客服的無縫轉(zhuǎn)接,用戶只需在聊天窗口一鍵點擊按鈕便能連接到IM人工在線客服,實現(xiàn)一對一聊天。在轉(zhuǎn)接人工客服成功后,人工客服會在客服工作臺中通過一個類似微信的聊天窗口和用戶溝通。雖然用戶在前端操作簡單,其實后面是有一套功能復(fù)雜的在線客服系統(tǒng)在支撐。
在線客服系統(tǒng)是用戶和客服人員溝通的橋梁,在58業(yè)務(wù)場景下,它支持多個業(yè)務(wù)部門的不同客服團隊注冊使用,不同客服團隊可以管理自己的客服人員。當用戶在智能客服窗口點擊轉(zhuǎn)接人工客服按鈕時,智能客服會識別出用戶轉(zhuǎn)向的目標客服團隊,在線客服會分配一名客服人員和用戶進行溝通。在線客服系統(tǒng)支持用戶排隊功能,當同時轉(zhuǎn)接人工客服的用戶較多而客服人員人力有限時,用戶便會進入等待隊列。智能客服識別用戶業(yè)務(wù)意圖往往存在一定錯誤率,有時候客服人員在和用戶溝通一段時間后會發(fā)現(xiàn)用戶的業(yè)務(wù)問題需要其他客服團隊來解決,此時客服人員會將會話轉(zhuǎn)交給其他業(yè)務(wù)團隊,因此在線客服系統(tǒng)還需支持會話流轉(zhuǎn)的功能。此外,溝通過程中的數(shù)據(jù)是非常重要的,例如可以根據(jù)人工的溝通記錄去優(yōu)化自動問答的答案,因此數(shù)據(jù)監(jiān)控也是必須必備的功能。
智能客服系統(tǒng)需要有一個完備的評價體系去評價它的好壞,在我們的評價體系中有基于人工標注的評價和基于用戶反饋的評價兩種方式:
(1)基于人工標注的評價
“幫幫”能夠自動回答業(yè)務(wù)咨詢、任務(wù)和閑聊類型的回答,業(yè)務(wù)咨詢類是基于問答知識庫來回答的,系統(tǒng)的回答能力受限于知識庫的豐富程度,因此并非能回答用戶的所有問題,系統(tǒng)最佳的狀態(tài)是將能回答的全部回答準確,不能回答的全部拒識,即拒絕回答。因此這里的評價指標包括有結(jié)果率、拒識率、召回率和準確率等,我們的目標是讓系統(tǒng)的有結(jié)果率無限接近數(shù)據(jù)的真實有結(jié)果率,召回率和準確率盡量高。這里我們是通過標注標準評測集來計算系統(tǒng)的各項指標,我們會從每日的全量數(shù)據(jù)集中抽樣出一個小數(shù)據(jù)集,保證小數(shù)據(jù)集的數(shù)據(jù)分布盡量符合全量數(shù)據(jù)集,然后由標注團隊對數(shù)據(jù)集做標注,標注出每個問題的實際答案,一般標注完成后還有質(zhì)檢的環(huán)節(jié),以保證標注結(jié)果盡量準確,這樣便生成了每日數(shù)據(jù)的標準評測集。
基于該標準評測集我們會去評價系統(tǒng)的好壞,并且每次做新模型迭代時都會使用標準評測集去評價新模型,只有新模型的效果好了才允許上線。
(2)基于用戶反饋的評價
人工評價能夠評價智能客服系統(tǒng)的準確率,但是答案是否合理,能否為用戶解決問題,需要用戶去反饋評價,整個智能客服系統(tǒng)的最終目標是幫助用戶解決問題。我們會在產(chǎn)品上設(shè)計智能客服和在線客服的評價功能,例如會讓用戶評價智能客服的每個答案或者某次會話,在和人工客服聊天完畢會發(fā)送評價卡片給用戶去評價滿意度。最終我們會統(tǒng)計參評比例、滿意度等指標,這些指標能夠真正反應(yīng)智能客服系統(tǒng)的好壞。實際中往往用戶參評比例低,我們會使用各種方法去刺激用戶評價。
上述內(nèi)容介紹了“幫幫”智能客服系統(tǒng)中的技術(shù)和評價體系,我們在做算法策略迭代時會不斷優(yōu)化評價指標。首先在離線模型迭代時,會基于標準評測集計算離線指標,只有指標提高了才允許模型上線。上線時會做ABTest上線,首先將新模型小流量上線,然后看數(shù)據(jù)效果,若效果好會切換更多的流量進行上線。
“幫幫”后臺系統(tǒng)總體架構(gòu)如圖所示,“幫幫”前端頁面是一個IM聊天窗口,用戶在聊天窗口中可以和“幫幫”即時對話。
這里的具體實現(xiàn)分為兩種:
第一種是通過微聊(58同城TEG自研的IM即時聊天工具)來實現(xiàn),用戶在前端的提問會被當做一條消息發(fā)送給微聊,我們有一個IM消息中轉(zhuǎn)模塊從微聊接收消息,并將消息轉(zhuǎn)發(fā)給問答引擎,問答引擎是一個RPC服務(wù),使用SCF框架(五八同城TEG自研的服務(wù)通信框架)實現(xiàn),問答引擎給出答案后返回給IM消息中轉(zhuǎn)模塊,中轉(zhuǎn)模塊將答案組裝成消息發(fā)送給微聊,最終微聊返回消息給用戶,這種方式的實現(xiàn)需要使用我們的微聊通道。
還有一些業(yè)務(wù)方不希望通過微聊來獲取“幫幫”自動問答功能,只希望我們提供一個接口,業(yè)務(wù)方輸入問題,接口能夠返回答案即可,針對這種方式我們在問答引擎之上封裝了一層http服務(wù),業(yè)務(wù)方只需要調(diào)用該服務(wù)即可。
下面介紹下問答引擎的后臺架構(gòu),問答引擎分為數(shù)據(jù)層、邏輯層和接入層。
數(shù)據(jù)層包括問答知識庫、標注和運營數(shù)據(jù)以及構(gòu)建的問答索引。邏輯層里各個功能模塊都基于SCF框架封裝成微服務(wù),包括NLU服務(wù)、模板匹配服務(wù)、檢索服務(wù)、排序服務(wù)、預(yù)測服務(wù)、閑聊服務(wù)、主體服務(wù),主體服務(wù)負責(zé)對外提供通用接口,接收問答請求,調(diào)用各個子服務(wù)完成問答邏輯以得到答案,并將答案返回給接入層。這里我們會做ABTest實驗,主體服務(wù)會請求ABTest平臺“日晷”(自研的包括請求分流和數(shù)據(jù)監(jiān)控功能的ABTest平臺)獲取具體分流實驗信息。此外,我們的所有算法迭代都是通過自研的人工智能平臺來實現(xiàn),標注和運營數(shù)據(jù)由Web標注管理系統(tǒng)來提供。
我們還會通過運營來提高問答效果,針對問答系統(tǒng)的高頻badcase回答,我們會進行人工修正,并即時同步到線上系統(tǒng),以保證回答準確。
“幫幫”每天產(chǎn)生的問答數(shù)據(jù),我們會抽樣一部分去做標準評測集的標注,從標注結(jié)果中我們可以看到哪些問題回答錯誤了,我們會將這些問題標上正確答案并即時上線。這是因為線上問答模型的更新周期較長,一般是數(shù)天或者一周,通過人工運營可以快速將badcase給去掉。標準評測集數(shù)據(jù)較少,只會包含少量的badcase,我們還會挖掘每日的全量數(shù)據(jù),發(fā)現(xiàn)高頻相似問題,并交由標注同事標注,若回答錯誤,也會進行標注運營上線。通過這種結(jié)合人工運營的方式,我們可以提高“幫幫”的回答準確率。
我們還會通過產(chǎn)品設(shè)計來提高問答準確率,“幫幫”最主要的功能是解決業(yè)務(wù)咨詢,這是基于我們構(gòu)建的問答知識庫做回答的。因此,可以設(shè)計一個輸入提示的功能,在用戶輸入問題時去問答知識庫中匹配相關(guān)的問題,若匹配到,用戶直接選擇相關(guān)問題即可,此時我們的回答邏輯就是在知識庫硬匹配,而不用走算法模型匹配,可以大大提高回答準確性。在實際應(yīng)用中,我們發(fā)現(xiàn)有很大一部分問題會從輸入匹配中匹配到,這種方式最終給回答準確率帶來了8%的提升,效果非常可觀。
智能客服系統(tǒng)有一個主要目標是提高人效,我們會將很多較復(fù)雜的咨詢服務(wù)做到聊天窗口中,讓用戶去自助完成,而不是像原來那樣用戶和人工客服溝通,人工客服去操作內(nèi)部各個系統(tǒng)以得到答案返回給用戶。這樣可以減輕我們客服人員的壓力,并能提升用戶體驗。例如用戶需要徹底刪除自己發(fā)布的帖子,舊模式下必須讓客服人員去操作,新模式下,只要用戶在“幫幫”界面上問到了該問題,我們便會向用戶返回他的發(fā)布列表,他可以選擇某條貼子,直接點擊徹底刪除按鈕即可完成刪除。
“幫幫”是一個通用的智能客服平臺,需要對接58集團內(nèi)多個業(yè)務(wù)方,為了提高接入效率,我們設(shè)計了一個通用的Web接入平臺。業(yè)務(wù)方注冊登錄接入平臺后,只需要簡單配置機器人和導(dǎo)入知識庫即可獲得智能客服能力,例如配置機器人歡迎語、熱門問題、配色等,平臺會自動生成一個前端頁面的鏈接,業(yè)務(wù)方可以嵌入到相關(guān)入口上。智能客服上線后,我們會將線上數(shù)據(jù)反饋給接入方,接入方可以再Web平臺上查看統(tǒng)計數(shù)據(jù)和明細數(shù)據(jù)。另外要強調(diào)的一點是,我們將知識庫的管理開放給接入方來管理,接入方可以導(dǎo)入和更新自己的問答知識庫,我們也會對問答數(shù)據(jù)做分類、聚類、主題抽取等操作,將相關(guān)中間結(jié)果提供給業(yè)務(wù)方,業(yè)務(wù)方基于此來更新知識庫。
“幫幫”已接入了五八集團內(nèi)五八、趕集和安居客三大平臺的三十多個業(yè)務(wù)場景,每日可以解決數(shù)萬用戶的客服咨詢,此外,“幫幫”也被應(yīng)用于公司內(nèi)部的HR、行政和運維系統(tǒng)之中,以提高內(nèi)部工作人員的辦公效率。經(jīng)過我們持續(xù)開展算法策略迭代,目前“幫幫”問答系統(tǒng)召回率達到了90%,準確率達到了85%。
今天的分享就到這里,謝謝大家。
01/分享嘉賓
詹坤林,58集團AI Lab負責(zé)人,算法高級架構(gòu)師,負責(zé)推動AI技術(shù)在58生活服務(wù)行業(yè)的落地,為集團打造全面AI能力。曾任騰訊高級工程師,負責(zé)騰訊微博/騰訊新聞推薦算法研發(fā)。
02/報名看直播 免費領(lǐng)PPT
03/關(guān)于我們
DataFun:專注于大數(shù)據(jù)、人工智能技術(shù)應(yīng)用的分享與交流。發(fā)起于2017年,在北京、上海、深圳、杭州等城市舉辦超過100+線下和100+線上沙龍、論壇及峰會,已邀請超過2000位專家和學(xué)者參與分享。其公眾號 DataFunTalk 累計生產(chǎn)原創(chuàng)文章700+,百萬+閱讀,14萬+精準粉絲。