操屁眼的视频在线免费看,日本在线综合一区二区,久久在线观看免费视频,欧美日韩精品久久综

新聞資訊

    日,微軟發(fā)布了兩個(gè)工具:微軟知識(shí)圖譜(Microsoft Concept Graph)和微軟概念標(biāo)簽?zāi)P停∕icrosoft Concept Tagging)。這兩個(gè)聽(tīng)上去很學(xué)術(shù)的東西,到底是干嘛的?與我們有什么關(guān)系?

    讓計(jì)算機(jī)理解人類

    當(dāng)我們看到“1881 年 10 月 25 日”這個(gè)詞條時(shí),雖然不是知道它有何含義,但我們會(huì)認(rèn)出這是一個(gè)日期。

    如果有更多的提示,比如“1881 年 10 月 25 日,畢加索”,大多數(shù)人基本就能推測(cè)出這可能是畢加索的生日,因?yàn)檫@幾乎是每個(gè)人最重要的日期。這一切都是基于常識(shí)和概念所作出的判斷。

    現(xiàn)負(fù)責(zé)這兩個(gè)項(xiàng)目的微軟亞洲研究院資深研究經(jīng)理閆峻博士說(shuō):

    “我們想做的,是讓計(jì)算機(jī)能夠更好地理解人類。理解是萬(wàn)事萬(wàn)物的基礎(chǔ),我們用計(jì)算機(jī)抓取過(guò)去這些不成文的開(kāi)放領(lǐng)域的常識(shí),能夠幫助計(jì)算機(jī)更具象地了解這個(gè)世界。”

    微軟知識(shí)圖譜(Microsoft Concept Graph)

    “是一個(gè)大型的概念知識(shí)圖譜系統(tǒng)。其包含的知識(shí)來(lái)自于數(shù)以億計(jì)的網(wǎng)頁(yè)和數(shù)年積累的搜索日志,可以為機(jī)器提供文本理解的常識(shí)性知識(shí)。”

    這是微軟官方給出的解釋。你可以將它理解為一個(gè)標(biāo)簽化的維基百科,其核心知識(shí)庫(kù)包含了超過(guò) 540 萬(wàn)條概念。

    除了常規(guī)的“城市”、“音樂(lè)家”、“計(jì)算機(jī)”、“智能手機(jī)”外,這個(gè)知識(shí)圖譜還包含了大量的長(zhǎng)尾概念,也就是比較小眾的概念,例如“抗帕金森治療”、“名人婚紗設(shè)計(jì)師”、“基礎(chǔ)的水彩技巧”等,而這些在普通數(shù)據(jù)庫(kù)中幾乎是找不到的。

    此外,每條知識(shí)概念都包含一系列的實(shí)體或子概念,比如在“太陽(yáng)系”的概念下,就會(huì)包括地球、火星、水星等。

    微軟概念標(biāo)簽?zāi)P停∕icrosoft Concept Tagging)

    “將文本詞條實(shí)體映射到不同的語(yǔ)義概念,并根據(jù)實(shí)體文本內(nèi)容標(biāo)記上相應(yīng)的概率標(biāo)簽。”

    翻譯成人話就是讓計(jì)算機(jī)根據(jù)上下文理解詞條的含義,比如我們說(shuō)“蘋果是甜的”,這里的“蘋果”,顯然是指水果而不是蘋果公司。

    現(xiàn)在概念標(biāo)簽?zāi)P退龅木褪亲層?jì)算機(jī)用不同的概念去描述一個(gè)詞,并給出對(duì)應(yīng)的概率,使得機(jī)器能夠更好地理解文本。

    應(yīng)用

    以搜索引擎為例,我們大多數(shù)人在搜索時(shí),只會(huì)輸入少量關(guān)鍵詞,而普通搜索引擎要做的就是將短的文本映射到大量的數(shù)據(jù)庫(kù)中,再返回包含有關(guān)鍵詞的搜索結(jié)果。計(jì)算機(jī)做的只是機(jī)械的匹配,談不上“理解”。

    微軟舉了一個(gè)很接地氣的例子:在社交網(wǎng)絡(luò)中,工程師在設(shè)置關(guān)鍵詞屏蔽不當(dāng)言論時(shí),可能不是每個(gè)敏感詞都能考慮到,比如屏蔽了“希特勒”、“納粹”,卻忽略了“法西斯”,但概念標(biāo)簽?zāi)P途湍芨鶕?jù)這些概念意識(shí)到“法西斯”也是一個(gè)需要屏蔽的詞。

    微軟亞洲研究院表示,知識(shí)圖譜和概念標(biāo)簽?zāi)P涂梢杂糜诓煌奈谋咎幚恚ㄋ阉饕妗⒆詣?dòng)問(wèn)答系統(tǒng)、在線廣告系統(tǒng)、推薦引擎、聊天機(jī)器人、以及人工智能系統(tǒng)等,目前已在微軟多個(gè)產(chǎn)品和服務(wù)中得到應(yīng)用。

    目前微軟上線了一個(gè) Demo 版的知識(shí)圖譜,不過(guò)目前暫不支持中文,對(duì)于詞組的判斷也不是很準(zhǔn)確(經(jīng)常會(huì)被拆分成兩個(gè)獨(dú)立的單詞),而且,竟然沒(méi)收錄自家的 Surface Studio……

    未來(lái)的版本將會(huì)包含基于上下文的獨(dú)立概念,以及對(duì)更多語(yǔ)種的支持。閆峻博士透露,微軟將與國(guó)內(nèi)的高校合作完成中文知識(shí)庫(kù)的構(gòu)建。

    同時(shí),閆峻博士表示接下來(lái)機(jī)器還會(huì)學(xué)習(xí)比喻、夸張和玩笑等高層次跨領(lǐng)域的抽象表達(dá)方法,最后實(shí)現(xiàn)從短文本的理解到長(zhǎng)文本的理解,如理解兩個(gè)完全不同的故事,但語(yǔ)義層面在表達(dá)同樣的道理等,這些都是他們未來(lái)努力的方向。

    “對(duì)話即平臺(tái)”

    源:微軟研究院 AI 頭條

    本文共8800字建議閱讀10+分鐘

    本文從多個(gè)AI領(lǐng)域的前瞻視角向出發(fā),試圖描繪一幅未來(lái)科技藍(lán)圖。

    [ 導(dǎo)讀 ]自 1998 年成立以來(lái),微軟亞洲研究院一直致力于推動(dòng)計(jì)算機(jī)科學(xué)領(lǐng)域的前沿技術(shù)發(fā)展。在建院 20 周年之際,我們特別邀請(qǐng)微軟亞洲研究院不同領(lǐng)域的專家共同撰寫“預(yù)見(jiàn)未來(lái)”系列文章,以各自領(lǐng)域的前瞻視角,從機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺(jué)、系統(tǒng)架構(gòu)、圖形學(xué)、自然語(yǔ)言處理等多個(gè)方向出發(fā),試圖描繪一幅未來(lái)科技藍(lán)圖。

    NLP 是人工智能領(lǐng)域中的重要一環(huán),NLP 的進(jìn)步將推動(dòng)人工智能的發(fā)展。在過(guò)去的二十年里,NLP 利用機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的研究成果,在很多方面取得了長(zhǎng)足的進(jìn)步。未來(lái)十年,將是 NLP 發(fā)展的黃金時(shí)期。本文中,微軟亞洲研究院自然語(yǔ)言計(jì)算組的研究員們將為我們盤點(diǎn) NLP 已經(jīng)取得技術(shù)進(jìn)展,并展望未來(lái)的研究熱點(diǎn)。

    比爾·蓋茨曾說(shuō)過(guò),“語(yǔ)言理解是人工智能皇冠上的明珠”。自然語(yǔ)言處理(NLP,Natural Language Processing)的進(jìn)步將會(huì)推動(dòng)人工智能整體進(jìn)展。

    NLP 的歷史幾乎跟計(jì)算機(jī)和人工智能(AI)的歷史一樣長(zhǎng)。自計(jì)算機(jī)誕生,就開(kāi)始有了對(duì)人工智能的研究,而人工智能領(lǐng)域最早的研究就是機(jī)器翻譯以及自然語(yǔ)言理解。


    在 1998 年微軟亞洲研究院成立之初,NLP 就被確定為最重要的研究領(lǐng)域之一。歷經(jīng)二十載春華秋實(shí),在歷屆院長(zhǎng)支持下,微軟亞洲研究院在促進(jìn) NLP 的普及與發(fā)展以及人才培養(yǎng)方面取得了非凡的成就。共計(jì)發(fā)表了 100 余篇 ACL 大會(huì)文章,出版了《機(jī)器翻譯》和《智能問(wèn)答》兩部著作,培養(yǎng)了 500 名實(shí)習(xí)生、20 名博士和 20 名博士后。

    我們研發(fā)的 NLP 技術(shù)琳瑯滿目,包括輸入法、分詞、句法/語(yǔ)義分析、文摘、情感分析、問(wèn)答、跨語(yǔ)言檢索、機(jī)器翻譯、知識(shí)圖譜、聊天機(jī)器人、用戶畫像和推薦等,已經(jīng)廣泛應(yīng)用于 Windows、Office、Bing、微軟認(rèn)知服務(wù)、小冰、小娜等微軟產(chǎn)品中。我們與創(chuàng)新技術(shù)組合作研發(fā)的微軟對(duì)聯(lián)和必應(yīng)詞典,已經(jīng)為成千上萬(wàn)的用戶提供服務(wù)。

    過(guò)去二十年, NLP 利用統(tǒng)計(jì)機(jī)器學(xué)習(xí)方法,基于大規(guī)模的帶標(biāo)注的數(shù)據(jù)進(jìn)行端對(duì)端的學(xué)習(xí),取得了長(zhǎng)足的進(jìn)步。尤其是過(guò)去三年來(lái),深度學(xué)習(xí)給 NLP 帶來(lái)了新的進(jìn)步。其中在單句翻譯、抽取式閱讀理解、語(yǔ)法檢查等任務(wù)上,更是達(dá)到了可比擬人類的水平。

    基于如下的判斷,我們認(rèn)為未來(lái)十年是 NLP 發(fā)展的黃金檔:

    1. 來(lái)自各個(gè)行業(yè)的文本大數(shù)據(jù)將會(huì)更好地采集、加工、入庫(kù)。
    2. 來(lái)自搜索引擎、客服、商業(yè)智能、語(yǔ)音助手、翻譯、教育、法律、金融等領(lǐng)域對(duì) NLP 的需求會(huì)大幅度上升,對(duì) NLP 質(zhì)量也提出更高要求。
    3. 文本數(shù)據(jù)和語(yǔ)音、圖像數(shù)據(jù)的多模態(tài)融合成為未來(lái)機(jī)器人的剛需。這些因素都會(huì)進(jìn)一步促進(jìn)對(duì) NLP 的投資力度,吸引更多人士加入到 NLP 的研發(fā)中來(lái)。因此我們需要審時(shí)度勢(shì)、抓住重點(diǎn)、及時(shí)規(guī)劃,面向更大的突破。


    因此,NLP 研究將會(huì)向如下幾個(gè)方面傾斜:

    • 將知識(shí)和常識(shí)引入目前基于數(shù)據(jù)的學(xué)習(xí)系統(tǒng)中。
    • 低資源的 NLP 任務(wù)的學(xué)習(xí)方法。
    • 上下文建模、多輪語(yǔ)義理解。
    • 基于語(yǔ)義分析、知識(shí)和常識(shí)的可解釋 NLP。


    重點(diǎn)知識(shí):NLP 技術(shù)的進(jìn)展


    自然語(yǔ)言處理,有時(shí)候也稱作自然語(yǔ)言理解,旨在利用計(jì)算機(jī)分析自然語(yǔ)言語(yǔ)句和文本,抽取重要信息,進(jìn)行檢索、問(wèn)答、自動(dòng)翻譯和文本生成。人工智能的目的是使得電腦能聽(tīng)、會(huì)說(shuō)、理解語(yǔ)言、會(huì)思考、解決問(wèn)題,甚至?xí)?chuàng)造。它包括運(yùn)算智能、感知智能、認(rèn)知智能和創(chuàng)造智能幾個(gè)層次的技術(shù)。計(jì)算機(jī)在運(yùn)算智能即記憶和計(jì)算的能力方面已遠(yuǎn)超人類。而感知智能則是電腦感知環(huán)境的能力,包括聽(tīng)覺(jué)、視覺(jué)和觸覺(jué)等等,相當(dāng)于人類的耳朵、眼睛和手。

    目前感知智能技術(shù)已取得飛躍性的進(jìn)步;而認(rèn)知智能包括自然語(yǔ)言理解、知識(shí)和推理,目前還待深入研究;創(chuàng)造智能目前尚無(wú)多少研究。比爾·蓋茨曾說(shuō)過(guò), “自然語(yǔ)言理解是人工智能皇冠上的明珠”。NLP 的進(jìn)步將會(huì)推動(dòng)人工智能整體進(jìn)展。

    NLP 在深度學(xué)習(xí)的推動(dòng)下,在很多領(lǐng)域都取得了很大進(jìn)步。下面,我們就來(lái)一起簡(jiǎn)單看看以下 NLP 的重要技術(shù)進(jìn)展:

    • 神經(jīng)機(jī)器翻譯
    • 智能人機(jī)交互
    • 機(jī)器閱讀理解
    • 機(jī)器創(chuàng)作


    1. 神經(jīng)機(jī)器翻譯

    神經(jīng)機(jī)器翻譯就是模擬人腦的翻譯過(guò)程。

    翻譯任務(wù)就是把源語(yǔ)言句子轉(zhuǎn)換成語(yǔ)義相同的目標(biāo)語(yǔ)言句子。人腦在進(jìn)行翻譯的時(shí)候,首先是嘗試?yán)斫膺@句話,然后在腦海里形成對(duì)這句話的語(yǔ)義表示,最后再把這個(gè)語(yǔ)義表示轉(zhuǎn)化到另一種語(yǔ)言。神經(jīng)機(jī)器翻譯就是模擬人腦的翻譯過(guò)程,它包含了兩個(gè)模塊:一個(gè)是編碼器,負(fù)責(zé)將源語(yǔ)言句子壓縮為語(yǔ)義空間中的一個(gè)向量表示,期望該向量包含源語(yǔ)言句子的主要語(yǔ)義信息;另一個(gè)是解碼器,它基于編碼器提供的語(yǔ)義向量,生成在語(yǔ)義上等價(jià)的目標(biāo)語(yǔ)言句子。

    神經(jīng)機(jī)器翻譯模型的優(yōu)勢(shì)在于三方面:

    • 一是端到端的訓(xùn)練,不再像統(tǒng)計(jì)機(jī)器翻譯方法那樣由多個(gè)子模型疊加而成,從而造成錯(cuò)誤的傳播;
    • 二是采用分布式的信息表示,能夠自動(dòng)學(xué)習(xí)多維度的翻譯知識(shí),避免人工特征的片面性;
    • 三是能夠充分利用全局上下文信息來(lái)完成翻譯,不再是局限于局部的短語(yǔ)信息。


    基于循環(huán)神經(jīng)網(wǎng)絡(luò)模型的機(jī)器翻譯模型已經(jīng)成為一種重要的基線系統(tǒng),在此方法的基礎(chǔ)上,從網(wǎng)絡(luò)模型結(jié)構(gòu)到模型訓(xùn)練方法等方面,都涌現(xiàn)出很多改進(jìn)。

    神經(jīng)機(jī)器翻譯系統(tǒng)的翻譯質(zhì)量在不斷取得進(jìn)步,人們一直在探索如何使得機(jī)器翻譯達(dá)到人類的翻譯水平。2018 年,微軟亞洲研究院與微軟翻譯產(chǎn)品團(tuán)隊(duì)合作開(kāi)發(fā)的中英機(jī)器翻譯系統(tǒng),在 WMT2017 新聞?lì)I(lǐng)域測(cè)試數(shù)據(jù)集上的翻譯質(zhì)量達(dá)到了與人類專業(yè)翻譯質(zhì)量相媲美的水平(Hassan et al., 2018)。該系統(tǒng)融合了微軟亞洲研究院提出的四種先進(jìn)技術(shù),其中包括可以高效利用大規(guī)模單語(yǔ)數(shù)據(jù)的聯(lián)合訓(xùn)練和對(duì)偶學(xué)習(xí)技術(shù),以及解決曝光偏差問(wèn)題的一致性正則化技術(shù)和推敲網(wǎng)絡(luò)技術(shù)。


    2. 智能人機(jī)交互

    智能人機(jī)交互包括利用自然語(yǔ)言實(shí)現(xiàn)人與機(jī)器的自然交流。其中一個(gè)重要的概念是“對(duì)話即平臺(tái)”。

    “對(duì)話即平臺(tái)”(CaaP,Conversation as a Platform)是微軟首席執(zhí)行官薩提亞·納德拉 2016 年提出的概念,他認(rèn)為圖形界面的下一代就是對(duì)話,并會(huì)給整個(gè)人工智能、計(jì)算機(jī)設(shè)備帶來(lái)一場(chǎng)新的革命。

    薩提亞之所以提出這個(gè)概念是因?yàn)椋菏紫龋从诖蠹叶家呀?jīng)習(xí)慣用社交手段,如微信、Facebook 與他人聊天的過(guò)程。我們希望將這種交流過(guò)程呈現(xiàn)在當(dāng)今的人機(jī)交互中。其次,大家現(xiàn)在面對(duì)的設(shè)備有的屏幕很小(比如手機(jī)),有的甚至沒(méi)有屏幕(比如有些物聯(lián)網(wǎng)設(shè)備),語(yǔ)音交互更加自然和直觀。對(duì)話式人機(jī)交互可調(diào)用 Bot 來(lái)完成一些具體的功能,比如訂咖啡,買車票等等。許多公司開(kāi)放了 CAAP 平臺(tái),讓全世界的開(kāi)發(fā)者都能開(kāi)發(fā)出自己喜歡的 Bot 以便形成一個(gè)生態(tài)。

    面向任務(wù)的對(duì)話系統(tǒng)比如微軟的小娜通過(guò)手機(jī)和智能設(shè)備讓人與電腦進(jìn)行交流,由人發(fā)布命令,小娜理解并完成任務(wù)。同時(shí),小娜理解你的習(xí)慣,可主動(dòng)給你一些貼心提示。而聊天機(jī)器人,比如微軟的小冰負(fù)責(zé)聊天。無(wú)論是小娜這種注重任務(wù)執(zhí)行的技術(shù),還是小冰這種聊天系統(tǒng),其實(shí)背后單元處理引擎無(wú)外乎三層技術(shù):

    • 第一層:通用聊天機(jī)器人;
    • 第二層:搜索和問(wèn)答(Infobot);
    • 第三層:面向特定任務(wù)對(duì)話系統(tǒng)(Bot)。



    聊天系統(tǒng)的架構(gòu)


    3. 機(jī)器閱讀理解

    自然語(yǔ)言理解的一個(gè)重要研究課題是閱讀理解。

    閱讀理解就是讓電腦看一遍文章,針對(duì)這些文章問(wèn)一些問(wèn)題,看電腦能不能回答出來(lái)。機(jī)器閱讀理解技術(shù)有著廣闊的應(yīng)用前景。例如,在搜索引擎中,機(jī)器閱讀理解技術(shù)可以用來(lái)為用戶的搜索(尤其是問(wèn)題型的查詢)提供更為智能的答案。我們通過(guò)對(duì)整個(gè)互聯(lián)網(wǎng)的文檔進(jìn)行閱讀理解,從而直接為用戶提供精確的答案。

    同時(shí),這在移動(dòng)場(chǎng)景的個(gè)人助理,如微軟小娜(Cortana)里也有直接的應(yīng)用:

    • 智能客服中可使用機(jī)器閱讀文本文檔(如用戶手冊(cè)、商品描述等)來(lái)自動(dòng)或輔助客服來(lái)回答用戶的問(wèn)題;
    • 辦公領(lǐng)域可使用機(jī)器閱讀理解技術(shù)處理個(gè)人的郵件或者文檔,然后用自然語(yǔ)言查詢獲取相關(guān)的信息;
    • 教育領(lǐng)域用來(lái)可以用來(lái)輔助出題;
    • 法律領(lǐng)域可用來(lái)理解法律條款,輔助律師或者法官判案;在金融領(lǐng)域里從非結(jié)構(gòu)化的文本(比如新聞中)抽取金融相關(guān)的信息等。


    機(jī)器閱讀理解技術(shù)可形成一個(gè)通用能力,第三方可以基于它構(gòu)建更多的應(yīng)用。

    斯坦福大學(xué)在 2016 年 7 月發(fā)布了一個(gè)大規(guī)模的用于評(píng)測(cè)閱讀理解技術(shù)的數(shù)據(jù)集(SQuAD),包含 10 萬(wàn)個(gè)由人工標(biāo)注的問(wèn)題和答案。SQuAD 數(shù)據(jù)集中,文章片段(passage)來(lái)自維基百科的文章,每個(gè)文章片段(passage)由眾包方式,標(biāo)注人員提 5 個(gè)問(wèn)題,并且要求問(wèn)題的答案是 passage 中的一個(gè)子片段。標(biāo)注的數(shù)據(jù)被分成訓(xùn)練集和測(cè)試集。訓(xùn)練集公開(kāi)發(fā)布用來(lái)訓(xùn)練閱讀理解系統(tǒng),而測(cè)試集不公開(kāi)。參賽者需要把開(kāi)發(fā)的算法和模型提交到斯坦福由其運(yùn)行后把結(jié)果報(bào)在網(wǎng)站上。

    一開(kāi)始,以 100 分為例,人的水平是 82.3 左右,機(jī)器的水平只有 74 分,機(jī)器相差甚遠(yuǎn)。后來(lái)通過(guò)不斷改進(jìn),機(jī)器閱讀理解性能得以逐步地提高。2018年1月,微軟亞洲研究院提交的R-Net系統(tǒng)首次在SQuAD數(shù)據(jù)集上以82.65的精準(zhǔn)匹配的成績(jī)首次超越人類在這一指標(biāo)上的成績(jī)。隨后阿里巴巴、科大訊飛和哈工大的系統(tǒng)也在這一指標(biāo)上超越人類水平。標(biāo)志著閱讀理解技術(shù)進(jìn)入了一個(gè)新的階段。

    最近微軟亞洲研究院的 NL-Net 和谷歌的 BERT 系統(tǒng)又先后在模糊匹配指標(biāo)上突破人類水平。對(duì)于閱讀理解技術(shù)的推動(dòng),除了 SQuAD 數(shù)據(jù)集起到了關(guān)鍵作用之外,還有如下三個(gè)方的因素:

    • 首先,是端到端的深度神經(jīng)網(wǎng)絡(luò);
    • 其次,是預(yù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò);
    • 最后,是系統(tǒng)和網(wǎng)絡(luò)結(jié)構(gòu)上的不斷創(chuàng)新。


    4. 機(jī)器創(chuàng)作

    機(jī)器可以做很多理性的東西,也可以做出一些創(chuàng)造性的東西。

    早在 2005 年,微軟亞洲研究院在時(shí)任院長(zhǎng)沈向洋的提議和支持下成功研發(fā)了《微軟對(duì)聯(lián)》系統(tǒng)。用戶出上聯(lián),電腦對(duì)出下聯(lián)和橫批,語(yǔ)句非常工整。

    在此基礎(chǔ)上,我們又先后開(kāi)發(fā)了格律詩(shī)和猜字謎的智能系統(tǒng)。在字謎游戲里,用戶給出謎面,讓系統(tǒng)猜出字,或系統(tǒng)給出謎面讓用戶猜出字。2017 年微軟研究院開(kāi)發(fā)了電腦寫自由體詩(shī)系統(tǒng)、作詞譜曲系統(tǒng)。中央電視臺(tái)《機(jī)智過(guò)人》節(jié)目就曾播放過(guò)微軟的電腦作詞譜曲與人類選手進(jìn)行詞曲創(chuàng)作比拼的內(nèi)容。這件事說(shuō)明如果有大數(shù)據(jù),那么深度學(xué)習(xí)就可以模擬人類的創(chuàng)造智能,也可以幫助專家產(chǎn)生更好的想法。

    就作詞來(lái)說(shuō),寫一首歌詞首先要決定主題。比如想寫一首與“秋”、“歲月”、“滄桑”、“感嘆”相關(guān)的歌,利用詞向量表示技術(shù),可知“秋風(fēng)”、“流年”、“歲月”、“變遷”等詞語(yǔ)比較相關(guān),通過(guò)擴(kuò)展主題可以約束生成的結(jié)果偏向人們想要的歌詞,接著在主題模型的約束下用序列到序列的神經(jīng)網(wǎng)絡(luò),用歌詞的上一句去生成下一句,如果是第一句,則用一個(gè)特殊的序列作為輸入去生成第一句歌詞,這樣循環(huán)生成歌詞的每一句。

    下面也簡(jiǎn)介一下譜曲。為一首詞譜曲不單要考慮旋律是否好聽(tīng),也要考慮曲與詞是否對(duì)應(yīng)。這類似于一個(gè)翻譯過(guò)程。不過(guò)這個(gè)翻譯中的對(duì)應(yīng)關(guān)系比自然語(yǔ)言翻譯更為嚴(yán)格。它需嚴(yán)格規(guī)定每一個(gè)音符對(duì)應(yīng)到歌詞中的每一個(gè)字。例如每一句有 N 個(gè)字,那么就需要將這句話對(duì)應(yīng)的曲切分成 N 個(gè)部分,然后順序完成對(duì)應(yīng)關(guān)系。這樣在“翻譯”過(guò)程中要“翻譯”出合理的曲譜,還要給出曲與詞之間的對(duì)應(yīng)關(guān)系。我們利用了一個(gè)改進(jìn)的序列到序列的神經(jīng)網(wǎng)絡(luò)模型,完成從歌詞“翻譯”到曲譜的生成過(guò)程。

    趨勢(shì)熱點(diǎn):值的關(guān)注的 NLP 技術(shù)


    從最近的 NLP 研究中,我們認(rèn)為有一些技術(shù)發(fā)展趨勢(shì)值得關(guān)注,這里總結(jié)了五個(gè)方面:

    • 預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)
    • 遷移學(xué)習(xí)和多任務(wù)學(xué)習(xí)
    • 知識(shí)和常識(shí)的引入
    • 低資源的 NLP 任務(wù)
    • 多模態(tài)學(xué)習(xí)


    熱點(diǎn)一:預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)


    如何學(xué)習(xí)更好的預(yù)訓(xùn)練的表示,在一段時(shí)間內(nèi)繼續(xù)成為研究的熱點(diǎn)。

    通過(guò)類似于語(yǔ)言模型的方式來(lái)學(xué)習(xí)詞的表示,其用于具體任務(wù)的范式得到了廣泛應(yīng)用。這幾乎成為自然語(yǔ)言處理的標(biāo)配。這個(gè)范式的一個(gè)不足是詞表示缺少上下文,對(duì)上下文進(jìn)行建模依然完全依賴于有限的標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí)。

    實(shí)際上,基于深度神經(jīng)網(wǎng)絡(luò)的語(yǔ)言模型已經(jīng)對(duì)文本序列進(jìn)行了學(xué)習(xí)。如果把語(yǔ)言模型關(guān)于歷史的那部分參數(shù)也拿出來(lái)應(yīng)用,那么就能得到一個(gè)預(yù)訓(xùn)練的上下文相關(guān)的表示。這就是 Matthew Peters 等人在 2018 年 NAACL 上的論文 “Deep Contextualized Word Representations” 的工作,他們?cè)诖罅课谋旧嫌?xùn)練了一個(gè)基于 LSTM 的語(yǔ)言模型。

    最近 Jacob Delvin 等人又取得了新的進(jìn)展,他們基于多層 Transformer 機(jī)制,利用所謂 “MASKED” 模型預(yù)測(cè)句子中被掩蓋的詞的損失函數(shù)和預(yù)測(cè)下一個(gè)句子的損失函數(shù)所預(yù)訓(xùn)練得到的模型 “BERT”,在多個(gè)自然語(yǔ)言處理任務(wù)上取得了當(dāng)前最好的水平。以上提到的所有的預(yù)訓(xùn)練的模型,在應(yīng)用到具體任務(wù)時(shí),先用這個(gè)語(yǔ)言模型的 LSTM 對(duì)輸入文本得到一個(gè)上下文相關(guān)的表示,然后再基于這個(gè)表示進(jìn)行具體任務(wù)相關(guān)的建模學(xué)習(xí)。結(jié)果表明,這種方法在語(yǔ)法分析、閱讀理解、文本分類等任務(wù)都取得了顯著的提升。最近一段時(shí)間,這種預(yù)訓(xùn)練模型的研究成為了一個(gè)研究熱點(diǎn)。




    如何學(xué)習(xí)更好的預(yù)訓(xùn)練的表示在一段時(shí)間內(nèi)將繼續(xù)成為研究的熱點(diǎn)。在什么粒度(word,sub-word,character)上進(jìn)行預(yù)訓(xùn)練,用什么結(jié)構(gòu)的語(yǔ)言模型(LSTM,Transformer等)訓(xùn)練,在什么樣的數(shù)據(jù)上(不同體裁的文本)進(jìn)行訓(xùn)練,以及如何將預(yù)訓(xùn)練的模型應(yīng)用到具體任務(wù),都是需要繼續(xù)研究的問(wèn)題。

    現(xiàn)在的預(yù)訓(xùn)練大都基于語(yǔ)言模型,這樣的預(yù)訓(xùn)練模型最適合序列標(biāo)注的任務(wù),對(duì)于問(wèn)答一類任務(wù)依賴于問(wèn)題和答案兩個(gè)序列的匹配的任務(wù),需要探索是否有更好的預(yù)訓(xùn)練模型的數(shù)據(jù)和方法。將來(lái)很可能會(huì)出現(xiàn)多種不同結(jié)構(gòu)、基于不同數(shù)據(jù)訓(xùn)練得到的預(yù)訓(xùn)練模型。針對(duì)一個(gè)具體任務(wù),如何快速找到合適的預(yù)訓(xùn)練模型,自動(dòng)選擇最優(yōu)的應(yīng)用方法,也是一個(gè)可能的研究課題。

    熱點(diǎn)二:遷移學(xué)習(xí)和多任務(wù)學(xué)習(xí)

    對(duì)于那些本身缺乏充足訓(xùn)練數(shù)據(jù)的自然語(yǔ)言處理任務(wù),遷移學(xué)習(xí)有著非常重要和實(shí)際的意義。多任務(wù)學(xué)習(xí)則用于保證模型能夠?qū)W到不同任務(wù)間共享的知識(shí)和信息。

    不同的 NLP 任務(wù)雖然采用各自不同類型的數(shù)據(jù)進(jìn)行模型訓(xùn)練,但在編碼器(Encoder)端往往是同構(gòu)的。例如,給定一個(gè)自然語(yǔ)言句子 who is the Microsoft founder,機(jī)器翻譯模型、復(fù)述模型和問(wèn)答模型都會(huì)將其轉(zhuǎn)化為對(duì)應(yīng)的向量表示序列,然后再使用各自的解碼器完成后續(xù)翻譯、改寫和答案生成(或檢索)任務(wù)。

    因此,可以將不同任務(wù)訓(xùn)練得到的編碼器看作是不同任務(wù)對(duì)應(yīng)的一種向量表示,并通過(guò)遷移學(xué)習(xí)(Transfer Learning)的方式將這類信息遷移到目前關(guān)注的目標(biāo)任務(wù)上來(lái)。對(duì)于那些本身缺乏充足訓(xùn)練數(shù)據(jù)的自然語(yǔ)言處理任務(wù),遷移學(xué)習(xí)有著非常重要和實(shí)際的意義。

    多任務(wù)學(xué)習(xí)(Multi-task Learning)可通過(guò)端到端的方式,直接在主任務(wù)中引入其他輔助任務(wù)的監(jiān)督信息,用于保證模型能夠?qū)W到不同任務(wù)間共享的知識(shí)和信息。Collobert 和 Weston 早在 2008 年就最早提出了使用多任務(wù)學(xué)習(xí)在深度學(xué)習(xí)框架下處理 NLP 任務(wù)的模型。

    最近 Salesforce 的 McCann 等提出了利用問(wèn)答框架使用多任務(wù)學(xué)習(xí)訓(xùn)練十項(xiàng)自然語(yǔ)言任務(wù)。每項(xiàng)任務(wù)的訓(xùn)練數(shù)據(jù)雖然有限,但是多個(gè)任務(wù)共享一個(gè)網(wǎng)絡(luò)結(jié)構(gòu),提升對(duì)來(lái)自不同任務(wù)的訓(xùn)練數(shù)據(jù)的綜合利用能力。多任務(wù)學(xué)習(xí)可以設(shè)計(jì)為對(duì)諸任務(wù)可共建和共享網(wǎng)絡(luò)的核心層次,而在輸出層對(duì)不同任務(wù)設(shè)計(jì)特定的網(wǎng)絡(luò)結(jié)構(gòu)。

    熱點(diǎn)三:知識(shí)和常識(shí)的引入

    如何在自然語(yǔ)言理解模塊中更好地使用知識(shí)和常識(shí),已經(jīng)成為目前自然語(yǔ)言處理領(lǐng)域中一個(gè)重要的研究課題。

    隨著人們對(duì)人機(jī)交互(例如智能問(wèn)答和多輪對(duì)話)要求的不斷提高,如何在自然語(yǔ)言理解模塊中更好地使用領(lǐng)域知識(shí),已經(jīng)成為目前自然語(yǔ)言處理領(lǐng)域中一個(gè)重要的研究課題。這是由于人機(jī)交互系統(tǒng)通常需要具備相關(guān)的領(lǐng)域知識(shí),才能更加準(zhǔn)確地完成用戶查詢理解、對(duì)話管理和回復(fù)生成等任務(wù)。

    最常見(jiàn)的領(lǐng)域知識(shí)包括維基百科和知識(shí)圖譜兩大類。機(jī)器閱讀理解是基于維基百科進(jìn)行自然語(yǔ)言理解的一個(gè)典型任務(wù)。給定一段維基百科文本和一個(gè)自然語(yǔ)言問(wèn)題,機(jī)器閱讀理解任務(wù)的目的是從該文本中找到輸入問(wèn)題對(duì)應(yīng)的答案短語(yǔ)片段。

    語(yǔ)義分析是基于知識(shí)圖譜進(jìn)行自然語(yǔ)言理解的另一個(gè)典型任務(wù)。給定一個(gè)知識(shí)圖譜(例如 Freebase)和一個(gè)自然語(yǔ)言問(wèn)題,語(yǔ)義分析任務(wù)的目的是將該問(wèn)題轉(zhuǎn)化為機(jī)器能夠理解和執(zhí)行的語(yǔ)義表示。

    目前,機(jī)器閱讀理解和語(yǔ)義分析可以說(shuō)是最熱門的自然語(yǔ)言理解任務(wù),它們受到了來(lái)自全世界研究者的廣泛關(guān)注和深入探索。

    常識(shí)指絕大多數(shù)人都了解并接受的客觀事實(shí),例如海水是咸的、人渴了就想喝水、白糖是甜的等。常識(shí)對(duì)機(jī)器深入理解自然語(yǔ)言非常重要,在很多情況下,只有具備了一定程度的常識(shí),機(jī)器才有可能對(duì)字面上的含義做出更深一層次的理解。然而獲取常識(shí)卻是一個(gè)巨大的挑戰(zhàn),一旦有所突破將是影響人工智能進(jìn)程的大事情。另外,在 NLP 系統(tǒng)中如何應(yīng)用常識(shí)尚無(wú)深入的研究,不過(guò)出現(xiàn)了一些值得關(guān)注的工作。




    熱點(diǎn)四:低資源的 NLP 任務(wù)

    引入領(lǐng)域知識(shí)(詞典、規(guī)則)可以增強(qiáng)數(shù)據(jù)能力、基于主動(dòng)學(xué)習(xí)的方法增加更多的人工標(biāo)注數(shù)據(jù)等,以解決數(shù)據(jù)資源貧乏的問(wèn)題。

    面對(duì)標(biāo)注數(shù)據(jù)資源貧乏的問(wèn)題,譬如小語(yǔ)種的機(jī)器翻譯、特定領(lǐng)域?qū)υ捪到y(tǒng)、客服系統(tǒng)、多輪問(wèn)答系統(tǒng)等,NLP 尚無(wú)良策。這類問(wèn)題統(tǒng)稱為低資源的 NLP 問(wèn)題。對(duì)這類問(wèn)題,除了設(shè)法引入領(lǐng)域知識(shí)(詞典、規(guī)則)以增強(qiáng)數(shù)據(jù)能力之外,還可以基于主動(dòng)學(xué)習(xí)的方法來(lái)增加更多的人工標(biāo)注數(shù)據(jù),以及采用無(wú)監(jiān)督和半監(jiān)督的方法來(lái)利用未標(biāo)注數(shù)據(jù),或者采用多任務(wù)學(xué)習(xí)的方法來(lái)使用其他任務(wù)甚至其他語(yǔ)言的信息,還可以使用遷移學(xué)習(xí)的方法來(lái)利用其他的模型。

    以機(jī)器翻譯為例,對(duì)于稀缺資源的小語(yǔ)種翻譯任務(wù),在沒(méi)有常規(guī)雙語(yǔ)訓(xùn)練數(shù)據(jù)的情況下,首先通過(guò)一個(gè)小規(guī)模的雙語(yǔ)詞典(例如僅包含 2000 左右的詞對(duì)),使用跨語(yǔ)言詞向量的方法將源語(yǔ)言和目標(biāo)語(yǔ)言詞映射到同一個(gè)隱含空間。在該隱含空間中, 意義相近的源語(yǔ)言和目標(biāo)語(yǔ)言詞具有相近的詞向量表示。基于該語(yǔ)義空間中詞向量的相似程度構(gòu)建詞到詞的翻譯概率表,并結(jié)合語(yǔ)言模型,便可以構(gòu)建基于詞的機(jī)器翻譯模型。

    使用基于詞的翻譯模型將源語(yǔ)言和目標(biāo)語(yǔ)言單語(yǔ)語(yǔ)料進(jìn)行翻譯,構(gòu)建出偽雙語(yǔ)數(shù)據(jù)。于是,數(shù)據(jù)稀缺的問(wèn)題通過(guò)無(wú)監(jiān)督的學(xué)習(xí)方法產(chǎn)生偽標(biāo)注數(shù)據(jù),就轉(zhuǎn)化成了一個(gè)有監(jiān)督的學(xué)習(xí)問(wèn)題。接下來(lái),利用偽雙語(yǔ)數(shù)據(jù)訓(xùn)練源語(yǔ)言到目標(biāo)語(yǔ)言以及目標(biāo)語(yǔ)言到源語(yǔ)言的翻譯模型,隨后再使用聯(lián)合訓(xùn)練的方法結(jié)合源語(yǔ)言和目標(biāo)語(yǔ)言的單語(yǔ)數(shù)據(jù),可以進(jìn)一步提高兩個(gè)翻譯系統(tǒng)的質(zhì)量。

    為了提高小語(yǔ)種語(yǔ)言的翻譯質(zhì)量,我們提出了利用通用語(yǔ)言之間大規(guī)模的雙語(yǔ)數(shù)據(jù),來(lái)聯(lián)合訓(xùn)練四個(gè)翻譯模型的期望最大化訓(xùn)練方法(Ren et al., 2018)。該方法將小語(yǔ)種 Z (例如希伯來(lái)語(yǔ))作為有著豐富語(yǔ)料的語(yǔ)種X(例如中文)和 Y (例如英語(yǔ))之間的一個(gè)隱含狀態(tài),并使用通用的期望最大化訓(xùn)練方法來(lái)迭代地更新 X 到 Z、Z 到 X、Y 到 Z 和 Z 到 Y 之間的四個(gè)翻譯模型,直至收斂。

    熱點(diǎn)五:多模態(tài)學(xué)習(xí)

    視覺(jué)問(wèn)答作為一種典型的多模態(tài)學(xué)習(xí)任務(wù),在近年來(lái)受到計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理兩個(gè)領(lǐng)域研究人員的重點(diǎn)關(guān)注。

    嬰兒在掌握語(yǔ)言功能前,首先通過(guò)視覺(jué)、聽(tīng)覺(jué)和觸覺(jué)等感官去認(rèn)識(shí)并了解外部世界。可見(jiàn),語(yǔ)言并不是人類在幼年時(shí)期與外界進(jìn)行溝通的首要手段。因此,構(gòu)建通用人工智能也應(yīng)該充分地考慮自然語(yǔ)言和其他模態(tài)之間的互動(dòng),并從中進(jìn)行學(xué)習(xí),這就是多模態(tài)學(xué)習(xí)。

    視覺(jué)問(wèn)答作為一種典型的多模態(tài)學(xué)習(xí)任務(wù),在近年來(lái)受到計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理兩個(gè)領(lǐng)域研究人員的重點(diǎn)關(guān)注。給定一張圖片和用戶提出的一個(gè)自然語(yǔ)言問(wèn)題,視覺(jué)問(wèn)答系統(tǒng)需要在理解圖片和自然語(yǔ)言問(wèn)題的基礎(chǔ)上,進(jìn)一步輸入該問(wèn)題對(duì)應(yīng)的答案,這需要視覺(jué)問(wèn)答方法在建模中能夠?qū)D像和語(yǔ)言之間的信息進(jìn)行充分地理解和交互。

    我們?cè)诮衲甑?CVPR 和 KDD 大會(huì)上分別提出了基于問(wèn)題生成的視覺(jué)問(wèn)答方法(Li et al., 2018)以及基于場(chǎng)景圖生成的視覺(jué)問(wèn)答方法(Lu et al., 2018),這兩種方法均在視覺(jué)問(wèn)答任務(wù)上取得了非常好的結(jié)果,實(shí)現(xiàn)了 state-of-the-art 的效果。除視覺(jué)問(wèn)答外,視頻問(wèn)答是另一種最近廣受關(guān)注的多模態(tài)任務(wù)。該任務(wù)除了包括帶有時(shí)序的視頻信息外,還包括了音頻信息。目前,視頻問(wèn)答作為一種新型的問(wèn)答功能,已經(jīng)出現(xiàn)在搜索引擎的場(chǎng)景中。可以預(yù)見(jiàn),該任務(wù)在接下來(lái)一定還會(huì)受到更多的關(guān)注。

    未來(lái)展望:理想的NLP框架和發(fā)展前景


    我們認(rèn)為,未來(lái)理想狀態(tài)下的 NLP 系統(tǒng)架構(gòu)可能是如下一個(gè)通用的自然語(yǔ)言處理框架:

    首先,對(duì)給定自然語(yǔ)言輸入進(jìn)行基本處理,包括分詞、詞性標(biāo)注、依存分析、命名實(shí)體識(shí)別、意圖/關(guān)系分類等。

    其次,使用編碼器對(duì)輸入進(jìn)行編碼將其轉(zhuǎn)化為對(duì)應(yīng)的語(yǔ)義表示。在這個(gè)過(guò)程中,一方面使用預(yù)訓(xùn)練好的詞嵌入和實(shí)體嵌入對(duì)輸入中的單詞和實(shí)體名稱進(jìn)行信息擴(kuò)充,另一方面,可使用預(yù)訓(xùn)練好的多個(gè)任務(wù)編碼器對(duì)輸入句子進(jìn)行編碼并通過(guò)遷移學(xué)習(xí)對(duì)不同編碼進(jìn)行融合。

    接下來(lái),基于編碼器輸出的語(yǔ)義表示,使用任務(wù)相關(guān)的解碼器生成對(duì)應(yīng)的輸出。還可引入多任務(wù)學(xué)習(xí)將其他相關(guān)任務(wù)作為輔助任務(wù)引入到對(duì)主任務(wù)的模型訓(xùn)練中來(lái)。如果需要多輪建模,則需要在數(shù)據(jù)庫(kù)中記錄當(dāng)前輪的輸出結(jié)果的重要信息,并應(yīng)用于在后續(xù)的理解和推理中。

    顯然,為了實(shí)現(xiàn)這個(gè)理想的 NLP 框架需要做很多工作:

    • 需要構(gòu)建大規(guī)模常識(shí)數(shù)據(jù)庫(kù)并且清晰通過(guò)有意義的評(píng)測(cè)推動(dòng)相關(guān)研究;
    • 研究更加有效的詞、短語(yǔ)、句子的編碼方式,以及構(gòu)建更加強(qiáng)大的預(yù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型;
    • 推進(jìn)無(wú)監(jiān)督學(xué)習(xí)和半監(jiān)督學(xué)習(xí),需要考慮利用少量人類知識(shí)加強(qiáng)學(xué)習(xí)能力以及構(gòu)建跨語(yǔ)言的 embedding 的新方法;
    • 需要更加有效地體現(xiàn)多任務(wù)學(xué)習(xí)和遷移學(xué)習(xí)在 NLP 任務(wù)中的效能,提升強(qiáng)化學(xué)習(xí)在 NLP 任務(wù)的作用,比如在自動(dòng)客服的多輪對(duì)話中的應(yīng)用;
    • 有效的篇章級(jí)建模或者多輪會(huì)話建模和多輪語(yǔ)義分析;
    • 要在系統(tǒng)設(shè)計(jì)中考慮用戶的因素,實(shí)現(xiàn)用戶建模和個(gè)性化的輸出;
    • 構(gòu)建綜合利用推理系統(tǒng)、任務(wù)求解和對(duì)話系統(tǒng),基于領(lǐng)域知識(shí)和常識(shí)知識(shí)的新一代的專家系統(tǒng);
    • 利用語(yǔ)義分析和知識(shí)系統(tǒng)提升 NLP 系統(tǒng)的可解釋能力。


    未來(lái)十年,NLP 將會(huì)進(jìn)入爆發(fā)式的發(fā)展階段。從 NLP 基礎(chǔ)技術(shù)到核心技術(shù),再到 NLP+ 的應(yīng)用,都會(huì)取得巨大的進(jìn)步。比爾·蓋茨曾經(jīng)說(shuō)過(guò)人們總是高估在一年或者兩年中能夠做到的事情,而低估十年中能夠做到的事情。

    我們不妨進(jìn)一步想象十年之后 NLP 的進(jìn)步會(huì)給人類生活帶來(lái)哪些改變?

    • 十年后,機(jī)器翻譯系統(tǒng)可以對(duì)上下文建模,具備新詞處理能力。那時(shí)候的講座、開(kāi)會(huì)都可以用語(yǔ)音進(jìn)行自動(dòng)翻譯。除了機(jī)器翻譯普及,其他技術(shù)的進(jìn)步也令人耳目一新。家里的老人和小孩可以跟機(jī)器人聊天解悶。
    • 機(jī)器個(gè)人助理能夠理解你的自然語(yǔ)言指令,完成點(diǎn)餐、送花、購(gòu)物等下單任務(wù)。你已習(xí)慣于客服機(jī)器人來(lái)回答你的關(guān)于產(chǎn)品維修的問(wèn)題。
    • 你登臨泰山發(fā)思古之幽情,或每逢佳節(jié)倍思親,拿出手機(jī)說(shuō)出感想或者上傳一幅照片,一首情景交融、圖文并茂的詩(shī)歌便躍然于手機(jī)屏幕上,并且可以選擇格律詩(shī)詞或者自由體的表示形式,亦可配上曲譜,發(fā)出大作引來(lái)點(diǎn)贊。
    • 可能你每天看到的體育新聞、財(cái)經(jīng)新聞報(bào)道是機(jī)器人寫的。
    • 你用手機(jī)跟機(jī)器人老師學(xué)英語(yǔ),老師教你口語(yǔ),糾正發(fā)音,跟你親切對(duì)話,幫你修改論文。
    • 機(jī)器人定期自動(dòng)分析浩如煙海的文獻(xiàn),給企業(yè)提供分析報(bào)表、輔助決策并做出預(yù)測(cè)。搜索引擎的智能程度大幅度提高。很多情況下,可以直接給出答案,并且可以自動(dòng)生成細(xì)致的報(bào)告。
    • 利用推薦系統(tǒng),你關(guān)心的新聞、書(shū)籍、課程、會(huì)議、論文、商品等可直接推送給你。
    • 機(jī)器人幫助律師找出判據(jù),挖掘相似案例,尋找合同疏漏,撰寫法律報(bào)告。
    • ……


    未來(lái),NLP 將跟其他人工智能技術(shù)一道深刻地改變?nèi)祟惖纳睢.?dāng)然前途光明、道路曲折是亙古不變的道理,為了實(shí)現(xiàn)這個(gè)美好的未來(lái),我們需要大膽創(chuàng)新、嚴(yán)謹(jǐn)求實(shí)、扎實(shí)進(jìn)取。講求研究和應(yīng)用并舉,普及與提高同步。我們期待著與業(yè)界同仁一道努力,共同走進(jìn) NLP 下一個(gè)輝煌的十年。

    編輯:黃繼彥

    校對(duì):林亦霖

    — 完 —

    關(guān)注清華-青島數(shù)據(jù)科學(xué)研究院官方微信公眾平臺(tái)“THU數(shù)據(jù)派”及姊妹號(hào)“數(shù)據(jù)派THU”獲取更多講座福利及優(yōu)質(zhì)內(nèi)容。

    年春節(jié)就要來(lái)臨了

    各位豬豬女孩備好年貨了嗎?

    說(shuō)起備年貨,我就想起對(duì)聯(lián)

    一直以來(lái),對(duì)聯(lián)都是年味的象征

    只不過(guò)今年寫對(duì)聯(lián)的老大爺怕是要哭暈在街口

    因?yàn)檫BAI都要來(lái)跟他搶飯碗了!

    之前有位王斌大神做出了自動(dòng)對(duì)對(duì)聯(lián)系統(tǒng)

    只要輸入上聯(lián),系統(tǒng)就會(huì)秒出下聯(lián)

    /如果一個(gè)想離開(kāi)你,說(shuō)什么都是白搭

    如果一個(gè)人不想離開(kāi)你,一個(gè)擁抱就能代替所有/

    事實(shí)證明,理科生浪漫起來(lái)

    基本上就沒(méi)文科生什么事了

    AI對(duì)聯(lián)除了是在線授課的情感專家

    還是比章魚(yú)帝還準(zhǔn)的算命大師

    /退休?不存在的!

    好好搬磚吧,不要想太多/

    輕輕貼近AI的耳朵,我要暴富!

    AI:暴富是不可能暴富的,這輩子都不可能暴富

    不帶這么扎心的啊!能不能來(lái)點(diǎn)正能量?

    好的!于是AI反手就給文字君灌了一大碗雞湯

    /你以為我在摸魚(yú),其實(shí)我是在修仙!/

    有時(shí)真的懷疑AI是老板派來(lái)的臥底

    不然為啥說(shuō)的話跟領(lǐng)導(dǎo)年會(huì)發(fā)言一毛一樣……

    /真是文體兩開(kāi)花啊!/

    無(wú)獨(dú)有偶

    微軟在此年關(guān)之際也開(kāi)發(fā)出了一款對(duì)聯(lián)AI

    耿直程度有過(guò)之而無(wú)不及

    當(dāng)然,AI也不是只會(huì)扎心

    它有時(shí)也能讓我們看到一點(diǎn)希望

    嗯,文字君今年的目標(biāo)就是這個(gè)了!

    小伙伴們快點(diǎn)動(dòng)動(dòng)手指

    幫文字君實(shí)現(xiàn)從月薪三千到日薪三千的夢(mèng)想啊!

    作為一個(gè)成了精的AI,它幾乎無(wú)所不知

    電線桿小廣告的目標(biāo)受眾都一清二楚……

    還時(shí)不時(shí)給我們

    解鎖日常用具不為人知的新操作

    愛(ài)生活愛(ài)八卦

    開(kāi)起嘴炮來(lái)也毫不留情!

    有道理!下次十幾年沒(méi)見(jiàn)的小學(xué)同學(xué)

    再來(lái)問(wèn)我借錢,我就這么懟回去

    AI對(duì)聯(lián)令人閉嘴驚艷

    但咱們勤勞勇敢的中國(guó)人民也不會(huì)輕易認(rèn)輸

    看看下面這些畫風(fēng)清奇的奇葩對(duì)聯(lián)就知道

    AI想要承包對(duì)聯(lián)界,怕是還有很長(zhǎng)的路要走!

    春聯(lián),源于古代的桃符

    桃符,是舊時(shí)懸掛在大門兩旁

    用于辟邪長(zhǎng)方形桃木板

    /桃符,一般上書(shū)「神荼」「郁壘」

    神荼、郁壘是傳說(shuō)中惡鬼的克星/

    五代時(shí)期

    人們開(kāi)始在桃木板上書(shū)寫寓意吉祥的聯(lián)語(yǔ)

    后來(lái)又漸漸書(shū)寫到了紙張之上

    于是就有了我們現(xiàn)在所熟悉的「春聯(lián)」

    不過(guò),時(shí)代在發(fā)展,社會(huì)在進(jìn)步

    春聯(lián)的內(nèi)容也在「與時(shí)俱進(jìn)」

    紅包,是檢驗(yàn)春節(jié)快不快樂(lè)的唯一標(biāo)準(zhǔn)

    畢竟,一個(gè)連紅包都搶不到的春節(jié)

    還談什么「吉祥」呢?

    不僅搶紅包的時(shí)候要「萬(wàn)事如意」

    吃雞路上也要「大展宏圖」

    /秀兒,是你嗎?/

    而相比之下

    過(guò)早地感受到了生活的艱辛與不易的社畜們

    在寫春聯(lián)這件事上就實(shí)在得多了

    游戲玩得再好,也不如甲方少改一稿

    說(shuō)多了都是淚啊!

    不過(guò)事實(shí)證明

    與其寄希望于新年能遇到個(gè)正常一點(diǎn)的甲方

    還不如轉(zhuǎn)換思路,自力更生

    這波廣告打得我服!

    創(chuàng)業(yè)光有才華和決心不夠,腦洞也必須安排上

    但對(duì)于放飛自我的人來(lái)說(shuō),這點(diǎn)根本沒(méi)有在怕的

    好好好,知道你思路廣了

    不僅熱點(diǎn)流行語(yǔ)也要安排上

    網(wǎng)絡(luò)熱詞也要及時(shí)pick起來(lái)放在對(duì)聯(lián)里

    這上下聯(lián)可以說(shuō)是精分本分

    看著這些秀操作或抖機(jī)靈的春聯(lián)

    當(dāng)代錦鯉青年內(nèi)心毫無(wú)波瀾,甚至有點(diǎn)想笑

    因?yàn)樵谒麄冃闹校郝?lián)存在的意義

    就是用來(lái)許愿的啊!

    一切不以表達(dá)美好愿望為目的的春聯(lián)都不是好春聯(lián)

    一邊許愿一邊隔空互懟

    又是什么騷操作???

    自從見(jiàn)識(shí)了沙雕網(wǎng)友們的奇葩對(duì)聯(lián)

    我才深深意識(shí)到自己的狹隘

    原來(lái)對(duì)聯(lián)不僅可以展望未來(lái)……

    還可以寫下自己對(duì)于生活的理解……

    甚至可以抒發(fā)自己對(duì)過(guò)去一年的悔恨……

    在美食面前毫無(wú)抵抗力,一頓狂吃之后又后悔莫及

    這不就是我嗎???

    人生已經(jīng)如此艱難,橫批能不能就不要拆穿……

    看了中國(guó)人民精彩的腦洞表演

    外國(guó)友人終于也坐不住,要對(duì)對(duì)聯(lián)下手了!

    于是就有了各種畫風(fēng)清奇的外語(yǔ)對(duì)聯(lián)……

    為這波「神翻譯」雙擊666!

    BUT對(duì)聯(lián)真不是這樣寫的……

    請(qǐng)看下面這個(gè)正確示范:

    上聯(lián):努力干活多多賺錢

    下聯(lián):吃好睡好天天嘚瑟

    橫批:給力!

    如果把「luck」倒著貼,那簡(jiǎn)直再完美不過(guò)了

    有些對(duì)聯(lián)雖然不能說(shuō)是外文

    但普通人也是輕易看不懂的

    戲精的對(duì)聯(lián)已經(jīng)如此讓人摸不著頭腦了

    學(xué)霸的對(duì)聯(lián),那根本就是智商暴擊嘛!

    文字君對(duì)照了化學(xué)元素周期表

    才把對(duì)聯(lián)內(nèi)容成功「破譯」出來(lái)

    原來(lái)意思是

    「迎新納福家和美」(銀鋅鈉氟鎵鉿鎂)

    「來(lái)喜得金身康泰」(錸锝金砷鈧鈦)

    但你以為這樣就結(jié)束了嗎?

    音樂(lè)家的五線譜對(duì)聯(lián)了解一下

    看不懂吧?讓文字君來(lái)給你翻譯翻譯!

    上聯(lián):都發(fā)都發(fā)都都發(fā)

    下聯(lián):發(fā)啦發(fā)啦發(fā)發(fā)啦

    橫批:發(fā)啦都發(fā)!

    佩服佩服,非常想擁有了!

    講真,這些對(duì)聯(lián)雖然令人蒙逼

    但翻譯一下還是看得懂

    真正高難度的外文對(duì)聯(lián)

    你每個(gè)字都看得懂,但就是不知道在說(shuō)啥

    /這副對(duì)聯(lián)值得每位鏟屎官擁有!/

    喵星人都來(lái)了,汪星人還會(huì)遠(yuǎn)嗎?

    按照這種思路

    豬年的對(duì)聯(lián)文字君已經(jīng)想好了!

    上聯(lián):哼哼哼哼哼哼哼

    下聯(lián):嚕嚕嚕嚕嚕嚕嚕

    橫批:哄哄哄哄

    今年過(guò)年,春聯(lián)就這么安排啦!

    ?

網(wǎng)站首頁(yè)   |    關(guān)于我們   |    公司新聞   |    產(chǎn)品方案   |    用戶案例   |    售后服務(wù)   |    合作伙伴   |    人才招聘   |   

友情鏈接: 餐飲加盟

地址:北京市海淀區(qū)    電話:010-     郵箱:@126.com

備案號(hào):冀ICP備2024067069號(hào)-3 北京科技有限公司版權(quán)所有