操屁眼的视频在线免费看,日本在线综合一区二区,久久在线观看免费视频,欧美日韩精品久久综

新聞資訊

    查員 楊依然

    速覽

    - 網(wǎng)傳“巨人骸骨勘測(cè)圖”是一張創(chuàng)意PS圖,圖中的“考古工作人員”被調(diào)整了大小。此外,互聯(lián)網(wǎng)上多張所謂“巨人骸骨”圖片,還來自于另一名為“考古異?!眻D片集,也都是PS的產(chǎn)物。

    - 推文評(píng)論中所提到的“AIAA訴史密森尼學(xué)會(huì)案”亦為憑空捏造,最初來源于一家“僅供參考娛樂”的假新聞網(wǎng)站。

    事件背景

    近日,有用戶在推特上以英文及繁體中文同時(shí)發(fā)推稱,“世界上已發(fā)現(xiàn)2萬多個(gè)巨人化石,但主流媒體刻意隱瞞”。隨文配圖一副埋在土中的人類骨骼,有三個(gè)身著熒光綠的疑似考古工作人員蹲在骨骼旁進(jìn)行勘察。和三位工作人員比起來,這副人骨顯得巨大無比。

    在這條推文下方,有用戶@liusangxx 回復(fù)道,“曾經(jīng),考古界為了維護(hù)進(jìn)化論正在邁向主流的‘政治正確’,毀滅了一千多副巨人骸骨,發(fā)表的文章一律攻擊為造假,就像消滅異教徒一樣。2015年,美國(guó)AIAA向法院控告史密森尼學(xué)會(huì)摧毀巨人骸骨,美國(guó)最高法院判決該學(xué)會(huì)必須公開所有巨人檔案,于是巨人骸骨真相大白,人們終于看到了莫哈韋沙漠巨人骸骨。”

    明查

    圖片源自何處?

    下載該圖片,并查看“屬性”,可以發(fā)現(xiàn)該圖片“來源”一欄顯示拍攝日期為2008年8月26日,程序名稱為“Adobe Photoshop CS5.1 Windows”。用記事本功能打開該圖片后發(fā)現(xiàn)代碼第一行顯示“Adobe Photoshop CS5.1”,編輯于2011年8月14日。使用專業(yè)圖像鑒定網(wǎng)站 Fotoforensics對(duì)該圖片進(jìn)行鑒定后可以確認(rèn),圖中的三位勘察工作人員部分極為突出,有明顯被處理過的痕跡。

    至此,可以確定,網(wǎng)傳的“巨人骸骨勘測(cè)圖”是通過Photoshop軟件被人為編輯的結(jié)果。

    使用Tineye搜索工具對(duì)該圖片進(jìn)行反搜后發(fā)現(xiàn),這張所謂的“巨人骸骨勘測(cè)圖”在互聯(lián)網(wǎng)上流傳已久,每過一段時(shí)間就會(huì)被網(wǎng)友重新發(fā)掘并傳播。與其并列的甚至還有一些其他的巨型頭骨照片。

    “哇!??!這些就是圣經(jīng)里提到的那些巨人嗎?”

    在瀏覽器搜索欄中搜索該圖片左下角的水印“Worth1000.com”,頁面自動(dòng)跳轉(zhuǎn)至一個(gè)叫“DesignCrowd”的網(wǎng)站。公開信息顯示,該網(wǎng)站“是定制圖形、標(biāo)志、網(wǎng)絡(luò)和印刷設(shè)計(jì)的完美選擇。DesignCrowd是一個(gè)在線創(chuàng)意市場(chǎng),幫助初創(chuàng)企業(yè)、企業(yè)和企業(yè)家與全球設(shè)計(jì)師網(wǎng)絡(luò)聯(lián)系。是定制圖形、標(biāo)志、網(wǎng)絡(luò)和印刷設(shè)計(jì)的完美選擇?!痹诠雀柚袑?duì)關(guān)鍵詞“Worth1000”進(jìn)行搜索后發(fā)現(xiàn),2014年,DesignCrowd網(wǎng)站博客曾發(fā)布文章宣布,Worth1000已被DesignCrowd所合并。

    該文章聲稱,Worth1000是一個(gè)“創(chuàng)意性的競(jìng)賽平臺(tái)”,創(chuàng)辦于2008年,曾經(jīng)擁有超過60萬用戶。Worth1000曾經(jīng)舉辦過許多Photoshop設(shè)計(jì)競(jìng)賽,這一基因也被DesignCrowd所繼承延續(xù)。

    在谷歌圖片反搜中限定域名“designcrowd.com”后發(fā)現(xiàn),網(wǎng)傳圖片是一個(gè)設(shè)計(jì)競(jìng)賽第三名作品,由一名為“Whitmath57”的設(shè)計(jì)師上傳于2011年8月14日。該日期與圖片代碼中顯示的日期相符,可以確認(rèn)為該圖來源。

    該競(jìng)賽主題為“尺寸很重要”(Size matters 4),規(guī)則要求參賽者“以非同尋常但并非不可能的方式更改圖像中物品的大小”。

    該圖片第一名和第二名作品分別是茶杯中的花樣游泳,以及玻璃瓶中的海底世界。

    在DesignCrowd網(wǎng)站進(jìn)一步搜索關(guān)鍵詞“giant skeleton”(巨人骨骼)后發(fā)現(xiàn),DesignCrowd網(wǎng)站發(fā)布過不止一張“巨人骸骨”圖片。

    一篇發(fā)表于2016年題為“巨人骨骼似乎真實(shí)到不像個(gè)騙局”(Giant Skeletons Seem Too Real To Be A Hoax)的文章提到,數(shù)碼照片編輯軟件允許人們?cè)谶M(jìn)化的時(shí)間線中添加自己的創(chuàng)意元素——互聯(lián)網(wǎng)中的一些“非凡的”人類遺骸是人為編輯處理過后的產(chǎn)物,其中就包括DesignCrowd(Worth1000.com)社區(qū)成員的作品。這篇文章還附上了一個(gè)名為“考古異?!保╝rchaeological anomalies)的圖片集,以及一些風(fēng)格類似推文配圖的更加光怪陸離的巨人骸骨圖片,其中就包括其他廣為流傳的巨人族存在的“證據(jù)”。

    “是時(shí)候重寫歷史書了?Yearofthedragon作品”

    “發(fā)掘不可解釋之物。Anakinnnn作品”

    美國(guó)最高法院判史密森尼學(xué)會(huì)公開巨人檔案?

    既然圖片中的“巨人”都是認(rèn)為編輯加工的,那么@liusangxx 聲稱的“美國(guó)AIAA向最高法院控告史密森尼學(xué)會(huì)私藏巨人骸骨”又是怎么一回事?

    史密森尼學(xué)會(huì)(Smithonian Institution),1846年建立,是享有盛譽(yù)的博物館、教育和研究綜合體,覆蓋藝術(shù)設(shè)計(jì)、歷史文化、自然科學(xué)等多個(gè)主題。

    而在谷歌搜索關(guān)鍵詞“AIAA”,可以發(fā)現(xiàn)這一縮寫通常被用于稱呼美國(guó)航天航空學(xué)會(huì)(American Institute of Aeronautics and Astronautics),但是很明顯,航天航空學(xué)會(huì)插手考古遺跡并提起訴訟一事,未免有些可疑。

    進(jìn)一步檢索“AIAA archealogy”后發(fā)現(xiàn),最早于2014年12月,就有一家名為“世界新聞每日?qǐng)?bào)道”(World News Daily Report)的網(wǎng)站發(fā)布了相關(guān)新聞,稱AIAA是一家叫做“美國(guó)另類考古學(xué)會(huì)”(American Institution of Alternative Archaelogy)的組織。該報(bào)道聲稱,“美國(guó)最高法院的一項(xiàng)裁決迫使史密森學(xué)會(huì)公布 1900 年代初期的機(jī)密文件,證明該組織參與了重大的歷史掩蓋”,“史密森尼承認(rèn)毀滅了上千具1900年代早期巨人骸骨?!?/p>

    根據(jù)這篇報(bào)道的說法,一開始,史密森尼學(xué)會(huì)拒不承認(rèn)銷毀巨人骸骨,但是,AIAA展示了一根1.3米長(zhǎng)的人類股骨,成為關(guān)鍵性證據(jù)。文章還插入了一張據(jù)稱是2011年在美國(guó)俄亥俄州發(fā)掘的巨型人骨。

    @liusangxx 在推特評(píng)論中所提及的說法正與這篇“世界新聞每日?qǐng)?bào)道”的文章內(nèi)容相一致。

    進(jìn)一步公開檢索發(fā)現(xiàn),就在這篇文章發(fā)出后不久,美國(guó)事實(shí)核查網(wǎng)站Snopes就已經(jīng)證偽了“美國(guó)另類考古學(xué)會(huì)”的真實(shí)性,并對(duì)該報(bào)道進(jìn)行了核驗(yàn):這篇文章聲稱,上圖于2011年拍攝于俄亥俄州,但是這張圖最早發(fā)布于2008年,來自一個(gè)臉書群組,圖上地點(diǎn)為土耳其。

    雖然該臉書群組目前已經(jīng)轉(zhuǎn)為私密,但我們通過下載圖片、查看屬性可知,該照片亦經(jīng)過Photoshop軟件編輯處理。

    此外,使用美國(guó)最高法院網(wǎng)站檔案的案卷搜索功能,分別搜索“Smithonian”、“AIAA”和“American Institution of Alternative Archeology”,均顯示無結(jié)果。那么,發(fā)布這篇報(bào)道的“世界新聞每日?qǐng)?bào)道”,究竟是一個(gè)什么樣的媒體平臺(tái)呢?

    其實(shí),仔細(xì)觀察可以發(fā)現(xiàn),其標(biāo)志上除了“World News Daily Report”幾個(gè)大字外,還有一行小字:Where facts don't matter (事實(shí)不重要的地方)。其自稱“位于特拉維夫的美國(guó)猶太人猶太復(fù)國(guó)主義報(bào)紙”、“致力于發(fā)掘世界范圍內(nèi)的圣經(jīng)考古新聞和其他神秘事件。”

    在詳情頁面的“法律通知”一欄,該網(wǎng)站的免責(zé)聲明寫道:本“世界新聞每日?qǐng)?bào)道”網(wǎng)站信息僅供參考娛樂。

    2015年,英國(guó)《獨(dú)立報(bào)》在一篇報(bào)道中,列舉了一系列臭名昭著的假新聞網(wǎng)站,稱它們“將‘新聞’一詞玩弄于股掌之間,而提供的材料卻完全是捏造的”。“世界新聞每日?qǐng)?bào)道”也名列其中。2016年,《哥倫比亞新聞評(píng)論》也將其標(biāo)記為假新聞媒體。2017年,另一家事實(shí)核查機(jī)構(gòu)Politifact稱其為“諷刺新聞網(wǎng)站”。

    綜上所述,推文中所引用的圖片乃是2014年圖片設(shè)計(jì)網(wǎng)站W(wǎng)orth1000舉辦“尺寸很重要”比賽獲獎(jiǎng)作品,圖片中的三個(gè)考古工作人員被調(diào)整了大小,有明顯的編輯痕跡。此外一系列的所謂“巨人骸骨”照片均來自Worth1000網(wǎng)站的另一個(gè)“考古異?!眻D片集,也都是Photoshop的產(chǎn)物。

    評(píng)論中所提到的“AIAA訴史密森尼學(xué)會(huì)案”也是一則憑空捏造的假新聞。該新聞最早于2014年12月為“世界新聞每日?qǐng)?bào)道”發(fā)布,不久后已經(jīng)被事實(shí)核查網(wǎng)站snopes證偽。所謂“美國(guó)另類考古學(xué)會(huì)”是一家虛構(gòu)的機(jī)構(gòu),“世界新聞每日?qǐng)?bào)道”也是一家臭名昭著的假新聞網(wǎng)站。

    延伸閱讀:

    明查|未接種疫苗的精子漲價(jià)400%?

    明查|這是印度國(guó)防參謀長(zhǎng)飛機(jī)墜毀現(xiàn)場(chǎng)?還有武裝人員把守?

    明查|以色列科學(xué)家找到2秒內(nèi)消滅新冠病毒的方法?

    責(zé)任編輯:寧希巍

    校對(duì):丁曉

    本文由知名開源平臺(tái),AI 技術(shù)平臺(tái)以及領(lǐng)域?qū)<遥篋atawhale,ApacheCN,AI 有道和黃海廣博士聯(lián)合整理貢獻(xiàn),內(nèi)容涵蓋 AI 入門基礎(chǔ)知識(shí)、數(shù)據(jù)分析\挖掘、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、前沿 Paper 和五大 AI 理論應(yīng)用領(lǐng)域:自然語言處理,計(jì)算機(jī)視覺,推薦系統(tǒng),風(fēng)控模型和知識(shí)圖譜。是你學(xué)習(xí) AI 從入門到專家必備的學(xué)習(xí)路線和優(yōu)質(zhì)學(xué)習(xí)資源。

    基礎(chǔ)知識(shí)

    1

    數(shù)學(xué)

    數(shù)學(xué)是學(xué)不完的,也沒有幾個(gè)人能像博士一樣扎實(shí)地學(xué)好數(shù)學(xué)基礎(chǔ),入門人工智能領(lǐng)域,其實(shí)只需要掌握必要的基礎(chǔ)知識(shí)就好。AI的數(shù)學(xué)基礎(chǔ)最主要是高等數(shù)學(xué)、線性代數(shù)、概率論與數(shù)理統(tǒng)計(jì)三門課程,這三門課程是本科必修的。這里整理了一個(gè)簡(jiǎn)易的數(shù)學(xué)入門文章:

    數(shù)學(xué)基礎(chǔ):高等數(shù)學(xué)

    https://zhuanlan.zhihu.com/p/36311622

    數(shù)學(xué)基礎(chǔ):線性代數(shù)

    https://zhuanlan.zhihu.com/p/36584206

    數(shù)學(xué)基礎(chǔ):概率論與數(shù)理統(tǒng)計(jì)

    https://zhuanlan.zhihu.com/p/36584335

    機(jī)器學(xué)習(xí)的數(shù)學(xué)基礎(chǔ)資料下載:

    1) 機(jī)器學(xué)習(xí)的數(shù)學(xué)基礎(chǔ).docx

    中文版,對(duì)高等數(shù)學(xué)、線性代數(shù)、概率論與數(shù)理統(tǒng)計(jì)三門課的公式做了總結(jié)。

    2) 斯坦福大學(xué)機(jī)器學(xué)習(xí)的數(shù)學(xué)基礎(chǔ).pdf

    原版英文材料,非常全面,建議英語好的同學(xué)直接學(xué)習(xí)這個(gè)材料。

    下載鏈接:

    https://pan.baidu.com/s/1LaUlrJzy98CG1Wma9FgBtg 提取碼: hktx

    國(guó)外經(jīng)典數(shù)學(xué)教材:

    相比國(guó)內(nèi)浙大版和同濟(jì)版的數(shù)學(xué)教材更加通俗易懂,深入淺出,便于初學(xué)者更好地奠定數(shù)學(xué)基礎(chǔ)。下載鏈接:

    https://blog.csdn.net/Datawhale/article/details/81744961

    2

    統(tǒng)計(jì)學(xué)

    入門教材:深入淺出統(tǒng)計(jì)學(xué)

    進(jìn)階教材:商務(wù)與經(jīng)濟(jì)統(tǒng)計(jì)

    推薦視頻:可汗學(xué)院統(tǒng)計(jì)學(xué)

    http://open.163.com/special/Khan/khstatistics.html

    3

    編程

    入門人工智能領(lǐng)域,首推Python這門編程語言。

    1) Python安裝:

    Python安裝包,我推薦下載Anaconda,Anaconda是一個(gè)用于科學(xué)計(jì)算的Python發(fā)行版,支持 Linux, Mac, Windows系統(tǒng),提供了包管理與環(huán)境管理的功能,可以很方便地解決多版本Python并存、切換以及各種第三方包安裝問題。

    下載地址:

    https://www.anaconda.com/download/

    推薦選Anaconda (python 3.7版本)

    IDE:推薦使用pycharm,社區(qū)版免費(fèi)

    下載地址:https://www.jetbrains.com/

    安裝教程:

    Anaconda+Jupyter notebook+Pycharm:

    https://zhuanlan.zhihu.com/p/59027692

    Ubuntu18.04深度學(xué)習(xí)環(huán)境配置(CUDA9+CUDNN7.4+TensorFlow1.8):

    https://zhuanlan.zhihu.com/p/50302396

    2) python入門的資料推薦

    a.廖雪峰python學(xué)習(xí)筆記

    https://blog.csdn.net/datawhale/article/category/7779959

    b.python入門筆記

    作者李金,這個(gè)是jupyter notebook文件,把python的主要語法演示了一次,值得推薦。下載鏈接:

    https://pan.baidu.com/s/1IPZI5rygbIh5R5OuTHajzA 提取碼: 2bzh

    c.南京大學(xué)python視頻教程

    這個(gè)教程非常值得推薦,python主要語法和常用的庫基本涵蓋了。

    查看地址:

    https://www.icourse163.org/course/0809NJU004-1001571005?from=study

    看完這三個(gè)資料后python基本達(dá)到入門水平,可以使用scikit-learn等機(jī)器學(xué)習(xí)庫來解決機(jī)器學(xué)習(xí)的問題了。

    3)補(bǔ)充

    代碼規(guī)范:

    https://zhuanlan.zhihu.com/p/59763076

    numpy練習(xí)題:

    https://zhuanlan.zhihu.com/p/57872490

    pandas練習(xí)題:

    https://zhuanlan.zhihu.com/p/56644669

    數(shù)據(jù)分析/挖掘

    1

    數(shù)據(jù)分析的基礎(chǔ)書籍

    《利用python進(jìn)行數(shù)據(jù)分析》

    這本書含有大量的實(shí)踐案例,你將學(xué)會(huì)如何利用各種Python庫(包括NumPy,Pandas、Matplotlib以及IPython等)高效地解決各式各樣的數(shù)據(jù)分析問題。如果把代碼都運(yùn)行一次,基本上就能解決數(shù)據(jù)分析的大部分問題了。

    2

    特征工程

    https://blog.csdn.net/Datawhale/article/details/83033869

    3

    數(shù)據(jù)挖掘項(xiàng)目

    https://blog.csdn.net/datawhale/article/details/80847662

    機(jī)器學(xué)習(xí)

    公開課

    吳恩達(dá)《Machine Learning》

    這絕對(duì)是機(jī)器學(xué)習(xí)入門的首選課程,沒有之一!即便你沒有扎實(shí)的機(jī)器學(xué)習(xí)所需的扎實(shí)的概率論、線性代數(shù)等數(shù)學(xué)基礎(chǔ),也能輕松上手這門機(jī)器學(xué)習(xí)入門課,并體會(huì)到機(jī)器學(xué)習(xí)的無窮趣味。

    課程主頁:

    https://www.coursera.org/learn/machine-learning

    中文視頻:

    網(wǎng)易云課堂搬運(yùn)了這門課,并由黃海廣等人翻譯了中文字幕。

    中文筆記及作業(yè)代碼:

    https://github.com/fengdu78/Coursera-ML-AndrewNg-Notes

    公開課

    吳恩達(dá) CS229

    吳恩達(dá)在斯坦福教授的機(jī)器學(xué)習(xí)課程 CS229 與 吳恩達(dá)在 Coursera 上的《Machine Learning》相似,但是有更多的數(shù)學(xué)要求和公式的推導(dǎo),難度稍難一些。該課程對(duì)機(jī)器學(xué)習(xí)和統(tǒng)計(jì)模式識(shí)別進(jìn)行了廣泛的介紹。

    課程主頁:

    http://cs229.stanford.edu/

    中文視頻:

    http://open.163.com/special/opencourse/machinelearning.html

    中文筆記:

    https://kivy-cn.github.io/Stanford-CS-229-CN/#/

    速查表:

    這份給力的資源貢獻(xiàn)者是一名斯坦福的畢業(yè)生 Shervine Amidi。作者整理了一份超級(jí)詳細(xì)的關(guān)于 CS229的速查表

    https://zhuanlan.zhihu.com/p/56534902

    作業(yè)代碼:

    https://github.com/Sierkinhane/CS229-ML-Implements

    公開課

    林軒田《機(jī)器學(xué)習(xí)基石》

    臺(tái)灣大學(xué)林軒田老師的《機(jī)器學(xué)習(xí)基石》課程由淺入深、內(nèi)容全面,基本涵蓋了機(jī)器學(xué)習(xí)領(lǐng)域的很多方面。其作為機(jī)器學(xué)習(xí)的入門和進(jìn)階資料非常適合。而且林老師的教學(xué)風(fēng)格也很幽默風(fēng)趣,總讓讀者在輕松愉快的氛圍中掌握知識(shí)。這門課比 Ng 的《Machine Learning》稍難一些,側(cè)重于機(jī)器學(xué)習(xí)理論知識(shí)。

    中文視頻:

    https://www.bilibili.com/video/av36731342

    中文筆記:

    https://redstonewill.com/category/ai-notes/lin-ml-foundations/

    配套教材

    配套書籍為《Learning From Data》,在線書籍主頁:http://amlbook.com/

    公開課

    林軒田《機(jī)器學(xué)習(xí)技法》

    《機(jī)器學(xué)習(xí)技法》課程是《機(jī)器學(xué)習(xí)基石》的進(jìn)階課程。主要介紹了機(jī)器學(xué)習(xí)領(lǐng)域經(jīng)典的一些算法,包括支持向量機(jī)、決策樹、隨機(jī)森林、神經(jīng)網(wǎng)絡(luò)等等。難度要略高于《機(jī)器學(xué)習(xí)基石》,具有很強(qiáng)的實(shí)用性。

    中文視頻:

    https://www.bilibili.com/video/av36760800

    中文筆記:

    https://redstonewill.com/category/ai-notes/lin-ml-techniques/

    書籍

    《機(jī)器學(xué)習(xí)》

    周志華的《機(jī)器學(xué)習(xí)》被大家親切地稱為“西瓜書”。這本書非常經(jīng)典,講述了機(jī)器學(xué)習(xí)核心數(shù)學(xué)理論和算法,適合有作為學(xué)校的教材或者中階讀者自學(xué)使用,入門時(shí)學(xué)習(xí)這本書籍難度稍微偏高了一些。

    配合《機(jī)器學(xué)習(xí)實(shí)戰(zhàn)》一起學(xué)習(xí),效果更好!

    讀書筆記:

    https://www.cnblogs.com/limitlessun/p/8505647.html#_label0

    公式推導(dǎo):

    https://datawhalechina.github.io/pumpkin-book/#/

    課后習(xí)題:

    https://zhuanlan.zhihu.com/c_1013850291887845376

    書籍

    《統(tǒng)計(jì)學(xué)習(xí)方法》

    李航的這本《統(tǒng)計(jì)學(xué)習(xí)方法》堪稱經(jīng)典,包含更加完備和專業(yè)的機(jī)器學(xué)習(xí)理論知識(shí),作為夯實(shí)理論非常不錯(cuò)。

    講課 PPT:

    https://github.com/fengdu78/lihang-code/tree/master/ppt

    讀書筆記:

    http://www.cnblogs.com/limitlessun/p/8611103.html

    https://github.com/SmirkCao/Lihang

    參考筆記:

    https://zhuanlan.zhihu.com/p/36378498

    代碼實(shí)現(xiàn):

    https://github.com/fengdu78/lihang-code/tree/master/code

    書籍

    《Scikit-Learn 與 TensorFlow 機(jī)器學(xué)習(xí)實(shí)用指南》

    在經(jīng)過前面的學(xué)習(xí)之后,這本《Scikit-Learn 與 TensorFlow 機(jī)器學(xué)習(xí)實(shí)用指南》非常適合提升你的機(jī)器學(xué)習(xí)實(shí)戰(zhàn)編程能力。

    這本書分為兩大部分,第一部分介紹機(jī)器學(xué)習(xí)基礎(chǔ)算法,每章都配備 Scikit-Learn 實(shí)操項(xiàng)目;第二部分介紹神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí),每章配備 TensorFlow 實(shí)操項(xiàng)目。如果只是機(jī)器學(xué)習(xí),可先看第一部分的內(nèi)容。

    全書代碼:

    https://github.com/ageron/handson-ml

    實(shí)戰(zhàn)

    Kaggle 比賽

    比賽是提升自己機(jī)器學(xué)習(xí)實(shí)戰(zhàn)能力的最有效的方式,首選 Kaggle 比賽。

    Kaggle 主頁:

    https://www.kaggle.com/

    Kaggle 路線:

    https://github.com/apachecn/kaggle

    工具

    Scikit-Learn 官方文檔

    Scikit-Learn 作為機(jī)器學(xué)習(xí)一個(gè)非常全面的庫,是一份不可多得的實(shí)戰(zhàn)編程手冊(cè)。

    官方文檔:

    https://scikit-learn.org/stable/index.html

    中文文檔(0.19):

    http://sklearn.apachecn.org/#/

    深度學(xué)習(xí)

    公開課

    吳恩達(dá)《Deep Learning》

    在吳恩達(dá)開設(shè)了機(jī)器學(xué)習(xí)課程之后,發(fā)布的《Deep Learning》課程也備受好評(píng),吳恩達(dá)老師的課程最大的特點(diǎn)就是將知識(shí)循序漸進(jìn)的傳授給你,是入門學(xué)習(xí)不可多得良好視頻資料。

    整個(gè)專題共包括五門課程:01.神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí);02.改善深層神經(jīng)網(wǎng)絡(luò)-超參數(shù)調(diào)試、正則化以及優(yōu)化;03.結(jié)構(gòu)化機(jī)器學(xué)習(xí)項(xiàng)目;04.卷積神經(jīng)網(wǎng)絡(luò);05.序列模型。

    課程視頻

    網(wǎng)易云課堂:

    https://mooc.study.163.com/university/deeplearning_ai#/c

    Coursera:

    https://www.coursera.org/specializations/deep-learning

    課程筆記

    之前編寫過吳恩達(dá)老師機(jī)器學(xué)習(xí)個(gè)人筆記黃海廣博士帶領(lǐng)團(tuán)隊(duì)整理了中文筆記:

    https://github.com/fengdu78/deeplearning_ai_books

    參考論文

    吳恩達(dá)老師在課程中提到了很多優(yōu)秀論文,黃海廣博士整理如下:

    https://github.com/fengdu78/deeplearning_ai_books/tree/master/%E5%8F%82%E8%80%83%E8%AE%BA%E6%96%87

    課程PPT及課后作業(yè)

    吳恩達(dá)深度學(xué)習(xí)課程,包含課程的課件、課后作業(yè)和一些其他資料:

    https://github.com/stormstone/deeplearning.ai

    公開課

    Fast.ai《程序員深度學(xué)習(xí)實(shí)戰(zhàn)》

    說到深度學(xué)習(xí)的公開課,與吳恩達(dá)《Deep Learning》并駕齊驅(qū)的另一門公開課便是由Fast.ai出品的《程序員深度學(xué)習(xí)實(shí)戰(zhàn)》。這門課最大的特點(diǎn)便是“自上而下”而不是“自下而上”,是絕佳的通過實(shí)戰(zhàn)學(xué)習(xí)深度學(xué)習(xí)的課程。

    視頻地址

    B站地址(英文字幕):

    https://www.bilibili.com/video/av18904696?from=search&seid=10813837536595120136

    CSDN地址(2017版中文字幕):

    https://edu.csdn.net/course/detail/5192

    課程筆記

    英文筆記原文:

    https://medium.com/@hiromi_suenaga/deep-learning-2-part-1-lesson-1-602f73869197

    由ApacheCN組織的中文翻譯:

    https://github.com/apachecn/fastai-ml-dl-notes-zh

    公開課

    CS230 Deep Learning

    斯坦福的深度學(xué)習(xí)課程CS230在4月2日剛剛開課,對(duì)應(yīng)的全套PPT也隨之上線。從內(nèi)容來看,今年的課程與去年的差別不大,涵蓋了CNNs, RNNs, LSTM, Adam, Dropout, BatchNorm, Xavier/He initialization 等深度學(xué)習(xí)的基本模型,涉及醫(yī)療、自動(dòng)駕駛、手語識(shí)別、音樂生成和自然語言處理等領(lǐng)域。

    Datawhale整理了該門課程的詳細(xì)介紹及參考資料:

    吳恩達(dá)CS230深度學(xué)習(xí)開課了!視頻配套PPT應(yīng)有盡有

    書籍

    神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí) - 復(fù)旦邱錫鵬

    本書是入門深度學(xué)習(xí)領(lǐng)域的極佳教材,主要介紹了神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)中的基礎(chǔ)知識(shí)、主要模型(前饋網(wǎng)絡(luò)、卷積網(wǎng)絡(luò)、循環(huán)網(wǎng)絡(luò)等)以及在計(jì)算機(jī)視覺、自然語言處理等領(lǐng)域的應(yīng)用。

    復(fù)旦教授邱錫鵬開源發(fā)布《神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)》

    書籍

    《深度學(xué)習(xí)》

    完成以上學(xué)習(xí)后,想要更加系統(tǒng)的建立深度學(xué)習(xí)的知識(shí)體系,閱讀《深度學(xué)習(xí)》準(zhǔn)沒錯(cuò)。該書從淺入深介紹了基礎(chǔ)數(shù)學(xué)知識(shí)、機(jī)器學(xué)習(xí)經(jīng)驗(yàn)以及現(xiàn)階段深度學(xué)習(xí)的理論和發(fā)展,它能幫助人工智能技術(shù)愛好者和從業(yè)人員在三位專家學(xué)者的思維帶領(lǐng)下全方位了解深度學(xué)習(xí)。

    書籍介紹

    《深度學(xué)習(xí)》通常又被稱為花書,深度學(xué)習(xí)領(lǐng)域最經(jīng)典的暢銷書。由全球知名的三位專家IanGoodfellow、YoshuaBengio和AaronCourville撰寫,是深度學(xué)習(xí)領(lǐng)域奠基性的經(jīng)典教材。該書被大眾尊稱為“AI圣經(jīng)”。

    在線閱讀

    該書由眾多網(wǎng)友眾包翻譯,電子版在以下地址獲得:

    https://github.com/exacity/deeplearningbook-chinese

    書籍

    《深度學(xué)習(xí) 500 問》

    當(dāng)你看完了所有的視頻,研習(xí)了AI圣經(jīng),一定充滿了滿腦子問號(hào),此時(shí)不如來深度學(xué)習(xí)面試中常見的500個(gè)問題。

    書籍介紹

    DeepLearning-500-questions,作者是川大的一名優(yōu)秀畢業(yè)生談繼勇。該項(xiàng)目以深度學(xué)習(xí)面試問答形式,收集了 500 個(gè)問題和答案。內(nèi)容涉及了常用的概率知識(shí)、線性代數(shù)、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、計(jì)算機(jī)視覺等熱點(diǎn)問題,該書目前尚未完結(jié),卻已經(jīng)收獲了Github 2.4w stars。

    項(xiàng)目地址:

    https://github.com/scutan90/DeepLearning-500-questions

    工具

    TensorFlow 官方文檔

    學(xué)深度學(xué)習(xí)一定離不開TensorFlow

    官方文檔:

    https://www.tensorflow.org/api_docs/python/tf

    中文文檔:

    https://github.com/jikexueyuanwiki/tensorflow-zh

    工具

    PyTorch官方文檔

    PyTorch是學(xué)深度學(xué)習(xí)的另一個(gè)主流框架

    官方文檔:

    https://pytorch.org/docs/stable/index.html

    中文文檔(版本0.3):

    https://github.com/apachecn/pytorch-doc-zh

    強(qiáng)化學(xué)習(xí)

    公開課

    Reinforcement Learning-David Silver

    與吳恩達(dá)的課程對(duì)于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)初學(xué)者的意義相同,David Silver的這門課程絕對(duì)是大多數(shù)人學(xué)習(xí)強(qiáng)化學(xué)習(xí)必選的課程。

    課程從淺到深,把強(qiáng)化學(xué)習(xí)的內(nèi)容娓娓道來,極其詳盡。不過由于強(qiáng)化學(xué)習(xí)本身的難度,聽講這門課還是有一定的門檻,建議還是在大致了解這個(gè)領(lǐng)域之后觀看該視頻學(xué)習(xí)效果更佳,更容易找到學(xué)習(xí)的重點(diǎn)。

    視頻地址

    B站地址(中文字幕):

    https://www.bilibili.com/video/av45357759?from=search&seid=9547815852611563503

    課程原地址:

    https://www.youtube.com/watch?v=2pWv7GOvuf0

    課程資料

    課程PPT:

    http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching.html

    課程筆記:

    https://www.zhihu.com/people/qqiang00/posts

    公開課

    李宏毅《深度強(qiáng)化學(xué)習(xí)》

    David Silver的課程雖然內(nèi)容詳盡,但前沿的很多內(nèi)容都沒有被包括在內(nèi),這時(shí),臺(tái)大李宏毅的《深度強(qiáng)化學(xué)習(xí)》就是學(xué)習(xí)前沿動(dòng)態(tài)的不二之選。

    視頻地址

    B站地址(中文字幕):

    https://www.bilibili.com/video/av24724071?from=search&seid=9547815852611563503

    課程原地址:

    https://www.youtube.com/watch?v=2pWv7GOvuf0

    課程資料

    課程PPT:

    http://speech.ee.ntu.edu.tw/~tlkagk/courses_MLDS18.html

    課程筆記:

    https://blog.csdn.net/cindy_1102/article/details/87905272

    前沿Paper

    1

    Arxiv

    Arxiv Stats

    Arxiv 機(jī)器學(xué)習(xí)最新論文檢索主頁地址:

    https://arxiv.org/list/stat.ML/recent?ref=bestofml.com

    Arxiv Sanity Preserver

    Andrej Karpathy 開發(fā)了 Arxiv Sanity Preserver,幫助分類、搜索和過濾特征

    主頁地址:

    http://www.arxiv-sanity.com/?ref=bestofml.com

    2

    Papers with Code

    Papers with Code(Browse state-of-the-art)

    這個(gè)網(wǎng)站叫做 Browse state-of-the-art。它將 ArXiv 上的最新深度學(xué)習(xí)論文與 GitHub 上的開源代碼聯(lián)系起來。該項(xiàng)目目前包含了 651 個(gè)排行榜,1016 個(gè)深度學(xué)習(xí)任務(wù),795 個(gè)數(shù)據(jù)集,以及重磅的 10257 個(gè)含復(fù)現(xiàn)代碼的優(yōu)秀論文。簡(jiǎn)直就是一個(gè)尋找論文和代碼的利器。它將 1016 個(gè)深度學(xué)習(xí)任務(wù)分成了 16 大類,涉及了深度學(xué)習(xí)的各個(gè)方面。

    主頁地址:

    https://paperswithcode.com/sota

    舉兩個(gè)例子:

    CV:

    https://paperswithcode.com/area/computer-vision

    NLP:

    https://paperswithcode.com/area/natural-language-processing

    Papers with Code(Sorted by stars)

    這份資源收集了 AI 領(lǐng)域從 2013 - 2018 年所有的論文,并按照在 GitHub 上的標(biāo)星數(shù)量進(jìn)行排序。

    GitHub 項(xiàng)目地址:

    https://github.com/zziz/pwc

    3

    Deep Learning Papers 閱讀路線

    如果你是深度學(xué)習(xí)領(lǐng)域的新手,你可能會(huì)遇到的第一個(gè)問題是“我應(yīng)該從哪篇論文開始閱讀?”下面是一個(gè)深入學(xué)習(xí)論文的閱讀路線圖!

    GitHub 項(xiàng)目地址:

    https://github.com/floodsung/Deep-Learning-Papers-Reading-Roadmap

    這份深度學(xué)習(xí)論文閱讀路線分為三大塊:

    1 Deep Learning History and Basics

    2 Deep Learning Method

    3 Applications

    4

    Deep Learning Object Detection

    目標(biāo)檢測(cè)(Object Detection)是深度學(xué)習(xí) CV 領(lǐng)域的一個(gè)核心研究領(lǐng)域和重要分支。縱觀 2013 年到 2019 年,從最早的

    R-CNN

    、Fast R-CNN 到后來的 YOLO v2、YOLO v3 再到今年的 M2Det,新模型層出不窮,性能也越來越好!

    本資源對(duì)目標(biāo)檢測(cè)近幾年的發(fā)展和相關(guān)論文做出一份系統(tǒng)介紹,總結(jié)一份超全的文獻(xiàn) paper 列表。

    GitHub 項(xiàng)目地址:

    https://github.com/hoya012/deep_learning_object_detection

    5

    知名會(huì)議

    會(huì)議

    NeurIPS:https://nips.cc/

    ICML:https://icml.cc/

    ICLR:https://iclr.cc/

    AAAI:https://aaai.org/Conferences/AAAI-19/

    IJCAI:https://www.ijcai.org/

    UAI:http://www.auai.org/uai2019/index.php

    計(jì)算機(jī)視覺:

    CVPR:http://cvpr2019.thecvf.com/

    ECCV:https://eccv2018.org/program/main-conference/

    ICCV:http://iccv2019.thecvf.com/

    自然語言處理:

    ACL:http://www.aclcargo.com/

    EMNLP:https://www.aclweb.org/portal/content/emnlp-2018

    NAACL:https://naacl2019.org/

    知名期刊:

    JAIR:https://www.jair.org/index.php/jair

    JMLR:http://www.jmlr.org/

    其它

    機(jī)器人方面,有 CoRL(學(xué)習(xí))、ICAPS(規(guī)劃,包括但不限于機(jī)器人)、ICRA、IROS、RSS;

    對(duì)于更理論性的研究,有 AISTATS、COLT、KDD。

    理論應(yīng)用

    自然語言處理

    1

    NLP是什么

    自然語言處理(NLP,Natural Language Processing)是研究計(jì)算機(jī)處理人類語言的一門技術(shù),目的是彌補(bǔ)人類交流(自然語言)和計(jì)算機(jī)理解(機(jī)器語言)之間的差距。NLP包含句法語義分析、信息抽取、文本挖掘、

    機(jī)器翻譯

    、信息檢索、問答系統(tǒng)

    和對(duì)話系統(tǒng)等領(lǐng)域。

    2

    課程推薦

    CS224n 斯坦福深度自然語言處理課

    17版中文字幕:

    https://www.bilibili.com/video/av41393758/?p=1

    課程筆記:

    http://www.hankcs.com/?s=CS224n%E7%AC%94%E8%AE%B0

    2019版課程主頁:

    http://web.stanford.edu/class/cs224n/

    自然語言處理 - Dan Jurafsky 和 Chris Manning

    B站英文字幕版:

    https://www.bilibili.com/video/av35805262/

    學(xué)術(shù)激流網(wǎng):

    http://academictorrents.com/details/d2c8f8f1651740520b7dfab23438d89bc8c0c0ab

    3

    書籍推薦

    Python自然語言處理

    入門讀物,整本書不僅涉及了語料庫的操作,也對(duì)傳統(tǒng)的基于規(guī)則的方法有所涉及。全書包括了分詞(tokenization)、詞性標(biāo)注(POS)、語塊(Chunk)標(biāo)注、句法剖析與語義剖析等方面,是nlp中不錯(cuò)的一本實(shí)用教程。

    自然語言處理綜論

    By Daniel Jurafsky和James H. Martin

    本書十分權(quán)威,是經(jīng)典的NLP教科書,涵蓋了經(jīng)典自然語言處理、統(tǒng)計(jì)自然語言處理、語音識(shí)別和計(jì)算語言學(xué)等方面。

    統(tǒng)計(jì)自然語言處理基礎(chǔ)

    By Chris Manning和HinrichSchütze

    更高級(jí)的統(tǒng)計(jì)NLP方法,在統(tǒng)計(jì)基本部分和n元語法部分介紹得都很不錯(cuò)。

    4

    博客推薦

    我愛自然語言處理

    地址:http://www.52nlp.cn/

    TFIDF、文檔相似度等等在這個(gè)網(wǎng)站上都有通俗易懂的解釋

    語言日志博客(Mark Liberman)

    地址:

    http://languagelog.ldc.upenn.edu/nll/

    natural language processing blog

    地址:https://nlpers.blogspot.com/

    美國(guó)Hal Daumé III維護(hù)的一個(gè)natural language processing的 博客,經(jīng)常評(píng)論最新學(xué)術(shù)動(dòng)態(tài),值得關(guān)注。有關(guān)于ACL、NAACL等學(xué)術(shù)會(huì)議的參會(huì)感想和對(duì)論文的點(diǎn)評(píng)

    5

    項(xiàng)目推薦

    基于LSTM的中文問答系統(tǒng)

    https://github.com/S-H-Y-GitHub/QA

    基于RNN的文本生成器

    https://github.com/karpathy/char-rnn

    基于char-rnn的汪峰歌詞生成器

    https://github.com/phunterlau/wangfeng-rnn

    用RNN生成手寫數(shù)字

    https://github.com/skaae/lasagne-draw

    6

    開源NLP工具包

    中文NLP相關(guān):https://github.com/crownpku/Awesome-Chinese-NLP

    英文NLP相關(guān):

    NLTK: http://www.nltk.org/

    TextBlob: http://textblob.readthedocs.org/en/dev/

    Gensim: http://radimrehurek.com/gensim/

    Pattern: http://www.clips.ua.ac.be/pattern

    Spacy: http://spacy.io

    Orange: http://orange.biolab.si/features/

    Pineapple: https://github.com/proycon/pynlpl

    7

    相關(guān)論文

    100 Must-Read NLP Papers

    https://github.com/mhagiwara/100-nlp-papers

    計(jì)算機(jī)視覺

    1

    計(jì)算機(jī)視覺的應(yīng)用

    計(jì)算機(jī)視覺的應(yīng)用

    無人駕駛

    無人安防

    人臉識(shí)別

    車輛車牌識(shí)別

    以圖搜圖

    VR/AR

    3D重構(gòu)

    無人機(jī)

    醫(yī)學(xué)圖像分析

    其他

    2

    課程推薦

    Stanford CS223B

    比較適合基礎(chǔ),適合剛剛?cè)腴T的同學(xué),跟深度學(xué)習(xí)的結(jié)合相對(duì)來說會(huì)少一點(diǎn),不會(huì)整門課講深度學(xué)習(xí),而是主要講計(jì)算機(jī)視覺,方方面面都會(huì)講到

    李飛飛:CS231n課程:

    https://mp.weixin.qq.com/s/-NaDpXsxvu4DpXqVNXIAvQ

    3

    書籍推薦

    1.入門學(xué)習(xí):

    《Computer Vision:Models, Learning and Inference》

    2.經(jīng)典權(quán)威的參考資料:

    《Computer Vision:Algorithms and Applications》

    3.理論實(shí)踐:

    《OpenCV3編程入門》

    推薦系統(tǒng)

    1

    推薦系統(tǒng)是什么

    推薦系統(tǒng)就是自動(dòng)聯(lián)系用戶和物品的一種工具,它能夠在信息過載的環(huán)境中幫助用戶發(fā)現(xiàn)令他們感興趣的信息,也能將信息推送給對(duì)它們感興趣的用戶。推薦系統(tǒng)屬于資訊過濾的一種應(yīng)用。

    2

    推薦課程

    推薦系統(tǒng)專項(xiàng)課程《Recommender Systems Specialization》

    這個(gè)系列由4門子課程和1門畢業(yè)項(xiàng)目課程組成,包括推薦系統(tǒng)導(dǎo)論,最近鄰協(xié)同過濾,推薦系統(tǒng)評(píng)價(jià),矩陣分解和高級(jí)技術(shù)等。

    觀看地址:

    https://www.coursera.org/specializations/recommender-systems

    3

    書籍推薦

    《推薦系統(tǒng)實(shí)踐》(項(xiàng)亮 著)

    《推薦系統(tǒng)》(Dietmar Jannach等 著,蔣凡 譯)

    《用戶網(wǎng)絡(luò)行為畫像》(牛溫佳等 著)

    《Recommender Systems Handbook》(Paul B·Kantor等 著)

    4

    算法庫

    LibRec

    LibRec是一個(gè)Java版本的覆蓋了70余個(gè)各類型推薦算法的推薦系統(tǒng)開源算法庫,由國(guó)內(nèi)的推薦系統(tǒng)大牛郭貴冰創(chuàng)辦,目前已更新到2.0版本,它有效地解決了評(píng)分預(yù)測(cè)和物品推薦兩大關(guān)鍵的推薦問題。

    項(xiàng)目地址: https://github.com/guoguibing/librec

    官網(wǎng)地址: https://www.librec.net/

    LibMF

    C++版本開源推薦系統(tǒng),主要實(shí)現(xiàn)了基于矩陣分解的推薦系統(tǒng)。針對(duì)SGD(隨即梯度下降)優(yōu)化方法在并行計(jì)算中存在的 locking problem 和 memory discontinuity問題,提出了一種 矩陣分解的高效算法FPSGD(Fast Parallel SGD),根據(jù)計(jì)算節(jié)點(diǎn)的個(gè)數(shù)來劃分評(píng)分矩陣block,并分配計(jì)算節(jié)點(diǎn)。

    項(xiàng)目地址:

    http://www.csie.ntu.edu.tw/~cjlin/libmf/

    SurPRISE

    一個(gè)Python版本的開源推薦系統(tǒng),有多種經(jīng)典推薦算法

    項(xiàng)目地址:http://surpriselib.com/

    Neural Collaborative Filtering

    神經(jīng)協(xié)同過濾推薦算法的Python實(shí)現(xiàn)

    項(xiàng)目地址:

    https://github.com/hexiangnan/neural_collaborative_filtering

    Crab

    基于Python開發(fā)的開源推薦軟件,其中實(shí)現(xiàn)有item和user的協(xié)同過濾

    項(xiàng)目地址:http://muricoca.github.io/crab/

    5

    常用數(shù)據(jù)集

    MovieLen

    https://grouplens.org/datasets/movielens/

    MovieLens數(shù)據(jù)集中,用戶對(duì)自己看過的電影進(jìn)行評(píng)分,分值為1~5。MovieLens包括兩個(gè)不同大小的庫,適用于不同規(guī)模的算法。小規(guī)模的庫是943個(gè)獨(dú)立用戶對(duì)1 682部電影作的10 000次評(píng)分的數(shù)據(jù);大規(guī)模的庫是6 040個(gè)獨(dú)立用戶對(duì)3 900部電影作的大約100萬次評(píng)分。適用于傳統(tǒng)的推薦任務(wù)

    Douban

    https://www.cse.cuhk.edu.hk/irwin.king.new/pub/data/douban

    Douban是豆瓣的匿名數(shù)據(jù)集,它包含了12萬用戶和5萬條電影數(shù)據(jù),是用戶對(duì)電影的評(píng)分信息和用戶間的社交信息,適用于社會(huì)化推薦任務(wù)。

    BookCrossing

    http://www2.informatik.uni-freiburg.de/~cziegler/BX/

    這個(gè)數(shù)據(jù)集是網(wǎng)上的Book-Crossing圖書社區(qū)的278858個(gè)用戶對(duì)271379本書進(jìn)行的評(píng)分,包括顯式和隱式的評(píng)分。這些用戶的年齡等人口統(tǒng)計(jì)學(xué)屬性(demographic feature)都以匿名的形式保存并供分析。這個(gè)數(shù)據(jù)集是由Cai-Nicolas Ziegler使用爬蟲程序在2004年從Book-Crossing圖書社區(qū)上采集的。

    6

    推薦論文

    經(jīng)典必讀論文整理,包括綜述文章、傳統(tǒng)經(jīng)典推薦文章、社會(huì)化推薦文章、基于深度學(xué)習(xí)的推薦系統(tǒng)文章、專門用于解決冷啟動(dòng)的文章、POI相關(guān)的論文、利用哈希技術(shù)來加速推薦的文章以及推薦系統(tǒng)中經(jīng)典的探索與利用問題的相關(guān)文章等。

    項(xiàng)目地址:

    https://github.com/hongleizhang/RSPapers

    7

    推薦項(xiàng)目

    1.推薦系統(tǒng)機(jī)制介紹,面向內(nèi)容創(chuàng)作者。分享人:項(xiàng)亮,推薦算法架構(gòu)師:

    https://v.qq.com/x/page/f0800qavik7.html?

    2. 3分鐘了解推薦系統(tǒng)原理

    https://v.qq.com/x/page/g05349lb80j.html?

    3.facebook是如何為十億人推薦好友的

    https://code.facebook.com/posts/861999383875667/recommending-items-to-more-than-a-billion-people/

    4.Netflix的個(gè)性化和推薦系統(tǒng)架構(gòu)

    http://techblog.netflix.com/2013/03/system-architectures-for.html

    風(fēng)控模型(評(píng)分卡模型)

    1

    評(píng)分卡模型簡(jiǎn)介

    評(píng)分卡模型時(shí)在銀行、互金等公司與借貸相關(guān)業(yè)務(wù)中最常見也是最重要的模型之一。簡(jiǎn)而言之它的作用就是對(duì)客戶進(jìn)行打分,來對(duì)客戶是否優(yōu)質(zhì)進(jìn)行評(píng)判。

    根據(jù)評(píng)分卡模型應(yīng)用的業(yè)務(wù)階段不用,評(píng)分卡模型主要分為三大類:A卡(Application score card)申請(qǐng)?jiān)u分卡、B卡(Behavior score card)行為評(píng)分卡、C卡(Collection score card)催收評(píng)分卡。其中申請(qǐng)?jiān)u分卡用于貸前,行為評(píng)分卡用于貸中,催收評(píng)分卡用于貸后,這三種評(píng)分卡在我們的信貸業(yè)務(wù)的整個(gè)生命周期都至關(guān)重要。

    2

    推薦書籍

    《信用風(fēng)險(xiǎn)評(píng)分卡研究——基于SAS的開發(fā)與實(shí)施》

    3

    評(píng)分卡模型建模過程

    樣本選取

    確定訓(xùn)練樣本、測(cè)試樣本的觀察窗(特征的時(shí)間跨度)與表現(xiàn)窗(標(biāo)簽的時(shí)間跨度),且樣本的標(biāo)簽定義是什么?一般情況下風(fēng)險(xiǎn)評(píng)分卡的標(biāo)簽都是考慮客戶某一段時(shí)間內(nèi)的延滯情況。

    特征準(zhǔn)備

    原始特征、衍生變量

    數(shù)據(jù)清洗

    根據(jù)業(yè)務(wù)需求對(duì)缺失值或異常值等進(jìn)行處理

    特征篩選

    根據(jù)特征的IV值(特征對(duì)模型的貢獻(xiàn)度)、PSI(特征的穩(wěn)定性)來進(jìn)行特征篩選,IV值越大越好(但是一個(gè)特征的IV值超過一定閾值可能要考慮是否用到未來數(shù)據(jù)),PSI越小越好(一般建模時(shí)取特征的PSI小于等于0.01)

    對(duì)特征進(jìn)行WOE轉(zhuǎn)換

    即對(duì)特征進(jìn)行分箱操作,注意在進(jìn)行WOE轉(zhuǎn)換時(shí)要注重特征的可解釋性

    建立模型

    在建立模型過程中可根據(jù)模型和變量的統(tǒng)計(jì)量判斷模型中包含和不包含每個(gè)變量時(shí)的模型質(zhì)量來進(jìn)行變量的二次篩選。

    評(píng)分指標(biāo)

    評(píng)分卡模型一般關(guān)注的指標(biāo)是KS值(衡量的是好壞樣本累計(jì)分部之間的差值)、模型的PSI(即模型整體的穩(wěn)定性)、AUC值等。

    知識(shí)圖譜

    1

    知識(shí)圖譜是什么

    知識(shí)圖譜是一種結(jié)構(gòu)化數(shù)據(jù)的處理方法,它涉及知識(shí)的提取、表示、存儲(chǔ)、檢索等一系列技術(shù)。從淵源上講,它是知識(shí)表示與推理、數(shù)據(jù)庫、信息檢索、自然語言處理等多種技術(shù)發(fā)展的融合。

    2

    推薦資料

    為什么需要知識(shí)圖譜?什么是知識(shí)圖譜?——KG的前世今生

    https://zhuanlan.zhihu.com/p/31726910

    什么是知識(shí)圖譜?

    https://zhuanlan.zhihu.com/p/34393554

    智能搜索時(shí)代:知識(shí)圖譜有何價(jià)值?

    https://zhuanlan.zhihu.com/p/35982177?from=1084395010&wm=9848_0009&weiboauthoruid=5249689143

    百度王海峰:知識(shí)圖譜是 AI 的基石

    http://www.infoq.com/cn/news/2017/11/Knowledge-map-cornerstone-AI#0-tsina-1-5001-397232819ff9a47a7b7e80a40613cfe1

    譯文|從知識(shí)抽取到RDF知識(shí)圖譜可視化

    http://rdc.hundsun.com/portal/article/907.html?hmsr=toutiao.io&utm_medium=toutiao.io&utm_source=toutiao.io

    3

    主要內(nèi)容

    3.1 知識(shí)提取

    構(gòu)建kg首先需要解決的是數(shù)據(jù),知識(shí)提取是要解決結(jié)構(gòu)化數(shù)據(jù)生成的問題。我們可以用自然語言處理的方法,也可以利用規(guī)則。

    3.1.1 使用規(guī)則

    正則表達(dá)式

    正則表達(dá)式(Regular Expression, regex)是字符串處 理的基本功。數(shù)據(jù)爬取、數(shù)據(jù)清洗、實(shí)體提取、關(guān)系提取,都離不開regex。

    推薦資料入門:

    精通正則表達(dá)式

    regexper 可視化:例 [a-z]*(\d{4}(\D+))

    pythex 在線測(cè)試正則表達(dá)式:

    http://pythex.org/

    推薦資料進(jìn)階:

    re2 :

    Python wrapper for Google's RE2 using Cython

    https://pypi.python.org/pypi/re2/

    Parsley :更人性化的正則表達(dá)語法

    http://parsley.readthedocs.io/en/latest/tutorial.html

    中文分詞和詞性標(biāo)注

    分詞也是后續(xù)所有處理的基礎(chǔ),詞性(Part of Speech, POS)就是中學(xué)大家學(xué)過的動(dòng)詞、名詞、形容詞等等的詞的分類。一般的分詞工具都會(huì)有詞性標(biāo)注的選項(xiàng)。

    推薦資料入門:

    jieba 中文分詞包

    https://github.com/fxsjy/jieba

    中文詞性標(biāo)記集

    https://github.com/memect/kg-beijing/wiki/

    推薦資料進(jìn)階:

    genius 采用 CRF條件隨機(jī)場(chǎng)算法

    https://github.com/duanhongyi/genius

    Stanford CoreNLP分詞

    https://blog.csdn.net/guolindonggld/article/details/72795022

    命名實(shí)體識(shí)別

    命名實(shí)體識(shí)別(NER)是信息提取應(yīng)用領(lǐng)域的重要基礎(chǔ)工具,一般來說,命名實(shí)體識(shí)別的任務(wù)就是識(shí)別出待處理文本中三大類(實(shí)體類、時(shí)間類和數(shù)字類)、七小類(人名、機(jī)構(gòu)名、地名、時(shí)間、日期、貨幣和百分比)命名實(shí)體。

    推薦資料:

    Stanford CoreNLP 進(jìn)行中文命名實(shí)體識(shí)別

    https://blog.csdn.net/guolindonggld/article/details/72795022

    3.1.2 使用深度學(xué)習(xí)

    使用自然語言處理的方法,一般是給定schema,從非結(jié)構(gòu)化數(shù)據(jù)中抽取特定領(lǐng)域的三元組(spo),如最近百度舉辦的比賽就是使用DL模型進(jìn)行信息抽取。

    序列標(biāo)注

    使用序列生出模型,主要是標(biāo)記出三元組中subject及object的起始位置,從而抽取信息。

    推薦資料:

    序列標(biāo)注問題

    https://www.cnblogs.com/jiangxinyang/p/9368482.html

    seq2seq

    使用seq2seq端到端的模型,主要借鑒文本摘要的思想,將三元組看成是非結(jié)構(gòu)化文本的摘要,從而進(jìn)行抽取,其中還涉及Attention機(jī)制。

    推薦資料:

    seq2seq詳解

    https://blog.csdn.net/irving_zhang/article/details/78889364

    詳解從Seq2Seq模型到Attention模型

    https://caicai.science/2018/10/06/attention%E6%80%BB%E8%A7%88/

    3.2 知識(shí)表示

    知識(shí)表示(Knowledge Representation,KR,也譯為知識(shí)表現(xiàn))是研究如何將結(jié)構(gòu)化數(shù)據(jù)組織,以便于機(jī)器處理和人的理解的方法。

    需要熟悉下面內(nèi)容:

    JSON和YAML

    json庫:

    https://docs.python.org/2/library/json.html

    PyYAML: 是Python里的Yaml處理庫

    http://pyyaml.org/wiki/PyYAML

    RDF和OWL語義:

    http://blog.memect.cn/?p=871

    JSON-LD

    主頁:http://json-ld.org/

    3.3 知識(shí)存儲(chǔ)

    需要熟悉常見的圖數(shù)據(jù)庫

    a.知識(shí)鏈接的方式:字符串、外鍵、URI

    b.PostgreSQL及其JSON擴(kuò)展

    Psycopg包操作PostgreSQL

    http://initd.org/psycopg/docs/

    c.圖數(shù)據(jù)庫 Neo4j和OrientDB

    1.Neo4j的Python接口 https://neo4j.com/developer/python/

    2.OrientDB:http://orientdb.com/orientdb/

    d.RDF數(shù)據(jù)庫Stardog

    Stardog官網(wǎng):http://stardog.com/

    3.4 知識(shí)檢索

    需要熟悉常見的檢索技術(shù)

    ElasticSearch教程:

    http://joelabrahamsson.com/elasticsearch-101/

    4

    相關(guān)術(shù)語及技術(shù)路線

    本體:

    https://www.zhihu.com/question/19558514

    RDF:

    https://www.w3.org/RDF/

    Apache Jena:

    https://jena.apache.org/

    D2RQ:

    http://d2rq.org/getting-started

    4.1 Protege構(gòu)建本體系列

    protege:

    https://protege.stanford.edu/

    protege使用:

    https://zhuanlan.zhihu.com/p/32389370

    4.2 開發(fā)語言

    python或java

    4.3 圖數(shù)據(jù)庫技術(shù)

    Neo4j:https://neo4j.com/

    AllegroGraph:https://franz.com/agraph/allegrograph/

    4.4 可視化技術(shù)

    d3.js:https://d3js.org/

    Cytoscape.js:http://js.cytoscape.org/

    4.5 分詞技術(shù)

    jieba:https://github.com/fxsjy/jieba

    hanlp:https://github.com/hankcs/HanLP

    5

    項(xiàng)目實(shí)戰(zhàn)

    基于知識(shí)圖譜的問答:

    https://github.com/kangzhun/KnowledgeGraph-QA-Service

    Agriculture_KnowledgeGraph:

    https://github.com/qq547276542/Agriculture_KnowledgeGraph

    貢獻(xiàn)平臺(tái)

    由知名開源平臺(tái),AI技術(shù)平臺(tái)以及領(lǐng)域?qū)<遥篈pacheCN,Datawhale,AI有道和黃海廣博士聯(lián)合整理貢獻(xiàn):

    1.ApacheCN:片刻,李翔宇,飛龍,王翔

    2.Datawhale:范晶晶,馬晶敏,李碧涵,李福,光城,居居,康兵兵,鄭家豪

    3.AI有道:紅色石頭

    4.黃海廣博士

    本文由機(jī)器之心轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系原公眾號(hào)獲得授權(quán)。

    ?------------------------------------------------

    加入機(jī)器之心(全職記者 / 實(shí)習(xí)生):hr@jiqizhixin.com

    投稿或?qū)で髨?bào)道:content@jiqizhixin.com

    廣告 & 商務(wù)合作:bd@jiqizhixin.com

網(wǎng)站首頁   |    關(guān)于我們   |    公司新聞   |    產(chǎn)品方案   |    用戶案例   |    售后服務(wù)   |    合作伙伴   |    人才招聘   |   

友情鏈接: 餐飲加盟

地址:北京市海淀區(qū)    電話:010-     郵箱:@126.com

備案號(hào):冀ICP備2024067069號(hào)-3 北京科技有限公司版權(quán)所有