操屁眼的视频在线免费看,日本在线综合一区二区,久久在线观看免费视频,欧美日韩精品久久综

新聞資訊

    by 雨水無(wú)香

    1.1基于內(nèi)容的推薦系統(tǒng)

    基于內(nèi)容推薦是推薦系統(tǒng)中比較常見(jiàn)的一種做法,這種方法對(duì)于每個(gè)item基于其自身屬性,抽取一些特征用來(lái)表示這個(gè)item的內(nèi)容關(guān)聯(lián)規(guī)則 推薦系統(tǒng),從而推薦那些和當(dāng)前item含有相同或相近特征的一些item。

    這種推薦系統(tǒng)多用于一些資訊類(lèi)的應(yīng)用上,針對(duì)文章本身抽取一些tag作為該文章的關(guān)鍵詞,繼而可以通過(guò)這些tag來(lái)評(píng)價(jià)兩篇文章的相似度。抽取tag經(jīng)常采用的方案是基于TF-IDF得到的一系列權(quán)值較高的term,即認(rèn)為:在一篇文章中,那些出現(xiàn)頻率高的(除停用詞)詞,并且在其他文章中出現(xiàn)頻率較低的詞更能代表這篇文章的內(nèi)容。經(jīng)過(guò)TF-IDF公式計(jì)算,權(quán)重大于某一閾值的term作為該文章的tag。通常,也考慮tag的詞性,一般來(lái)說(shuō)名詞和形容詞更加適合作為tag。

    這種推薦系統(tǒng)的優(yōu)點(diǎn)在于易于實(shí)現(xiàn),不需要用戶(hù)數(shù)據(jù)因此不存在稀疏性和冷啟動(dòng)問(wèn)題。基于item本身特征推薦,因此不存在過(guò)度推薦熱門(mén)的問(wèn)題。所涉及的技術(shù)都是搜索引擎中應(yīng)用比較成熟的技術(shù)。

    缺點(diǎn)在于抽取的特征既要保證準(zhǔn)確性又要具有一定的實(shí)際意義,否則很難保證推薦結(jié)果的相關(guān)性。豆瓣網(wǎng)采用人工維護(hù)tag的策略,依靠用戶(hù)去維護(hù)item的tag的準(zhǔn)確性。

    1.2基于關(guān)聯(lián)規(guī)則的推薦系統(tǒng)

    基于關(guān)聯(lián)規(guī)則的推薦更常見(jiàn)于電子商務(wù)系統(tǒng)中,并且也被證明行之有效。其實(shí)際的意義為購(gòu)買(mǎi)了一些物品的用戶(hù)更傾向于購(gòu)買(mǎi)另一些物品。基于關(guān)聯(lián)規(guī)則的推薦系統(tǒng)的首要目標(biāo)是挖掘出關(guān)聯(lián)規(guī)則,也就是那些同時(shí)被很多用戶(hù)購(gòu)買(mǎi)的物品集合,這些集合內(nèi)的物品可以相互進(jìn)行推薦。

    目前關(guān)聯(lián)規(guī)則挖掘算法主要從和FP-兩個(gè)算法發(fā)展演變而來(lái)。算法思路實(shí)現(xiàn)簡(jiǎn)單,通過(guò)迭代不斷通過(guò)K-1元頻繁項(xiàng)目集生成K元頻繁項(xiàng)目集,直到不能生成為止,最終可以得到最大頻繁項(xiàng)目集。算法存在的問(wèn)題是每次迭代都要判斷生成K元集合的K-1元子集是否都是頻繁項(xiàng)目集,計(jì)算量巨大;并且算法是一個(gè)挖掘最大頻繁項(xiàng)目集的算法,無(wú)法得到全部頻繁模式集合。FP-算法通過(guò)構(gòu)建FP-Tree(頻繁模式樹(shù)),去發(fā)現(xiàn)頻繁模式集。相比于算法,計(jì)算量較少,并且可以得出幾乎所有的頻繁項(xiàng)目集;但該算法實(shí)現(xiàn)起來(lái)要比復(fù)雜,并且FP-需要將全部數(shù)據(jù)庫(kù)事務(wù)加載到內(nèi)存中,而雖然需要反復(fù)讀取數(shù)據(jù)庫(kù)事務(wù),但是不需要全部載入內(nèi)存。一般而言,F(xiàn)P-要比快至少一個(gè)數(shù)量級(jí)。

    關(guān)聯(lián)規(guī)則挖掘中有兩個(gè)主要的概念,支持度和置信度。支持度是指包含某頻繁項(xiàng)目集的事務(wù)數(shù)和總數(shù)據(jù)庫(kù)事務(wù)數(shù)的百分比。置信度指包含某頻繁項(xiàng)目集的事務(wù)數(shù)和包含被推薦項(xiàng)目集的事務(wù)數(shù)的百分比。而最小支持度閾值和最小置信度閾值也是決定一個(gè)事務(wù)集合是否是頻繁事務(wù)集和一個(gè)關(guān)聯(lián)規(guī)則是否成立的決定因素。因此這兩個(gè)閾值也決定了推薦系統(tǒng)的準(zhǔn)確率和召回率。

    基于關(guān)聯(lián)規(guī)則的推薦系統(tǒng)一般轉(zhuǎn)化率較高,因?yàn)楫?dāng)用戶(hù)已經(jīng)購(gòu)買(mǎi)了頻繁集合中的若干項(xiàng)目后,購(gòu)買(mǎi)該頻繁集合中其他項(xiàng)目的可能性更高。缺點(diǎn)在于計(jì)算量較大,但是可以離線計(jì)算,因此影響不大。同時(shí)基于關(guān)聯(lián)規(guī)則的推薦系統(tǒng)由于采用用戶(hù)數(shù)據(jù),不可避免的存在冷啟動(dòng)和稀疏性問(wèn)題。并且存在熱門(mén)項(xiàng)目容易被過(guò)度推薦的問(wèn)題。此外,基于item的推薦體系多采用1toN的推薦模式,因此實(shí)際的關(guān)聯(lián)規(guī)則相當(dāng)于從二元頻繁項(xiàng)目集產(chǎn)生(即1to1的模式),1->1這種關(guān)聯(lián)規(guī)則的相關(guān)性要遠(yuǎn)低于M->N這種最初關(guān)聯(lián)規(guī)則的推薦形式。因此基于關(guān)聯(lián)規(guī)則的推薦系統(tǒng)很少被應(yīng)用于item的推薦體系。

    1.3基于協(xié)同過(guò)濾的推薦系統(tǒng)

    協(xié)同過(guò)濾是一種在推薦系統(tǒng)中廣泛采用的推薦方法。這種算法基于一個(gè)假設(shè),喜歡相同item的用戶(hù)更有可能具有相同的興趣。基于協(xié)同過(guò)濾的推薦系統(tǒng)一般應(yīng)用于有用戶(hù)評(píng)分的系統(tǒng)之中,通過(guò)分?jǐn)?shù)去刻畫(huà)用戶(hù)對(duì)于item的好惡。協(xié)同過(guò)濾被視為利用集體智慧的典范,不需要對(duì)項(xiàng)目進(jìn)行特殊處理,而是通過(guò)用戶(hù)建立項(xiàng)目與項(xiàng)目之間的聯(lián)系。

    經(jīng)過(guò)發(fā)展演變,協(xié)同過(guò)濾逐漸分化為兩種類(lèi)型:基于用戶(hù)(User-based)的協(xié)同過(guò)濾系統(tǒng)和基于項(xiàng)目(Item-based)的協(xié)同過(guò)濾系統(tǒng)。

    1.3.1User-based協(xié)同過(guò)濾系統(tǒng)

    采用這種方法的推薦系統(tǒng)通過(guò)比較當(dāng)前用戶(hù)和其他用戶(hù)閱讀的項(xiàng)目進(jìn)行比較(其評(píng)分為權(quán)值),從而選擇當(dāng)前用戶(hù)的TopN鄰近用戶(hù),然后根據(jù)當(dāng)前用戶(hù)的臨近用戶(hù),對(duì)當(dāng)前用戶(hù)的未評(píng)分項(xiàng)進(jìn)行模擬評(píng)分,然后再將評(píng)分高的項(xiàng)目推薦給用戶(hù)。

    這種推薦系統(tǒng)的優(yōu)點(diǎn)在于推薦項(xiàng)目之間在內(nèi)容上可能完全不相關(guān),因此可以發(fā)現(xiàn)用戶(hù)的潛在興趣,并且針對(duì)每個(gè)用戶(hù)生成其個(gè)性化的推薦結(jié)果。缺點(diǎn)在于一般的Web系統(tǒng)中,用戶(hù)的增長(zhǎng)速度都遠(yuǎn)遠(yuǎn)大于項(xiàng)目的增長(zhǎng)速度,因此其計(jì)算量的增長(zhǎng)巨大,系統(tǒng)性能容易成為瓶頸。因此在業(yè)界中單純的使用User-based協(xié)同過(guò)濾系統(tǒng)較少。

    豆瓣網(wǎng)的“豆瓣猜”是一種個(gè)性化的推薦,因此推薦其背后可能采用了User-based協(xié)同過(guò)濾技術(shù)。但是可以看出,豆瓣猜頁(yè)面上仍主要采用了基于tag的推薦技術(shù),并且利用“友鄰”代替了協(xié)同過(guò)濾技術(shù)中的臨近用戶(hù)計(jì)算,并且“豆瓣猜”也并非豆瓣網(wǎng)的主打推薦系統(tǒng)。

    1.3.2Item-based協(xié)同過(guò)濾系統(tǒng)

    這種協(xié)同過(guò)濾和User-based協(xié)同過(guò)濾相似,只不過(guò)是通過(guò)比較對(duì)當(dāng)前item的用戶(hù)評(píng)分和其他item的用戶(hù)評(píng)分來(lái)選擇當(dāng)前item的相似item進(jìn)行推薦。Item-based協(xié)同過(guò)濾可以看作是關(guān)聯(lián)規(guī)則推薦的一種退化(尤其是進(jìn)行1to1形式的推薦時(shí)),但由于協(xié)同過(guò)濾更多考慮了用戶(hù)的實(shí)際評(píng)分,并且只是計(jì)算相似度而非尋找頻繁集,因此可以認(rèn)為Item-based協(xié)同過(guò)濾準(zhǔn)確率較高并且覆蓋率更高。

    同User-based相比Item-based應(yīng)用更為廣泛,擴(kuò)展性和算法性能更好。由于項(xiàng)目的增長(zhǎng)速度一般較為平緩,因此性能變化不大。缺點(diǎn)就是無(wú)法提供個(gè)性化的推薦結(jié)果。

    1.4基于用戶(hù)模型學(xué)習(xí)的推薦系統(tǒng)

    這種推薦系統(tǒng)根據(jù)用戶(hù)已閱讀(或評(píng)分)項(xiàng)目進(jìn)行監(jiān)督學(xué)習(xí),從而得到該用戶(hù)的行為模型,繼而根據(jù)該用戶(hù)的模型去對(duì)用戶(hù)未評(píng)分的項(xiàng)目進(jìn)行分類(lèi)預(yù)測(cè),從而得到用戶(hù)可能喜歡的項(xiàng)目。根據(jù)用戶(hù)模型的學(xué)習(xí)算法,一般也需要抽取項(xiàng)目的一些特征。目前這種推薦系統(tǒng)的效果還沒(méi)有生產(chǎn)環(huán)境應(yīng)用的資料證實(shí),因此尚無(wú)法判斷其優(yōu)缺點(diǎn)。

    1.5其他

    推薦系統(tǒng)和搜索引擎都是海量信息的過(guò)濾器,因此有人提出利用搜索引擎的一些成熟技術(shù)去解決推薦系統(tǒng)的問(wèn)題。例如,將item看作是一個(gè)doc關(guān)聯(lián)規(guī)則 推薦系統(tǒng),將對(duì)該item有過(guò)評(píng)價(jià)的用戶(hù)看作是該doc的一個(gè)term,然后利用BM-25、TF-IDF等算法對(duì)item的相似度進(jìn)行計(jì)算,這種方案可以避免熱門(mén)問(wèn)題,同時(shí)搜索引擎技術(shù)的發(fā)展相對(duì)要比推薦系統(tǒng)成熟。存在的問(wèn)題就是,同基于用戶(hù)模型學(xué)習(xí)的推薦系統(tǒng)并未有生產(chǎn)系統(tǒng)使用效果的資料。

    除此之外還有基于效用和基于知識(shí)的推薦系統(tǒng)。

    1.6綜述

    推薦系統(tǒng)的未來(lái)發(fā)展方向不會(huì)是用單一方案解決問(wèn)題,很有可能是通過(guò)組合以上幾種推薦方法,來(lái)確定最終的推薦結(jié)果。可以采用加權(quán)、變換、混合、特征組合等方法綜合考慮這些推薦方法。

網(wǎng)站首頁(yè)   |    關(guān)于我們   |    公司新聞   |    產(chǎn)品方案   |    用戶(hù)案例   |    售后服務(wù)   |    合作伙伴   |    人才招聘   |   

友情鏈接: 餐飲加盟

地址:北京市海淀區(qū)    電話:010-     郵箱:@126.com

備案號(hào):冀ICP備2024067069號(hào)-3 北京科技有限公司版權(quán)所有