7月28日下午,小紅書官微發布聲明,指責大眾點評大量抄襲小紅書用戶的內容。據小紅書估計,抄襲的數量在百萬條量級。
小紅書方面稱,根據《中華人民共和國著作權法》第四十七條及《民法通則》第九十九條的規定,大眾點評的行為嚴重侵犯了小紅書及小紅書用戶的合法權益。小紅書會對大眾點評追責到底,幫助用戶維權。
7月29日下午,大眾點評對第一財經記者表示,近期收到小紅書及小紅書內容作者的投訴,發現在大眾點評平臺上出現大量未經授權的小紅書賬戶及內容,接到投訴后采取相關技術措施,在7月27日,完成所有內容排查與全部清理下線,并通過技術手段確保該類問題不再出現。
大眾點評方面稱:“經調查,該事件發生是因為大眾點評新上線試運營的推薦欄目在未經授權的情況下對相關內容進行了違規轉載。”
“類似的侵權也沒辦法,搬運內容很多互聯網公司都干過,打官司很麻煩,因為就算證明了抄襲也很難證明損失。”一位投資了大眾點評的投資界人士表示,“大眾點評上的內容適用于避風港原則,也就是說,平臺對用戶上傳的內容不用負責,申訴的話刪除內容就夠了?!?/p>
“避風港”原則是指在發生著作權侵權案件時,當ISP(網絡服務提供商)只提供空間服務,并不制作網頁內容,如果ISP被告知侵權,則有刪除的義務,否則就被視為侵權。如果侵權內容既不在ISP的服務器上存儲,又沒有被告知哪些內容應該刪除,則ISP不承擔侵權責任。后來避風港原則也被應用在搜索引擎、網絡存儲等方面。但“避風港規則”也因此變成了搜索網站和分享網站的“安全港”,甚至演變成某些網站承擔侵權賠償責任的擋箭牌——“先侵權、等通知;不通知、不負責;你通知、我刪除、我免責”。
知識產權資深人士張耀東對第一財經記者表示:“大眾點評平臺上用于轉載小紅書內容的賬號如果都是大眾點評的盜用行為,顯然構成不正當競爭?!?/p>
張耀東表示,大眾點評如果完全照搬照抄小紅書客戶的信息,如客戶名字、頭像、發表內容,顯然屬于不當使用,有侵犯復制權、姓名權、肖像權的嫌疑;如果有篡改相關評論內容的情況,還有可能涉嫌侵犯了相關客戶的作品修改權和作品完整權。
小紅書于2013年成立,創立之初只是一個互聯網社區,用戶用到好的產品就會在這里寫筆記,分享使用體驗。
在小紅書社區,用戶通過文字、圖片、視頻筆記的分享記錄這個時代年輕人的生活。因為常常有人留言追問,哪里可以買到這些好產品?小紅書順勢開通了電商平臺。公司官網顯示,其用戶數量接近1億人。
“小紅書為創建、收集、維護用戶賬戶及其內容付出了經營成本,而用戶內容又為小紅書提供了商業利益,這種利益應該受到專屬保護。” 電子商務研究中心法律權益部助理分析師賈路路告訴第一財經記者,大眾點評在無授權情況下復制小紅書用戶信息就是不勞而獲地占有本來屬于小紅書的商業利益,違背了公平和誠實信用原則,北京、上海等多地法院曾對此類案例做出判決,認為構成不正當競爭。
源:海報新聞
海報新聞記者 莊濱濱 上海報道
星級評價、必吃榜、推薦菜,點評類網站越來越成為年輕人的消費“指南”。然而,看似精心的點評卻可能并非來自真實用戶的親身體驗,而是“刷”出來的。更有公司將“刷好評”作為生財之道,謀取不法利益,形成一條灰色產業鏈。為此,大眾點評網的經營者上海漢濤信息咨詢有限公司(下稱漢濤公司)以侵害商標權及不正當競爭為由,將江西省千絡信息科技有限公司(下稱千絡公司)起訴至法院。
近日,上海市浦東新區人民法院(下稱上海浦東法院)對該案作出一審判決,判令千絡公司立即停止商標侵權及不正當競爭行為,刊登聲明、消除影響,并賠償大眾點評經濟損失70萬元及相應維權開支1.1萬余元。判決后,原被告均未上訴,目前該案件已經生效。
原告訴稱,其系大眾點評網站經營者,大眾點評網站匯集了海量的數據內容、用戶評論,具有較高的商業價值和競爭優勢。而被告為商家提供大眾點評網站刷點贊量、收藏量、門店星級、用戶好評數等“代運營”服務,屬于幫助其他經營者進行虛假或引人誤解的商業宣傳,構成不正當競爭。此外,漢濤公司還是“大眾點評”文字商標及圖形商標的權利人,兩商標均核準注冊于第35類服務上,經原告持續使用已具有較高的知名度。而被告千絡公司未經其許可,在提供刷量服務的網站、百度貼吧、宣傳單等上使用原告商標,構成對其商標權的侵害。故要求被告立即停止上述行為,并支付經濟損失216萬元及合理開支1.1萬余元,同時刊登聲明、消除影響。
千絡公司辯稱,自己的經營范圍為計算機領域內的技術服務等,與原告商標核定使用的服務不屬于相同或類似服務,不會導致相關公眾產生混淆,不構成侵權。并且公司未以自己的名義幫助客戶進行宣傳,而是通過補貼形式邀請真實消費者到店消費并作出評價,不屬于虛假宣傳。
上海浦東法院經審理后認為,被告作為獨立的行為主體參與市場活動,其向商戶提供刷量交易平臺并收取相應的服務費來實現盈利,故原、被告雙方之間存在直接的競爭利益沖突。原告對真實、清潔、可靠的平臺數據及所產生的衍生性商業價值具有正當合法利益,而被告提供的“代運營”服務實際上為點評刷量,所產生的點評數據是通過付費方式取得,并非基于用戶對商戶服務的真實評價,屬于虛假信息。這一行為會使得相關公眾對商戶服務質量及原告網站信譽產生虛假認知,亦嚴重破壞了市場競爭秩序以及互聯網產業生態。故被告通過組織虛假交易,幫助其用戶進行虛假或者引人誤解的商業宣傳,構成不正當競爭。
法院同時認為,被告在其網站、貼吧、宣傳物等處突出使用被訴侵權標識,起到了識別服務來源的功能,系商標性使用。同時,被告使用的標識均與原告的商標構成相同商標,兩者的服務對象均包括大眾點評的商戶,內容都圍繞商戶點評展開,服務類別構成類似,足以引起相關公眾對服務來源的混淆、誤認,故被告行為構成商標侵權。
本案主審法官袁田表示,近年來,利用數據進行各類新型不正當競爭的行為逐漸增多,本案所涉及的為平臺商戶提供有償刷單服務就是其中一類典型。這種以造假作弊來提高店鋪知名度的方式,制造了大量無效流量,不僅消耗了商戶及平臺的信譽,還損害了消費者的權益,長此以往將形成“劣幣驅逐良幣”的惡性循環,擾亂市場競爭秩序,須加以遏制。
本文來自【海報新聞】,僅代表作者觀點。全國黨媒信息公共平臺提供信息發布傳播服務。
ID:jrtt
聯網爬蟲戰爭永無休止。
這算得上是爬蟲斗爭歷史上具有里程碑意義的一個裁決。本周一,美國法院裁定,數據分析公司 HiQ 控訴 LinkedIn 案維持原判,并且認定從公共網站收集個人資料完全合法。
LinkedIn 是微軟旗下的職業社交平臺,用戶可以在 LinkedIn 網站建立個人檔案,包括教育背景、工作經歷、技能等信息。HiQ 則是一家數據分析公司,從 LinkedIn 爬取公開數據,進行整理分析后將處理結果出售給相關企業。
LinkedIn 雖擁有數據,然而數據本身是由用戶提供給 LinkedIn 的。在大數據時代,一些互聯網平臺積累了大量用戶數據,并以此建立自身資源優勢:在和其他互聯網企業與平臺的競爭中,用戶數據越多利用得越好,就越容易吸引更多用戶,從而處于更有利的地位。這種滾雪球式的效應使得互聯網企業往往將數據視為競爭中的核心資產。
在此案之前,任何訪問 LinkedIn 網站的人都可以得到這些數據。在數據分析公司 HiQ 長期對 LinkedIn 的網站數據進行爬取行為后,LinkedIn 向 HiQ 發送了禁止通知函,并在函中援引了《計算機欺詐與濫用法案》(Computer Fraud and Abuse Act, “CFAA”)。
2017 年,HiQ 先發制人,作為原告方,控訴 LinkedIn 通過法律、技術等多種方式阻止其復制 LinkedIn 用戶的公開個人資料,還向法院申請了臨時禁令。
雖然 HiQ 公司對 LinkedIn 網站實施了網絡爬蟲,但美法院法官認為,這種爬蟲行為并不違反法律,因為 LinkedIn 網站上的數據是公開數據,對于公開數據,即使違反對方設置的 robot 協議,也應當是被法律允許的。
這就像在白天推開一家未鎖門的商店進去看看,并不能將其認定為非法侵入。因此,法院最后不僅沒有認定 HiQ 公司的爬蟲行為違法,甚至反過來認定 LinkedIn 的反爬蟲技術違法。
負責審理此案的地方法官向 HiQ 授予了初步禁令,禁止 LinkedIn 在案件審理期間干擾 HiQ 的數據爬取工作。法官認為,《計算機欺詐與濫用法案》(將“未經授權”或者以“超出所授予訪問權限”方式訪問受保護計算機,認定為犯罪行為)并不適用于 HiQ 從 LinkedIn 網站收集公開數據的行為。
面對不利局面,LinkedIn 選擇上訴。早在 2019 年,上訴法院就曾經支持下級法院于 2017 年在 HiQ 訴 LinkedIn 案中做出的裁決,認定網絡爬取并不屬于“未經授權訪問受保護計算機”行為,裁定也依舊維持原判。LinkedIn 再次選擇上訴。但兩年之后,第九巡回法院仍然站在 HiQ 一邊,并將此案發回加州北區法院。
LinkedIn 當然對此不服,隨后向美國最高法院提起上訴。2020 年 3 月,LinkedIn 要求最高法院審查第九巡回法院做出裁決。該公司辯護稱,其以技術手段阻止網絡爬取、同時發送終止通告函件的行為,應被視為符合正常授權機制的要求。實際上,作為微軟持有的社交媒體網站、LinkedIn 一直努力避免站內結果被外界直接查看,但又不希望因過度封閉而自絕于搜索引擎。
LinkedIn 方面的律師在遞交給最高法院的申訴書中寫道,“根據第九巡回法院的裁定,除非用密碼機制將網站徹底封鎖起來,否則任何一家決定部分公開網站內容的企業——包括 Ticketmaster、Amazon 等在線零售商,乃至 Twitter 等社交網絡平臺——都將暴露在批量部署的侵入性爬蟲程序的面前。”
“而一旦選擇密碼封鎖,則網站將無法被搜索引擎正常檢索,導致人們無法經由互聯網上最主要的信息獲取渠道發現其中信息?!?/p>
2021 年 6 月 3 日,美國最高法院曾在另一起類似案件,即 Van Buren 訴美國政府案中,縮小過《欺詐與濫用法案》的管控范圍。Nathan Van Buren 是佐治亞州的一名警察,有權限為執法目的搜索有關車牌的計算機記錄。他中了聯邦調查局的圈套,為私人目的搜索這些記錄(應聯邦調查局線人的要求,該線人提出為這些信息支付數千美元)。最終美法院對他判處了 18 個月的監禁。人們一直批評該法案未對“未經授權”和“超出授權范圍”做出清晰界定。
美國高等法院在 Van Buren 案中表示,單純違反服務條款并不符合《欺詐與濫用法案》中提出的“超出授權范圍”條件。然而,基于憑證的鎖閉機制是否足以作為確定“未經授權”訪問的唯一方法,美國高等法院仍未能給出明確答案。
兩周之后,美國最高法院決定將 HiQ 訴 LinkedIn 案發回第九巡回法院,希望結合 Van Buren 案的判例重新審視《欺詐與濫用法案》的適用范疇。但從結果來看,上訴法院雖然參考了 Van Buren 判例,但最終仍做出了維持兩年前原判意見的裁定。
第九巡回法院在裁決中指出,“公共網站的一大基本特征,就是其中公開可見的部分不受訪問限制;換言之,這些部分將對任何擁有網絡瀏覽器的訪問者開放。”
“也就是說,如果將這些托管公開頁面的計算機視為房屋,那么公共網站設備在部署之初就沒有設置任何“前門”,自然不存在提高或降低訪問門檻一說。因此,Van Buren 案強化了我們的裁定,即“未經授權”概念確實不適用于公共網站?!?/strong>
但院方裁決并未解決 HiQ 與 LinkedIn 之間的恩怨糾葛,只是單純禁止 LinkedIn 繼續干擾 HiQ 收集其公開網站數據、并表示不支持根據《欺詐與濫用法案》對 HiQ 的分析業務提出索賠。而案件背后真正核心的不公平競爭、隱私侵犯等問題仍未得到解決。
在郵件聲明中,LinkedIn 發言人表示該公司不會放棄訴訟,將繼續在法庭上尋求合理的結果。“我們對結果感到失望,但這只是一項初步裁決、案件還遠未結束。我們將繼續努力保護 LinkedIn 會員,特別是保護他們在網站上掌控個人信息的能力?!?/p>
數據抓取行為如今被廣泛應用到社會生活當中,不僅僅是在商業上的使用,還有學術研究上的應用等等。因此,本案的判決也受到極大的關注。此案的裁決得到了美國媒體的歡呼和贊譽,認為第九巡回法院的決定是檔案工作者、學者、研究人員和記者的“重大勝利”。
對于爭論不休的數據和隱私的歸屬問題,這個案件也在一定程度上進行了討論。從第九巡回上訴法院的觀點來看,其裁決支持了用戶才是數據的所有者,平臺只是依據用戶的授權才使用這些數據,而不能完全擁有這些數據。
在 Reddit 上,網友們對 LinkedIn 發言人提起上訴的解釋發起了大量嘲諷:“這樣的解釋即使不是荒謬的,也是冒昧的,提供數據的用戶從來沒有得到平臺的反饋”,“保護客戶隱私的說法被夸大了”,“現在誰會相信這樣的解釋是有意義的?”…
另一方面,數據抓取也是現代互聯網生態的重要組成部分,根據 Akamai 的統計,全球互聯網流量中,近 40% 的流量由爬蟲所占據。在 2021 年第二季度,全球遭遇的爬蟲攻擊達到了 700 億次,同比增長 15%。美國法院這一裁定,也意味著從此百億爬蟲抓取在線零售商和社交網絡平臺的公開信息,是合乎美國法律的。
或許正是由于數據的重要地位,近年來中外關于數據的爭議問題層出不窮。在中國,爬蟲行為引發的不正當糾紛案件也不在少數。德恒律師事務所曾發布過一篇名為《爬進“不正當競爭”的蟲,代價不菲》的文章,在文章中講述道,他們以“爬蟲”等關鍵詞在北大法寶檢索并篩選出自 2016 年起的爬蟲類相關案件共 49 件,大部分為刑事案件,涉及侵犯著作權罪、非法經營罪、侵犯公民個人信息、詐騙罪、敲詐勒索罪等,也包括部分民商法案件,主要涉及著作權和不正當競爭糾紛。
其中一個典型案例是大眾點評訴百度案。
2016 年,百度因大量使用爬蟲抓取大眾點評的點評信息,在百度地圖中進行展示,后被大眾點評訴至法院。法院審理認為,百度的行為違反了公認的商業道德和誠實信用原則,構成不正當競爭。
在大眾點評訴百度的二審判決中,法官明確指出:“在自由、開放的市場經濟秩序中,經營資源和商業機會具有稀缺性,經營者的權益并非可以獲得像法定財產權那樣的保護強度,經營者必須將損害作為一種競爭結果予以適當的容忍。本案中,漢濤公司所主張的應受保護的利益并非絕對權利,其受到損害并不必然意味著應當得到法律救濟,只要他人的競爭行為本身是正當的,則該行為并不具有可責性。”
雖然技術是中立的,但是技術應用存在著邊界。目前,平臺的數據權屬無法進行明確化的界權,所以界定法律責任的過程還是比較復雜的。也因此,隨著互聯網技術的發展,“爬蟲”二字在中文語境逐漸帶上了“貶義”色彩。
對編寫網絡爬蟲的程序員來說,如果爬到不該爬取的數據,則存在違法的可能?!芭老x寫得好,牢飯吃得早”戲稱的存在,也說明了我們需要謹慎對待爬蟲技術。就像 LinkedIn 平臺,獲取公共數據一般有兩個選擇:使用爬蟲 /scraper (免費但有風險),使用 API(不是免費但安全),如果一定需要使用這些公開數據,需要我們做出謹慎的抉擇。
參考鏈接:
https://www.theregister.com/2022/04/19/scraping_public_data_linkedin/
https://news.ycombinator.com/item?id=31075396
《數據抓取的邊界在哪里?》:http://rmfyb.chinacourt.org/paper/html/2020-03/19/content_166271.htm?div=-1
《爬進“不正當競爭”的蟲,代價不菲》:http://www.dehenglaw.com/CN/tansuocontent/0008/023370/7.aspx?MID=0902
了解更多軟件開發與相關領域知識,點擊訪問 InfoQ 官網:https://www.infoq.cn/,獲取更多精彩內容!