智庫中國 > 

【四方物流香港】劉權:數據有用但應“爬取有道”

來源:法治日報 | 作者:劉權 | 時間:2021-06-02 | 責編:申罡

文 | 劉權 中央財經大學數字經濟與法治研究中心執行主任、法學院副教授


近日,北京市海淀區人民法院對新浪微博訴字節跳動不正當競爭糾紛案作出判決。法院認為,字節跳動通過類似“複製粘貼”的方式,將新浪微博內容大規模移植至今日頭條,擾亂了市場競爭秩序,構成不正當競爭。字節跳動需依法賠償新浪微博經濟損失2000萬元及合理開支115.67萬元。此案再次引發了公眾對“網絡爬蟲”合法性的關注。


所謂網絡爬蟲,也稱網頁蜘蛛、網絡機器人,是一種可以自動收集和整理互聯網上數據信息的技術。在數字經濟時代,得數據者得天下。目前,數據已成為繼土地、勞動力、資本、技術之後的新關鍵生產要素。2019年,黨的十九屆四中全會首次提出,將數據作為生產要素參與收益分配。2020年中共中央、國務院發佈的《關於構建更加完善的要素市場化配置體制機制的意見》明確要求,“加快培育數據要素市場”。可以預見,未來的數據爭奪戰必將更加激烈,網絡爬蟲糾紛必將更加普遍。而如何合理規範網絡爬蟲,既有效保護數據主體的利益,又有力促進數據的高效流通利用,也是一個全球難題。


其實,網絡爬蟲並非必然有害。正當爬取已公開的數據,符合互聯、互通、共享的互聯網精神,在某種程度上也有利於促進數據共享和數據流通利用,增加用户福利。如百度、搜狗等搜索引擎的運行,實際上利用的就是網絡爬蟲技術。通過網絡爬蟲分享相關信息,可以給用户帶來極大的便利,甚至可以增進社會公共利益。


然而,如果長時間大量爬取數據,尤其是爬取具有競爭關係的經營者的數據,並對其商業模式進行實質性替代,就可能構成不正當競爭,甚至構成犯罪。如此前法院審理的“酷米客”訴“車來了”案,法院就認為被告利用網絡爬蟲技術大量獲取並無償使用原告的實時公交信息數據,實為一種“不勞而獲”“食人而肥”的行為,非法佔用了他人無形財產權益,破壞他人市場競爭優勢,違反了誠實信用原則,擾亂了競爭秩序,構成不正當競爭。


一般而言,在UGC(用户生成內容)模式下,平台對於用户上傳的內容的確不享有知識產權,但如果放任其他平台隨意大量爬取用户上傳的內容,通過“搭便車”的方式,進行相同或相近的商業模式運營,那麼就會降低原來平台的競爭優勢,損害其商業利益。而且,對於許多被爬取的數據,原平台可能投入了大量的人力、物力、財力,即使這部分數據是公開呈現的,也不能被隨意爬取,否則就可能侵犯產權,而不僅僅是不正當競爭的問題。


數據有用但應“爬取有道”。互聯網企業在爬取數據時,應當遵守法律和商業道德,不得損害其他經營者或消費者的合法權益,不得擾亂公平競爭的市場秩序。


其一,大量爬取具有競爭關係經營者的數據應獲得合法授權。如果爬取的數據涉及用户上傳的內容,則應獲得雙重授權,即“用户授權”+“平台授權”。即使爬取的完全是用户上傳的合法文字、圖片、視頻等內容,也應獲得原來平台的授權,因為這些內容可能涉及原來平台的競爭權益。適度爬取不具有競爭關係經營者的數據,或許不需要獲得授權,以促進數據流通利用。


其二,即使是合法爬取數據,也不得超出授權範圍處理數據。使用數據應當與授權目的具有關聯性。如果用於明顯沒有關聯的其他目的,應當重新獲取授權。


其三,爬取的數據不得用於對競爭者的商業模式構成實質性替代的業務。如果大範圍使用被爬取的數據從事相同或相近的業務,那麼將導致具有競爭關係的經營者無法從市場競爭中獲得相應的回報和激勵,從而使其降低對相應產品和服務的研發與投入,最終會破壞公平競爭的市場秩序。


其四,不得爬取侵犯隱私權和個人信息的數據。我國民法典明確規定自然人享有隱私權,任何組織或者個人不得以刺探、侵擾、泄露、公開等方式侵害他人的隱私權,同時還規定自然人的個人信息受法律保護。如果爬取行為情節嚴重,還可能構成侵犯公民個人信息罪、破壞計算機信息系統罪,需要承擔刑事責任。


對於網絡爬蟲行為需要進行有效規範,但不宜“一刀切”地簡單予以禁止。在進行立法制度設計時,應區分不同的數據爬取場景,充分運用比例原則、成本收益分析方法等進行利益衡量,實現權利保護和數字經濟發展的平衡。行政機關在執法時,需要貫徹包容審慎監管理念,對於沒有主觀惡意但造成客觀損害的數據爬取行為應予以適度寬容,以降低企業試錯成本而促進數字科技創新。


發表評論