国内精品伊人久久久久|亚洲欧美娱乐日本字幕|免费无码国产一级AⅤ片|国产精品免费视频一区二区|亚洲韩国日本午夜本地国产|亚洲日本国产成人一区二区|性国产日韩欧美一区二区在线|亚洲AⅤ无码午夜福利精品一区

搜索
新聞資訊
當前位置 當前位置:首頁 > 新聞資訊 > 時事聚焦

爬蟲技術應用合法性引爭議 亟待規(guī)制非法爬取數(shù)據(jù)行為

所屬分類:時事聚焦    發(fā)布時間: 2021-11-09    作者:寧夏鍋爐燃料
  分享到:   
二維碼分享

大數(shù)據(jù)時代,越來越多的市場主體投入巨資收集、整理、挖掘信息。如果允許網(wǎng)絡爬蟲自由使用他人通過巨額投資獲取的數(shù)據(jù)資源,不利于鼓勵商業(yè)投資、產(chǎn)業(yè)創(chuàng)新和誠信經(jīng)營,甚至可能直接侵犯數(shù)據(jù)源用戶的意志和知情權,.終損害良性競爭機制。

隨著社會經(jīng)濟的快速發(fā)展,數(shù)據(jù)的價值日益凸顯,成為企業(yè)科技創(chuàng)新必不可少的要素。然而,當企業(yè)通過技術手段獲取數(shù)據(jù)時,數(shù)據(jù)捕獲技術的應用行為是否合理合法,是一個值得深思的問題。

近年來,網(wǎng)絡爬蟲“爬行數(shù)據(jù)”成為熱門詞匯,相關司法案例不斷出現(xiàn)。據(jù)不完全統(tǒng)計,近年來涉及網(wǎng)絡爬蟲的司法案件有十余起,既有民事案件,也有刑事案件。這種情況甚至越來越嚴重。

上海市人民檢察院研究室副主任陳在近日于上海舉行的長三角數(shù)據(jù)合規(guī)論壇(三期)暨數(shù)據(jù)爬蟲法律規(guī)制研討會上透露,檢察機關正在積極推進企業(yè)合規(guī)改革試點工作,數(shù)據(jù)合規(guī)是重點之一?!澳壳?,爬蟲抓取數(shù)據(jù)的案例非常普遍。當網(wǎng)絡平臺或個人通過技術手段從其他平臺抓取數(shù)據(jù)時,這種行為是否合法,誰是平臺數(shù)據(jù)的主體,誰使用,值得深入探討?!?

杭州長三角大數(shù)據(jù)研究院副院長郭冰認為,數(shù)據(jù)爬蟲作為一種中性技術,已經(jīng)廣泛應用于互聯(lián)網(wǎng)行業(yè)。需要注意的是,如果爬蟲技術應用不當,會損害其他競爭對手的合法權益,即使涉嫌違法犯罪,也會對行業(yè)的健康發(fā)展產(chǎn)生非常大的負面影響。

抓取數(shù)據(jù)涉嫌侵權

從技術角度來看,爬蟲模擬了人類上網(wǎng)或通過程序瀏覽網(wǎng)頁和應用的行為,使其能夠高效地捕捉到互聯(lián)網(wǎng)上爬蟲制造者所需的信息。

歐萊雅中國數(shù)字化負責人劉表示,大多數(shù)網(wǎng)站拒絕爬蟲訪問。原因不僅包括商業(yè)利益,還包括自身網(wǎng)站的運營安全。除了爬蟲可能抓取到網(wǎng)站而不愿意被抓取的數(shù)據(jù)外,網(wǎng)站運營者往往擔心爬蟲會干擾網(wǎng)站的正常運行。

但非正式爬蟲會自動、持續(xù)、頻繁地訪問被爬方,服務器負載暴漲,也會給服務器帶來“難以承受”的重量:與沒有經(jīng)驗的網(wǎng)站打交道,尤其是中小型網(wǎng)站,可能會面臨網(wǎng)站打不開,網(wǎng)頁加載極其緩慢,有時甚至直接癱瘓的情況。

新浪集團訴訟總監(jiān)張哲表示,無論是爬蟲還是其他用途的技術都是中性的,但爬蟲技術的應用并不是中性的,技術的應用有用戶的目的。這個時候,我們不應該評價技術的原理,而是需要評價技術是用來做什么的,這種行為手段是否正當。

說到網(wǎng)絡爬蟲,機器人協(xié)議是一個不可回避的話題。機器人協(xié)議(也稱為爬蟲協(xié)議)的全稱是“網(wǎng)絡爬蟲排除標準”。通過機器人協(xié)議,網(wǎng)站明確警告搜索引擎哪些頁面可以被抓取,哪些頁面不能被抓取。這個協(xié)議也被業(yè)界稱為搜索領域的“君子協(xié)議”。

劉說,當一個網(wǎng)絡爬蟲訪問一個網(wǎng)站時,機器人協(xié)議就像站在他房間門口的一塊牌子,告訴外人誰能來,誰不能來。不過這只是君子協(xié)定,只能作為通知,不能作為技術防范。

實際上,惡意爬蟲在抓取時并不遵守網(wǎng)站的robots協(xié)議,可能會抓取不該抓取的數(shù)據(jù),這并不是孤立的情況。小紅書法律總監(jiān)曾翔表示,惡意爬蟲案件經(jīng)常發(fā)生在內(nèi)容平臺和電商平臺。在內(nèi)容上,視頻、圖片、文字、線上名人互動數(shù)據(jù)、用戶行為等多為爬行,而在電商領域,則多為商業(yè)信息和商品信息。

“內(nèi)容平臺一般規(guī)定相關內(nèi)容的知識產(chǎn)權屬于發(fā)布者或發(fā)布者與平臺雙方。這些爬蟲是用戶授權的,沒有簽訂協(xié)議,涉嫌侵犯知識產(chǎn)權人的權利。”曾翔說。

還是應該明確網(wǎng)站權利。

這涉及到數(shù)據(jù)的所有權和是否可以打開。

上海市浦東區(qū)人民法院知識產(chǎn)權庭法官徐紅濤認為,數(shù)據(jù)是內(nèi)容產(chǎn)業(yè)的核心競爭資源,內(nèi)容平臺的數(shù)據(jù)經(jīng)過匯總分析處理后往往具有極高的經(jīng)濟價值。

“如果要求內(nèi)容平臺運營商無限期向競爭對手開放核心競爭資源,不僅違背‘互聯(lián)互通’精神的本質,也不利于優(yōu)質內(nèi)容的不斷變革和互聯(lián)網(wǎng)行業(yè)的可持續(xù)發(fā)展?!毙旌陚フf。

在惡意爬蟲抓取數(shù)據(jù)的案例頻發(fā)背后,數(shù)據(jù)的價值增加,以數(shù)據(jù)為核心的市場競爭日趨激烈。

華東政法大學教授高福平表示,在大數(shù)據(jù)時代,數(shù)據(jù)的價值再次凸顯,如今爬蟲技術已經(jīng)從.初的網(wǎng)絡爬蟲走向底層數(shù)據(jù)的爬行。數(shù)據(jù)爬蟲的問題會越來越嚴重。

在大數(shù)據(jù)時代的背景下,越來越多的市場主體投入巨資收集、整理、挖掘信息,業(yè)內(nèi)人士對此表示擔憂:如果任由網(wǎng)絡爬蟲任意使用或利用他人通過巨額投資獲取的數(shù)據(jù)資源,將不利于鼓勵商業(yè)投資、產(chǎn)業(yè)創(chuàng)新和誠信經(jīng)營,甚至可能直接侵害數(shù)據(jù)源用戶的意愿和知情權,.終損害健康的競爭機制。

高福平認為,如果網(wǎng)站合法積累數(shù)據(jù)資源,那么這些數(shù)據(jù)資源應該屬于網(wǎng)站的資產(chǎn)?!霸试S數(shù)據(jù)生產(chǎn)者和控制者出于商業(yè)目的開放數(shù)據(jù)是有益的,更多的人可以通過許可、交換交易等方式享受數(shù)據(jù)服務。期待未來確認所有合法數(shù)據(jù)生產(chǎn)者的控制權和使用權?!?

有序流通同樣重要。

目前,雖然網(wǎng)站可以指定相應的策略或技術手段來防止爬蟲抓取數(shù)據(jù),但爬蟲也有更多的技術手段來對抗這種反抓取策略。

劉說,防爬和爬行的技術一直在迭代。在技術領域,沒有不能爬的網(wǎng)站和應用,只有愿意爬和爬多難的問題。

據(jù)了解,現(xiàn)實中,惡意網(wǎng)絡爬蟲制造者在進行防御時,往往會將機器人協(xié)議對爬行的限制與數(shù)據(jù)流聯(lián)系起來。徐紅濤認為,在“互聯(lián)互通”背景下,“秩序”與“流通”同等重要、缺一不可,有必要消除打著“互聯(lián)互通”幌子阻礙公平競爭、危害用戶數(shù)據(jù)安全的行為。

“判斷非搜索引擎爬蟲的合法性,要考慮是否足以保證用戶數(shù)據(jù)的安全。用戶數(shù)據(jù),包括身份數(shù)據(jù)、行為數(shù)據(jù)等。,既是運營商的競爭資源,又具有用戶的個人隱私屬性,而此類數(shù)據(jù)的收集更關乎社會公共利益。”徐宏偉說。

據(jù)了解,近年來,與數(shù)據(jù)安全相關的法律規(guī)范不斷完善。數(shù)據(jù)安全法作為數(shù)據(jù)安全的基本法,承擔著解決我國數(shù)據(jù)安全核心制度框架的重任。此外,還有2019年通過的密碼法,工信部計劃出臺《工業(yè)和信息化領域數(shù)據(jù)安全管理辦法(試行)》等。深圳、上海等地也在探索制定數(shù)據(jù)管理相關規(guī)范。

(——文章來源于中國新聞網(wǎng),如有侵權請聯(lián)系寧夏鍋爐燃料的小編刪除)