加密貨幣交易所 加密貨幣交易所
Ctrl+D 加密貨幣交易所
ads
首頁 > PEPE > Info

AIGC創業 用爬蟲技術做個知乎版GPT機器人合法嗎?_AIG:GHT

Author:

Time:1900/1/1 0:00:00

今年,GPT、AI繪畫等人工智能大模型工具火熱,許多人也想來追一波AI創業熱潮,相關創業項目層出不窮。優質數據對AI大模型訓練至關重要,只有擁有足夠多的數據,才能訓練出智能、強大的AI工具。我國互聯網蓬勃發展二十余年,還能缺少數據?這不,曼昆律師最近接到網友咨詢,準備用爬蟲爬取知乎數據,做一個知乎GPT機器人豈不美哉?且慢,這其中的法律風險不可忽視。

01 爬蟲是把雙刃劍

爬蟲技術是一種通過編程自動從互聯網上獲取數據的技術。它的名字形象、生動地表明了它的工作原理:模擬人類在網頁瀏覽器中瀏覽網頁的過程,進行數據采集和數據抓取。

網絡爬蟲廣泛應用于搜索引擎、數據采集、廣告過濾、大數據分析等領域。作為一種功能強大的信息采集程序,它能夠顯著提高工作效率,尤其是對海量數據的收集和整理。

派盾:DigiDaigaku CEO 推特賬戶疑似被盜,謹防釣魚鏈接:11月3日消息,據派盾監測(PeckShieldAlert)顯示,DigiDaigaku CEO Gabriel Leydon 推特賬戶疑似被盜,villians-digidaigaku[.]com 系釣魚鏈接,提醒用戶謹防與其交互。[2022/11/3 12:12:31]

然而,一旦技術被不正當使用,也會引發“蟲災”,導致網絡擁堵、崩潰、服務器癱瘓甚至引發數據安全風險。我們熟悉的“裁判文書網”也不能幸免:

圖:2019年,最高人民法院發布的《關于“中國裁判文書網”網站建設建議的答復》

NFT項目DigiDaigaku 24小時交易額漲幅近400%:金色財經報道,據NFTGO數據顯示,NFT項目DigiDaigaku 24小時交易額達791,990.95美元,漲幅達393.91%。該項目曾于8月9日采取FreeMint形式發售,據OpenSea數據顯示,當前該項目地板價為7.5ETH。[2022/8/29 12:55:00]

02 使用爬蟲技術的風險

爬蟲作為一項獲取數據的技術手段,并未被法律禁止。但使用方式及使用目的決定了是否會產生違法的行為和后果。

使用爬蟲技術, 能在短時間內對網站進行大量訪問,頻繁抓取頁面和數據。這可能會導致網站的帶寬和服務器負載急劇增加,從而影響網站的正常運行,甚至導致宕機或響應緩慢,干擾被訪問網站的正常運營,嚴重時可構成犯罪。

聲音 | Ira Kleiman方律師:Craig Wright僅提供了1.6萬多個BTC地址清單,但無中間人信息:在由Coindesk上傳的一份新文件中,Ira Kleiman的律師稱,Craig Wright只提供了16,404個比特幣地址清單,但沒有關于“保稅快遞”中間人的信息。原告要求Craig Wright在10天之內回應7條關于中間人的質詢,之后原告將利用這些答復來獲取有關“保稅快遞”中間人的信息。在此期間,原告正在請專家審查和分析這份清單。據此前CoinDesk報道,根據1月14日向美國佛羅里達州南部地區法院提交的一份法庭文件,第三方“提供了解鎖加密文件所需的信息和密鑰片段”,似乎是指此前提及的備受期待的“保稅快遞員”中間人,表示CSW擁有解鎖96億美元比特幣所需的私鑰。Bloom法官對保稅快遞公司的存在和比特幣爭議的數量表示懷疑。CSW此前因未能出示其所持比特幣的完整清單而被判藐視法庭。[2020/1/15]

楊某授權公司員工張某開發某信貸系統軟件,該軟件內的“網絡爬蟲"功能能與深圳市居住證網站鏈接。2018年5月,該軟件連續兩小時對深圳市居住證系統查詢大量訪問,致使深圳市居住證系統無法正常運作,極大地影響了該居住證系統使用方深圳市局人口管理處的日常運作。二人均構成破壞計算機信息系統罪。[(2019)粵0305刑初193號]

聲音 | Craig Wright:吳忌寒從未與ABC保持一致:據AMBCrypto消息,最近在比特幣極限主義者Tone Vays主持的一個視頻上,比特幣中本聰的BCH區塊鏈視覺實施的忠實信仰者Craig Wright談論了即將到來的BCH硬分叉及相關問題。Craig Wright首先表達了他與吳忌寒的關系,他說道:“我和吳忌寒從來就不是好朋友......吳忌寒從沒有與ABC保持一致”。他還談到他已經計劃了一條嘗試將BTC擴大的路子,并表示自己不想要一年前發生的分離,他補充道:“不幸的是,我們已經和吳忌寒討論了這一切,并認為他將支持和想要擴大,但是我們發現,那個時候吳忌寒低估了這一切。吳忌寒實際上想要分離,他不想要分叉。所以,一年前發生在BTC上的——BCH分離部分其實是吳忌寒需要的一種Segwit和允許ASIC提升的延展性修正的形式。”[2018/11/12]

與使用方式相比,如何使用爬取的信息和數據,對爬蟲行為的定性影響更大。

分析 | Craig Wright旗下礦池已控制BCH 58%算力:據BitcoinExchangeGuide報道,根據BCH中心化采礦的最新報告,Coingeek和BMG Pool的算力現已達到網絡的58%。據悉,這兩個礦池均隸屬于自稱中本聰的Craig Wright。[2018/9/18]

非法使用爬取的數據和信息主要有:

(1)盜取個人信息:使用爬蟲技術惡意抓取網站上的個人信息,可能涉及侵犯他人隱私、個人信息,嚴重可構成侵犯公民個人信息罪。

(2)商業競爭中的不正當行為:使用爬蟲技術獲取競爭對手的商業秘密、定價信息、用戶數據等,對數據整合后“搬家”到其他平臺,通過這種便捷的方式獲取大量有價值的數據、信息,以謀取不正當競爭優勢。

 在“酷米客訴車來不正當競爭糾紛案”中,法院認為,未經權利人許可,利用網絡爬蟲技術進入權利人的服務器后臺的方式非法獲取并無償使用權利人的實時公交信息數據的行為,實為一種“不勞而獲”、“食人而肥”的行為,且具有非法占用他人無形財產權益,破壞他人市場競爭優勢,構成不正當競爭。

(3)侵犯知識產權:爬取受版權保護的內容,然后用于未經授權的公開傳播或商業用途,屬于侵犯知識產權的行為。

03 爬蟲數據“投喂”大模型的風險

通過前面的分析可知,使用爬蟲技術的風險主要在于爬取的方式以及爬取的內容,那是不是控制爬取的頻率和內容,爬取公開內容,用來訓練機器人就沒有什么風險了呢?

首先,知乎官方賬號早在2018年就發布了《關于知乎用戶權益保護升級的公告》,提到:知乎對第三方開放知乎內容的使用采取白名單制,第三方需要通過官方合作渠道進行申請。如果爬取行為違反了知乎的服務條款,知乎可能采取封禁賬號、IP地址或者其他法律行動。

摘自《知乎機構號使用規范》(試行)

其次,知乎上的內容通常由用戶原創或授權發布,著作權歸用戶本人所有。未經授權地爬取和使用這些內容,可能涉及侵犯知乎的版權和著作權。

其實,訓練AI大模型,“數據盜竊”并非個案。上個月,筆神作文公開指控昔日合作伙伴學而思,認為學而思通過爬蟲方式“偷數據”訓練自家AI產品。筆神作文表示,將通過司法程序解決糾紛,要求“學而思”支付1元賠償金,公開道歉,并刪除已爬取的數據。

04 小結

在人工智能創業的熱潮中,數據變得越來越重要。在面對爬蟲技術帶來的誘惑時,應當認識到,雖然爬蟲技術本身并未被禁止,但其不當使用可能導致法律問題,尤其是在涉及個人信息、隱私、版權和不正當競爭等方面。

《生成式人工智能服務管理暫行辦法》中明確提到,訓練數據處理活動時,應當使用具有合法來源的數據和基礎模型。各位老板在創業過程中,要確保數據采集的合法性和道德性。如果想要使用爬取的數據訓練AI大模型,務必事先獲得數據來源方的授權,并遵守相關平臺的規定。

劉紅林律師

個人專欄

閱讀更多

Foresight News

金色財經 Jason.

白話區塊鏈

金色早8點

LD Capital

-R3PO

MarsBit

深潮TechFlow

Tags:AIGGHTCRARAIAIGENIUSNightClubCRA價格Polkatrain

PEPE
比較研究:ANS 和 ENS 的異同之處_ENS:FRENS幣

作者:Spike,PermaDAO比較研究:ANS 和 ENS 的異同之處ENS,全稱是 Ethereum Name Service,即運行在以太坊網絡上的域名服務.

1900/1/1 0:00:00
舊的去了 新的不來 沒有代幣的雅達利Web3戰略何去何從?_ATA:Metarix

作者:Zen,PANews日前,老牌街機游戲公司雅達利(Atari)發布截至2023年3月31日的業績財報,該公司在2023財年凈虧損950萬歐元,終止了與ATRI代幣的相關許可.

1900/1/1 0:00:00
香港財庫局陳浩濂:Web3.0的發展不能損害到金融體系的穩定_WEB:WEB3

來源:21世紀經濟報道 8月3日,由南方財經全媒體集團及HashKey Exchange聯合舉辦的“數資成真—亞洲合規探索與未來展望”研討會在香港舉行.

1900/1/1 0:00:00
7月黑客不停歇 各類安全事件涉及的總金額達4.15億美元_CHA:Orlando Chain

又到了每月安全盤點時刻!據區塊鏈安全審計公司Beosin旗下Beosin EagleEye安全風險監控、預警與阻斷平臺監測顯示,2023年7月,各類安全事件數量和損失金額較6月大幅增加.

1900/1/1 0:00:00
晚間必讀 | 加密資產的有效政策要素_區塊鏈:Infinite Launch

穩定幣提供了升級和有意義地擴展數字時代支付系統的機會。然而,盡管世界各地的技術不斷進步并且當今數字經濟中的客戶需求持續不斷,但最近的一些監管行動和當前立法提案的某些方面,把加密支付工具硬塞到現有.

1900/1/1 0:00:00
我幫國人在非洲做Worldcoin KYC 每天掙兩萬_CEL:WCELO價格

作者:金色財經記者 Jessy最近,曾在東非某國找黑人做Worldcoin KYC,再把賬號轉賣給國內用戶的趙照(化名)回國了.

1900/1/1 0:00:00
ads