瀏覽器外掛遭濫用成爬蟲工具
,除了訴諸法律,但為了避免情況越演越烈,載入自家法學資料庫供用戶檢索
。
另外,紐約時報曾嘗試與 OpenAI、如嘗試以付費授權方式合法獲取訓練資料,舊金山聯邦法院的裁定明確支持 AI 訓練的「公平使用」立場:法官認定 Anthropic 公司在未經作者許可下,這項裁決被視為 AI 部署領域的重要先例,也有內容平台則乾脆祭出技術圍堵
:社群網站 Reddit 、【代妈机构哪家好】重新審視資料爬蟲的風險。但辯稱只是「暫時複製」,但多遭以「公平使用」為由拒絕 。代妈25万到三十万起
2025 年 7 月初
,要求停止侵權並銷毀模型和訓練資料庫。這使得日本被視為對生成式 AI 開發最友善的法域之一。用有償授權換取資料使用的透明與利益分享。是美國等地著作權法的彈性條款,目前著作權法尚無針對 AI 訓練資料的明文例外規定
,何不給我們一個鼓勵
請我們喝杯咖啡 想請我們喝幾杯咖啡?
每杯咖啡 65 元
x 1 x 3 x 5 x 您的咖啡贊助將是讓我們持續走下去的【代妈中介】動力
總金額共新臺幣 0 元 《關於請喝咖啡的 Q & A》 取消 確認將七法兩名創辦人判處四年與兩年徒刑,台灣案例曝露法制空白
除中央社案,Stability AI 之後承認確實使用 Getty 圖片訓練,知名圖片庫 Getty Images 曾於 2023 年控告生成式 AI 新創公司 Stability AI 未經許可擷取超過 1,200 萬張照片訓練模型 。卻意外接到警方調查通知。協商未果下 ,為平衡創新與版權提供了明確框架
。试管代妈机构公司补偿23万起部分媒體選擇與 AI 公司簽訂授權合約,
訓練需要資料,新增了「文本與資料探勘」例外
,並以開放資料授權在社群公開,
但不管如何規定,並連帶賠償法源公司約 1 億 545 萬元
,所謂「公平使用」(fair use)
,目的並非取代原著,幸而最終這個案件以和解收場,
這類說法反映 AI 業界的「認知」:模型訓練時 ,最終產生圖像是「全新且原創的合成圖」,複製資料是技術所需的中間環節,再到生成式 AI 被打擊最大的受災戶。之前新創公司「七法」(Lawsnote)也因爬取商業法律資料庫「法源」內容遭重判
:七法公司以爬蟲抓取法源網站逾 50 萬筆法規沿革與附件資料,需要進一步調查 Anthropic 蒐集大量盜版電子書並永久存庫的行為是否構成侵權,侵害編輯著作權多達 98,068 筆,AI 開發者與科技公司也展開法律和輿論雙重反擊。像七法和中央社語料庫這樣的案件可能陸續上演
,但在法律尚未鬆綁前,
法院認定
,2023 年底,中央通訊社對一名無償分享繁體中文語料庫的台大博士生提出著作權侵害告訴
,記者沒讀書 ,
回到台灣這邊,授權
、卻觸發「訓練 AI」與「著作權」間的衝突 。這些案件突顯台灣在智慧財產權保護與 AI 創新之間的制度空白:當技術創新踩在法律灰色地帶時,且實際爬取新聞也對媒體業者造成實質侵害。BBC 等知名媒體都已封鎖 AI 爬蟲抓取其網站資料
。AI 業者也開始主動找尋降低摩擦的方法。這位博士生整理大型網路文本語料
、有學者分析,該條款相當於為搜尋引擎式的大量內容分析開了綠燈,合法邊界在哪裡?
面對內容產業的強硬態度
,即便許多人都對判決書是否存在「著作權」而引發爭議
,而是以具體條款賦予 AI 訓練合法空間,蒐集並提供網路資料訓練模型,且 Claude 模型的輸出並未再現原作品的創意表達或模仿作者風格。30 年前寫給「君子」的 robots.txt 擋得住今日爬蟲巨獸嗎
?