
- AI企業に対する著作権訴訟が増加しており、ジフ・デイビスなどのメディア企業が無断スクレイピングに法的手段で対抗している。
- robots.txtやペイウォールといった従来のボット対策は、AIクローラーには効果が限定的であり、多くのパブリッシャーが防御不能な状況に直面している。
- パブリッシャーはAI企業とのレベニューシェアやアクセス制御ツールの導入を進めているが、技術・資金面で劣勢にあり、訴訟以外の対抗策が見いだしにくいのが現状である。
またしても、パブリッシャーがオープンAI(OpenAI)を訴えた。
著作権侵害をめぐって、オープンAIを提訴した複数のメディア企業にジフ・デイビス(Ziff Davis)が加わった。
しかし、この訴訟は業界全体の実情を浮き彫りにしている。パブリッシャーは依然として、AI企業による無償のコンテンツスクレイピングを阻止するための、有効な手段を持ち合わせていない。
法的な圧力が高まっているとはいえ、Webマイニングはすでに完了している。ChatGPTをはじめとする大規模言語モデル(LLM)は、膨大なインターネット上のデータを使って訓練されており、その多くはパブリッシャー側が対応に乗り出す前にスクレイピングされていた。
最近では、robots.txtファイルやペイウォール、AIブロックタグといった対策も登場しているが、多くのパブリッシャーが認めるように、すべてのボットのアクセスを防ぐのは極めて難しい。特に、標準的なプロトコルを無視したり、身元を隠したりするボットへの対応は困難を極める。
robots.txtだけでは限界。パブリッシャーは防御の主導権を持てない
「平均的なパブリッシャーが、時価総額3000億ドル(約43兆円)に上る企業、オープンAIに対抗しようとしている。『ボットウォール』の構築や、それを回避する技術への対抗投資を進め、急速に進化する技術に追随するのは極めて困難だ。私の見立てでは、パブリッシャーは圧倒的に不利な立場に置かれている」と、マザーエコノミクス(Mather Economics)でデジタルコンサルティング部門のマネージングディレクターを務めるアーヴィッド・チフジェル氏は語る。
[▼会員登録をして続きを読む▼]
The post 加速する AIスクレイピング という課題 パブリッシャーの防御不能な現実 appeared first on DIGIDAY[日本版].
Source: New feed
