記事本文

AIトレーニングデータ不足：高品質データは2026年までに枯渇の可能性

公開AI二ュ-ス

時間 :Nov 8, 2023

読む :1分

AI業界の急速な発展に伴い、高品質なデータは強力なAIアルゴリズムにとって極めて重要となっていますが、2026年までにデータ不足が深刻化するとの予測があります。このデータ不足問題への対策としては、既存のデータをより効果的に活用できるようアルゴリズムを改良すること、そして合成データを用いてシステムを訓練することが挙げられます。さらに、AI企業はクリエイターとAI企業間の力関係の不均衡を是正するため、データの取得に費用を支払う必要性も出て来るかもしれません。

著作権紛争の終結者？アマゾンがAIコンテンツ許諾市場を計画

アマゾンはコンテンツ許諾市場を計画しており、出版者とAI企業をつなぎ、合法的で透明な著作権取引プラットフォームを提供し、AIトレーニングデータの著作権紛争に対処する予定です。

Feb 11, 2026

147.1k

OpenAIが請負業者に本物の作業成果をアップロードするよう要求し、知的財産権に関する懸念を引き起こした

OpenAIとデータトレーニング企業は、高品質な訓練データを収集し、ホワイトカラー業務の自動化を進めるため、契約社員に実際の業務事例の提出を求めています。具体的な作業内容と成果物の詳細な報告が必要です。....

Jan 12, 2026

181.6k

ピュリツァー賞受賞者が中心となり、6社のAI大手を告訴！集団訴訟は訓練データの著作権侵害を指摘、賠償請求額は数十億ドル規模に

著名作家らがOpenAIなど6社を提訴。無断で海賊版書籍をAI学習に使用したと主張し、著作権侵害を指摘。成立すれば1作品最大15万ドルの賠償請求が可能で、総額は数十億～数百億ドルに上る可能性。....

Dec 24, 2025

200.4k

上海人工知能研究所が小規模言語多モーダルデータセット「万巻・シルクロード2.0」をオープンソース化

上海人工知能研究所が公開した多言語多モーダルコーパス「万巻・シルクロード2.0」が正式にオープンソース化されました。このコーパスは、既存のアラビア語、ロシア語、韓国語、ベトナム語、タイ語の5言語に加え、セルビア語、ハンガリー語、チェコ語の3つの希少言語データを追加し、テキスト、画像、音声、ビデオの4つのモーダルを網羅しています。データ総量は1150万件を超え、音声・ビデオの長さは2万6000時間を超え、小規模言語多モーダル分野における重要なリソースとなっています。

Apr 17, 2025

153.6k

1000人のアーティストがAIへの著作権販売に抗議し「サイレント」アルバムを発表

1000人以上のアーティストが、英国政府によるAIへの著作権販売に抗議するため、新しいアルバムをリリースしました。このアルバムは、この問題に対する彼らの懸念を示すために、あえて無音のトラックで構成されています。

Feb 25, 2025

134.9k

インテリジェントな未来、あなたの人工知能ソリューションシンクタンク