【AI日報】へようこそ!ここは毎日人工知能の世界を探索するためのガイドです。毎日、AI分野の注目コンテンツをお届けし、開発者に焦点を当て、技術トレンドや革新的なAI製品・応用を理解するお手伝いをいたします。

新鮮なAI製品:クリックして詳細を確認https://app.aibase.com/zh

1、開発者向けStable Diffusion! FLUX.2がオープンソースでリリース:10枚の画像参照+4MP編集

Black Forest LabsはFLUX.2シリーズモデルを正式にリリースしました。プロ、フレックス、デブ、クラインバージョンを含み、そのうちデブバージョンは32Bパラメータの重みとコードをオープンソース化しています。このモデルは複数の画像参照、4MP編集、テキストレンダリング、現実的な論理などの主要なアップグレードをサポートしており、開発者にとって強力なツールを提供しています。

image.png

【AiBase要約:】

🔥 FLUX.2シリーズモデルは最大10枚のスタイル/構図サンプルをサポートし、生成の一貫性は95%以上です。

🖼️ 4MP解像度の編集機能を提供し、ローカルリペイントや水印除去、背景変更が可能です。

🚀 開発者に優しく、PyTorch、Diffusers、ComfyUIプラグイン、オンラインデモ体験も利用可能です。

2、騰訊(テンセント)の混元3Dクリエーションエンジンが国際サイトに登場

騰訊は正式に混元3Dクリエーションエンジンの国際サイトをリリースしました。海外ユーザーに対して便利な3Dクリエーション体験を提供します。複雑なツールをダウンロードしたり、環境を設定する必要はありません。アカウント登録ログインだけで、テキスト、画像またはスケッチから3D作品を生成できます。また、開発者は3Dモデル生成機能を統合できます。

image.png

【AiBase要約:】

🚀 腾讯が混元3Dクリエーションエンジンの国際サイトをリリースし、3Dクリエーションプロセスを簡素化しました。

🎨 テキスト、画像またはスケッチを使用して簡単に3D作品を作成できます。

🛠️ 開発者はAPIを使って3Dモデル生成機能を統合し、創造的産業の発展を推進できます。

3、字節跳動 TRAE SOLOモード中国版が正式リリースされ、無料でフルフローの効率的な開発を支援

字節跳動 TRAE の SOLOモードが中国版として正式リリースされ、従来のコード生成ツールからソフトウェア配信への深層的な転換を示し、開発者に高度な自動化されたエンドツーエンドの開発体験を提供しています。

image.png

【AiBase要約:】

🧠 SOLOモードは「コンテキストエンジニアリング」の理念に基づき、要件入力から本番稼働までのエンドツーエンドの閉ループ配送を実現しています。

💻 SOLO Coderエージェントは複雑なタスクの最適化をサポートし、機能の改善、コードの再構築、バグ修正などを行います。

🌐 自然言語駆動の配置により、AIは要件分析、プロジェクト初期化、コーディング実施、テスト検証、ワンクリック配置を独自に完了できます。

4、百度が大規模モデル開発部門を新たに設立し、大規模モデル技術を全力で推進

百度は最近、2つの新しい大規模モデル開発部門を設立し、人工知能分野での技術力を強化することを目的としています。基礎モデル開発部は高知能で拡張可能な汎用AI大規模モデルの開発に注力し、呉甜が担当します。一方、応用モデル開発部は業務応用シナリオに必要な専門モデルのチューニングと探求に焦点を当て、賈磊がリードします。これらの2つの部署は百度の最高経営責任者李彦宏に直接報告するため、会社が大規模モデル開発にどれほど重要視しているかがわかります。

image.png

【AiBase要約:】

🌟 百度は2つの新しい大規模モデル開発部署を設立し、CEOに直接報告します。

🧑‍💻 吴甜と賈磊はそれぞれ基礎モデルと応用モデルの開発を担当します。

🚀 百度文心大規模モデル5.0は11月に正式リリースされ、全モードの理解と生成能力を示しています。

5、OpenAI ChatGPTアップグレード:音声とテキストのシームレス結合、マルチモーダルインタラクションの実現

OpenAIのChatGPTはアップグレード後、音声モードをメインチャット画面に統合し、音声とテキストのシームレスな相互作用を実現しました。音声対話中に、関連する視覚情報を見ながらリアルタイムでテキストトランスクリプトが生成されます。さらに、更新ではユーザーが自分のニーズに応じて従来の独立した音声モードを選択できる切り替え機能も提供されています。

image.png

【AiBase要約:】

🎙️ メイン画面で音声とテキストのシームレスな相互作用が可能になります。

🖼️ 音声質問時に、地図や画像などの関連する視覚情報をリアルタイムで表示できます。

🔄 更新には切り替え機能があり、ユーザーは自分のニーズに応じて従来の独立した音声モードを選択できます。

6、Amazonは自社AIプログラミングツールKiroを優先的に推奨し、サードパーティアプリの使用を制限

Amazonは内部メモでエンジニアに自社AIツールKiroを優先的に使用することを推奨し、サードパーティサービスではなく、この動きはAmazonが自身の技術建設を強化し、外部AI開発サービスのサポートを減らそうとする意図を示しています。

image.png

【AiBase要約:】

💻 Amazonはエンジニアに自社AIプログラミングツールKiroを優先的に使用することを強調しています。

🚫 サードパーティAI開発サービスのサポートを制限しており、有名なOpenAIやAnthropicのツールも含まれます。

📢 従業員はKiroを使用する際にフィードバックを提供することが奨励されており、ツールの継続的な改善に貢献しています。

7、Character.AIが「Stories」インタラクティブ小説をリリース:未成年ユーザーは全面的にチャット禁止、AIキャラクターは「ミステリーミッション」モードに移行

Character.AIは新しい機能「Stories」をリリースし、ユーザーが複数の枝分かれしたインタラクティブ小説を作成できるようにし、18歳未満のユーザーはオープンチャットを禁止しています。この機能は安全性を向上させ、審査メカニズムによってセンシティブなコンテンツの拡散を回避することを目的としています。

image.png

【AiBase要約:】

🎮 Character.AIは「Stories」機能をリリースし、ユーザーがインタラクティブ小説を作成できます。オープンチャットの代わりに利用できます。

🔒 平台は18歳未満のユーザーをAIキャラクターとのオープンチャットから完全に禁止し、安全を最優先にしています。

📚 将来的には音声やビデオの断片を導入し、教育IPとの協力を模索し、若年層のユーザーを引きつける予定です。

8、一週間で二社と和解!WMGとSunoが著作権和解を達成し、AI音楽が「有料ダウンロード+制御可能なボイストラック」時代に入る

Warner Music Group(WMG)はAI音楽プラットフォームのSunoと著作権の和解を達成し、新たな著作権許諾契約とビジネスモデルを導入し、AI音楽業界が「有料ダウンロード+制御可能なボイストラック」の新時代に入ったことを示しています。

image.png

【AiBase要約:】

🎧 著作権契約:Sunoは「アドバンスドライセンスモデル」を導入し、アーティストは名前、肖像、声、作品を自主的に制御できます。

💰 ビジネスモデルの変化:音声ダウンロードは有料アカウントが必要で、無料ユーザーは再生とリンク共有のみ可能です。システム内に「ボイストラックフィンガープリント+ウォーターマーク」が組み込まれており、AIカバーをブロックします。

📈 業界の連鎖反応:WMGは一週間以内に2社と和解し、Sunoの評価額は24億5000万ドルに達し、資本の信頼感が高まっています。