AI日報：1秒で画像生成！NVIDIAが文から画像生成モデルSanaをオープンソース化；OpenAIが経済青写真発表；Adobeの新AIツールで1万枚の画像を一括編集

【AI日報】へようこそ！ここは、AIの世界を探求するためのあなたの毎日のガイドです。毎日、AI分野のホットな話題を皆様にお届けし、開発者に焦点を当て、技術トレンドの洞察と革新的なAI製品の応用を理解するお手伝いをします。

最新のAI製品詳細はこちら:https://top.aibase.com/

1、衝撃登場！NVIDIAが画像生成モデルSanaをオープンソース化、1秒で画像生成、中国語、英語、絵文字に対応

NVIDIAは最近、画像生成モデルSanaをオープンソース化しました。わずか0.6億個のパラメータと最大4096×4096ピクセルの解像度で画像を生成できるため、使用障壁が大幅に低くなりました。このモデルは16GBのGPUを搭載したマシンで1秒以内に高品質な画像を生成でき、優れたパフォーマンスを発揮します。Sanaは、深層圧縮自己符号化器と線形拡散変換器を採用することで、生成速度と品質を向上させ、複数の言語プロンプトにも対応しており、ユーザーの創作活動を容易にします。

【AiBase要約：】
🌟 高効率生成：Sanaは、最大4096×4096ピクセルの高品質画像を高速に生成でき、一般的なノートパソコンのGPUでも使用できます。
⚙️ 革新的な設計：深層圧縮自己符号化器と線形拡散変換器により、生成速度と品質が大幅に向上しました。
🚀 優れた性能：Sanaは複数のテストで優れたパフォーマンスを示し、スループットは他の先進的なモデルよりも大幅に高く、迅速なコンテンツ作成をサポートします。
詳細はこちら:https://nv-sana.mit.edu/

2、OpenAIがAI経済の青写真を発表、米国による規制強化と発展を呼びかけ

OpenAIは最近発表した「経済の青写真」において、米国政府および同盟国と協力して政策を議論し、AI分野における米国の技術リーダーシップを強化することを目指しています。この青写真では、資金、人材、リソースの獲得の重要性を強調し、現在の規制モデルに対する懸念も表明しています。OpenAIは、政府による投資の拡大、AIモデルの悪用を防ぐためのベストプラクティスの策定、そして開発者に対する知的財産権の柔軟性の提供を呼びかけています。

【AiBase要約：】
💰 米国はAI競争力を強化するために数十億ドルの資金を誘致する必要があります。
⚖️ OpenAIは、州法の矛盾と現在の規制に対する懸念を表明しています。
🌱 新しいエネルギーとデータ伝送への投資拡大を政府に推奨しています。

3、Mistralが次世代プログラミングモデルCodestral25.01を発表、プログラミング速度が2倍に

Mistral社は最近、オープンソースのコード生成モデルCodestralの最新バージョンであるCodestral25.01を発表しました。コード生成速度が大幅に向上し、以前のバージョンと比べて2倍になっています。新バージョンはPythonコーディングテストで優れたパフォーマンスを発揮し、HumanEvalテストで86.6％のスコアを獲得しました。このモデルは低遅延と高頻度操作に重点を置いており、コード修正、テスト生成などのタスクに適しており、特に大量のデータを取り扱う企業にとって重要です。

【AiBase要約：】
🌟 MistralはCodestral25.01を発表、コード生成速度が以前のバージョンと比べて2倍に向上しました。
💻 このモデルはPythonコーディングテストで優れたパフォーマンスを発揮し、HumanEvalテストで86.6％のスコアを獲得しました。
📈 Codestral25.01はCopilot Arenaで瞬く間にトップに躍り出ており、開発者から広く注目されています。
詳細はこちら:https://mistral.ai/news/codestral-2501/

4、清華大学、復旦大学、スタンフォード大学が共同で「Eko」フレームワークをオープンソース化、Agentによるコンピューターの自動操作を実現

最近、清華大学、復旦大学、スタンフォード大学は共同で、「Eko」と呼ばれるAgent開発フレームワークを発表しました。これは、シンプルなコードと自然言語を使用して、開発者が生産で使用できる「仮想従業員」を迅速に構築することを目的としています。Ekoフレームワークはユーザーのコンピューターとブラウザを制御し、人間に代わって様々な面倒なタスクを実行することで、作業効率の大幅な向上と人間の負担軽減を実現します。

【AiBase要約：】
🌟 Ekoフレームワークはユーザーのコンピューターとブラウザを制御し、人間に代わって面倒なタスクを実行します。
🔧 自然言語とプログラミング言語を組み合わせることで、開発プロセスを簡素化します。
🛡️ 人間によるリアルタイムの監視と介入が可能で、自動化された作業の安全性と正確性を確保します。
詳細はこちら:https://eko.fellou.ai/

5、AdobeがAI駆動のBulk Createを発表、1万枚の画像を一括編集可能に

Adobeは最近、企業のクリエイティブチームが効率的に画像編集を行うための新しいAIツールBulk Createを発表しました。このツールはWebプラットフォームを通じて一括編集機能を提供し、アプリケーションのダウンロードやPhotoshopのライセンスは不要で、作業効率を大幅に向上させます。ユーザーは背景の変更や画像サイズ調整を簡単に実行でき、ブランドのカスタマイズにも対応しており、様々な企業のニーズに対応します。現在テスト段階ですが、近いうちに全面的にリリースされ、クリエイティブ分野におけるAIの応用をさらに推進すると予想されます。

【AiBase要約：】
🎨 Bulk Createは、Webプラットフォームから画像を一括編集でき、デスクトップアプリケーションのダウンロードやPhotoshopのライセンスは不要です。
📏 このツールは背景の変更と画像サイズ調整に対応しており、ソーシャルメディアのプリセットサイズも提供しているため、ユーザーは様々なプラットフォームに迅速に適応できます。
🚀 Adobeは今後、ビデオ対応機能を追加し、Bulk Createの多機能性をさらに強化する予定です。

6、新しいAIモデルLlamaV-o1、推論能力がClaude3.5Sonnetを上回る

アラブ首長国連邦のムハンマド・ビン・ザイード人工知能大学が開発したLlamaV-o1モデルは、マルチモーダルAI分野で新たな基準を確立し、特に複雑なテキストと画像の推論タスクにおいて優れた性能を発揮しています。このモデルは段階的な推論の透明性によって、医療や金融などの業界における応用価値を高め、ユーザーの信頼性を向上させています。

【AiBase要約：】
🌟 LlamaV-o1は新しく発表されたAIモデルで、複雑なテキストと画像の推論タスクに優れています。
📊 このモデルはVRC-Benchベンチマークテストで優れたパフォーマンスを示し、透明性のある段階的な推論プロセスを提供します。
🏥 LlamaV-o1は医療や金融などの業界で重要な応用価値を持ち、信頼性とコンプライアンスを高めることができます。
詳細はこちら:https://mbzuai-oryx.github.io/LlamaV-o1/

7、研究で明らかに：わずか0.001％の偽データでAIモデルが機能不全に陥る可能性

最近の研究では、大規模言語モデル（LLM）のデータトレーニングにおける脆弱性、特に医療分野における脆弱性が明らかになりました。研究によると、ごく少量の偽情報、わずか0.001％の割合でも、モデルが重大な誤りを引き起こし、患者の安全に影響を与える可能性があります。この研究は、医療用途におけるAIツールの使用におけるリスクを強調しており、開発者に対して、モデルの安全性を確保する前に、重要な医療タスクに使用するべきではないと訴えています。

【AiBase要約：】
🌐 研究によると、わずか0.001％の偽情報で、大規模言語モデル（LLM）が機能不全に陥る可能性があります。
🩺 医療分野では、偽情報の拡散が患者の安全に深刻な影響を与える可能性があります。
💡 研究者たちは、安全性を確保する前に、LLMを診断や治療などの重要な医療タスクに使用すべきではないと訴えています。

8、MicrosoftペイントアプリにAI消去機能が追加、無料で利用可能に！簡単に任意の要素を削除！

Microsoftは、定番のペイントアプリをアップデートし、AIベースの消去機能を追加しました。これにより、ユーザーは画像処理をより簡単に実行できます。ユーザーは削除したい要素を簡単に選択するだけで、AIが自動的に認識して削除し、従来の処理プロセスを大幅に簡素化します。2ヶ月間のテストを経て、この新機能はすべてのユーザーに提供され、Microsoftストアから無料でアップグレードして使用できます。

【AiBase要約：】
🌟 AI消去機能：ユーザーは選択するだけで、画像内の要素を簡単に削除できます。
⏳ 使用時間：要素の削除には40～80秒かかる場合がありますが、特別なハードウェアは必要ありません。
🔍 完全性：削除効果は要素周囲の背景の複雑さに依存し、場合によっては理想的ではない場合があります。

9、階躍星辰と茶百道が深度連携

上海階躍星辰智能科技有限公司と茶百道の深度連携は、飲料業界におけるインテリジェント化とデジタル化への転換の重要な一歩を示しています。階躍星辰の大規模言語モデル技術により、茶百道の運用効率が大幅に向上し、特に自己検査と検証において大幅な時間短縮を実現しました。この連携は、店舗の生産運用方法を最適化するだけでなく、消費者により安全でインテリジェントで楽しい奶茶消費体験を提供し、飲料業界の将来の発展可能性を示しています。

【AiBase要約：】
🚀 階躍星辰と茶百道は連携し、インテリジェントな巡回検査とAIGCマーケティングの新たなモデルを探求しています。
📈 Step-1Vマルチモーダル理解大規模言語モデルは数千の茶百道店舗に導入され、運用効率を向上させています。
☕ インテリジェントな巡回検査により、飲料の安全な配送が確保され、消費者のサービス体験が向上します。

10、抖音の創設メンバーである任利鋒氏が設立したGenAIクリエイティブコミュニティHitemsが数千万ドルの資金調達を実施

抖音の創設メンバーである任利鋒氏が創業した数美万物（Sumall）が、数千万ドルのPre-Aラウンドの資金調達を完了しました。リード投資家は美団龍珠で、既存株主も引き続き支援しています。その中核プラットフォームであるHitemsは、生成AIと3Dモデリング技術を組み合わせ、クリエイティブな商品の商品化サービスを提供し、ECとコミュニティのインタラクションを促進します。

【AiBase要約：】
🎉 数美万物（Sumall）は数千万ドルのPre-Aラウンドの資金調達を行い、評価額は約1.5億ドルです。
🛒 HitemsプラットフォームはAI技術を活用してクリエイティブな商品を商品化し、全バリューチェーンサービスを網羅しています。
🌟 創設者の任利鋒氏は抖音の冷起動にも参加しており、豊富な経験を積んでいます。