【AI日報】へようこそ!ここは、あなたの人工知能の世界を探求する毎日のガイドです。毎日、AI分野のホットなニュースをお届けし、開発者に焦点を当て、技術トレンドの洞察や革新的なAI製品の応用について理解を深めるお手伝いをします。

最新のAI製品詳細はこちら:https://top.aibase.com/

1、OpenAIがCanvasツールを発表 ChatGPTのライティングとコーディング効率を向上

OpenAIは12月11日、ChatGPTユーザーのライティングとコーディングプロジェクトの効率を向上させることを目的としたCanvas機能を発表しました。新しいインターフェースであるCanvasは、編集と修正が必要なコンテンツの処理に特化しており、ユーザーはさまざまな方法でCanvasにアクセスし、豊富なショートカットキーと機能を利用できます。この機能はPythonコードの実行をサポートするだけでなく、ユーザーによるGPTのカスタマイズも可能にし、人間と機械の協調的な作業体験を強化します。

image.png

【AiBase要約:】

🖥️ Canvas機能は、すべてのChatGPTユーザー向けに公開されており、ウェブ版とWindowsアプリに対応しています。Macとモバイルプラットフォームへの対応も間近です。

🔧 ユーザーはさまざまな方法でCanvasにアクセスし、ショートカットキーやPythonコードの実行などの機能を利用して、作業効率を向上させることができます。

💬 CanvasはGPTのカスタマイズとコメント機能をサポートしており、ユーザーはフィードバックと編集の提案を得て、人間と機械の協調を促進することができます。

2、Doubaoパソコン版の動画生成機能がクローズドベータテストを開始 毎日10本の動画を無料で生成可能

バイトダンス傘下のDoubaoパソコン版の動画生成機能がクローズドベータテストを開始し、一部ユーザーが体験版を利用できるようになりました。ユーザーはベータテストへの応募を通じて、doubao.comにアクセスし、動画生成機能を利用して画像をアップロードし、プロンプトを入力することで、運鏡や分鏡の情報と組み合わせて動画コンテンツを生成できます。ベータテスト期間中は、ユーザーは毎日10本の動画を無料で生成できます。

image.png

【AiBase要約:】

🆕 クローズドベータテスト機能が公開され、一部ユーザーが体験版を利用できるようになりました。

📸 ユーザーは画像をアップロードし、プロンプトを入力して動画を生成でき、毎日10本まで無料で生成できます。

🔧 字節跳動は今後、この機能を最適化し、より多くのユーザーによる創作を支援する予定です。

3、DeepSeek AIが新版DeepSeek-V2.5-1210を発表: 数学、プログラミング、ライティング能力が大幅に向上

DeepSeek AIは最近、DeepSeek-V2.5-1210を発表しました。これは強化版であり、AIの数学、プログラミング、ライティング、推論タスクにおけるパフォーマンスを向上させることを目的としています。新バージョンでは、コア機能の改良とアルゴリズムの最適化により、モデルの信頼性と使いやすさが大幅に向上しました。数学タスクの完了率は74.8%から82.8%に、リアルタイムコーディングのスコアは34.38%に向上しました。

image.png

【AiBase要約:】

🔢 数学タスクの完了率が82.8%に向上し、強力な数学問題解決能力を示しています。

💻 リアルタイムコーディングのスコアが34.38%に向上し、リアルタイムコーディングタスクで顕著な進歩を示しています。

📝 ライティングと推論能力が向上したことで、論文作成や論理分析において優れたパフォーマンスを発揮します。

詳細リンク:https://huggingface.co/deepseek-ai/DeepSeek-V2.5-1210

4、AdobeとMITが共同でCausVid動画生成モデルを開発、最初のフレームの遅延はわずか1.3秒!

CausVidは、AdobeとMITが共同で開発した画期的な動画生成モデルであり、毎秒9.4フレームの速度で高品質な動画をリアルタイムで生成でき、最初のフレームの遅延はわずか1.3秒です。この技術は、従来の動画生成モデルの速度制限を突破し、ゲーム、仮想現実、ストリーミングなどの分野に前例のない可能性をもたらします。CausVidは、革新的な因果関係生成方式と非対称蒸留技術を採用することで、生成効率を大幅に向上させています。

image.png

【AiBase要約:】

⚡ CausVidは毎秒9.4フレームの速度で動画をリアルタイムで生成し、最初のフレームの遅延はわずか1.3秒で、動画生成効率を大幅に向上させています。

🛠️ 因果関係生成方式と非対称蒸留技術を採用することで、CausVidは次のフレームの内容を迅速に予測し、計算コストを削減できます。

🎮 テキストから動画、画像から動画など、さまざまな動画生成タスクに対応しており、ゲームや仮想現実などの分野のイノベーションを推進しています。

詳細リンク:https://causvid.github.io/

5、視覚中国と生数科技Viduが提携 AI動画コンテンツ生成ソリューションを開発へ

最近、視覚中国と北京生数科技有限公司は戦略的パートナーシップを締結し、視覚産業の大規模言語モデルプラットフォームとアプリケーションの共同開発、および人工知能の視覚コンテンツ産業への深い適用を推進することを目指しています。この協力を通じて、両社は視覚中国の豊富な著作権準拠リソースと生数科技のマルチモーダル大規模言語モデル技術を統合し、コンテンツクリエイターにより効率的なサービスを提供します。

【AiBase要約:】

📈 両社は視覚産業の大規模言語モデルプラットフォームを共同で開発し、産業のインテリジェント化アップグレードを推進します。

🤝 視覚中国は豊富な視覚コンテンツリソースを提供し、生数科技はマルチモーダル大規模言語モデル技術を提供します。

🌍 国内外市場の共同開拓を行い、ユーザーニーズに応じたAI動画生成アプリケーションを開発します。

6、AI対話型製品は天井に直面か? 字節跳動が「即夢」と「剪映」の優先順位を高める

Doubaoのユーザー数は増加していますが、アクティブ率と利用時間は依然として課題となっています。バイトダンスの上層部は、テキストベースのAI対話型製品には限界があると判断し、リソースを「即夢」や「剪映」などの低インタラクションのマルチモーダルAI製品に投入することを決定しました。「即夢」はAI創作プラットフォームとして多くのクリエイターを引きつけ、「剪映」のユーザー数も増加しています。

【AiBase要約:】

📉 Doubaoのユーザーアクティブ率は低く、平均して週に2〜3日しかアクティブではなく、利用時間は約10分程度です。

💡 字節跳動は、商業化の可能性を高めるため、リソースを「即夢」などの低インタラクションのマルチモーダルAI製品に投入することを決定しました。

📊 猫箱のユーザーの平均会話ターン数はDoubaoの約50倍であり、低インタラクション製品の魅力を示しています。

7、世界初のAIエージェントプログラマーDevinが全面的に利用可能に 月額料金は500ドル

世界初のAIプログラマーDevinが正式に利用可能になり、月額500ドルという料金が話題となっています。強力な機能を備え、自動コーディングやチームワークの効率向上を実現しますが、高額な料金のため、小規模チームや個人ユーザーにとっては負担が大きいです。多くのユーザーが、さまざまなユーザーのニーズに対応するため、よりユーザーフレンドリーな個人向けサブスクリプションモデルの導入を求めています。

image.png

【AiBase要約:】

🌐 Devinの月額料金は500ドルで、市場で最も高価な生成型AI製品の1つとなっています。

👥 ユーザーは個人向けサブスクリプションモデルの導入を求めており、現在の価格設定は小規模チームや個人ユーザーにとって不親切だと考えています。

⚙️ Devinは強力な自動コーディング機能を備えており、チームワークにおいても優れたパフォーマンスを発揮し、開発効率を大幅に向上させることができます。

Devinの体験アドレス: app.devin.ai

8、SolosがAIグラスAirGo Visionを発表: ChatGPTを統合し、音声コマンド機能に対応

Solosが最近発表したAirGo Visionスマートグラスは、スマートウェアラブルデバイスの新時代を象徴しています。このグラスはChatGPT人工知能と高解像度カメラを統合しており、ユーザーエクスペリエンスを向上させるだけでなく、音声コマンド機能にも対応しており、ユーザーは自然言語でデバイスと対話できます。

image.png

【AiBase要約:】

📸 AirGo VisionはChatGPTとカメラを搭載した初のスマートグラスであり、ユーザーエクスペリエンスを向上させています。

🤖 音声コマンド機能を備えており、ユーザーは自然言語でデバイスと対話できます。

🌐 今後は健康モニタリングやナビゲーションなどのより多くの実用的な機能を統合し、スマートグラスのアプリケーションシナリオを強化する予定です。

9、面壁智能が数億元の新たな資金調達ラウンドを実施 エッジ側など大規模言語モデルの商業化展開を加速

北京面壁智能科技有限責任公司は最近、数億元の資金調達ラウンドを完了し、エッジ側AI大規模言語モデルの商業化展開を加速させることを目指しています。このラウンドの資金調達は複数の投資機関が共同でリードしており、面壁智能は調達した資金を活用して、高効率の大規模言語モデルサービスを向上させ、業界で認知できる価値創造を目指しています。

image.png

【AiBase要約:】

💰 このラウンドの資金調達額は数億元で、複数の投資機関が共同でリードしており、資金はエッジ側AI大規模言語モデルの商業化展開を加速するために使用されます。

📈 面壁小鋼炮MiniCPMは、高効率で低コストな利点を活かし、グローバルオープンソースコミュニティのスタープロジェクトとなり、ダウンロード数は300万を突破しました。

🤝 华为、百度などの業界のリーダー企業と協力し、消費電子製品や新興ハードウェアにおけるエッジ側インテリジェンスの応用を推進しています。

10、YouTubeがAIによる自動吹き替え機能を拡大 数十万人のクリエイターが恩恵を受ける

YouTubeは最近、特に知識や情報系のコンテンツを対象に、人工知能駆動の自動吹き替え機能を数十万のチャンネルに拡大すると発表しました。この機能は、動画のリーチを拡大し、さまざまな言語を話す視聴者をより多く獲得することを目的としています。クリエイターは動画をアップロードすると、システムが自動的に吹き替えバージョンを生成します。

image.png

【AiBase要約:】

🌐 数十万のチャンネルがAIによる自動吹き替え機能を利用できるようになり、知識や情報系のコンテンツに重点が置かれています。

🎤 クリエイターは公開前に吹き替えをプレビューでき、気に入らないバージョンはキャンセルまたは削除できます。

🤖 YouTubeは、現在も不完全な点があるものの、吹き替えの品質を継続的に向上させることを約束しています。

11、OpenAI CFO: トランプ氏が「AI大統領」になる可能性も、マスク氏は国家利益を優先すると確信

ニューヨークで開催されたReuters NEXTカンファレンスで、OpenAIのCFOであるSarah Friar氏は、人工汎用知能(AGI)開発の重要な時期に、ドナルド・トランプ氏がこの世代の人工知能の大統領になる可能性があると述べました。彼女はテスラ創業者のイーロン・マスク氏を信頼しており、彼が国家利益を優先すると考えています。

【AiBase要約:】

🌟 トランプ氏が「AI時代の总统」になる可能性があり、AGIの重要な時期に就任する予定です。

🤖 OpenAIのSoraツールの需要が急増しており、現在アカウント登録は一時停止され、より良いフィードバック収集を目指しています。

📈 ChatGPTのユーザー数は200万人から300万人に急増しており、新しい推論モデルに対する市場の強い需要を反映しています。

12、AIセキュリティ警報!Claudeのデバイス制御機能がハッカーに突破され、セキュリティへの懸念を引き起こす

最近、Anthropic社が発表したClaude AIのComputer Use機能に深刻なセキュリティ脆弱性が発見され、セキュリティ専門家のJohann Rehnberger氏が、簡単なプロンプトインジェクションによってAIが誘導され、マルウェアをダウンロードして実行されることを明らかにしました。この脆弱性はClaudeだけでなく、他のAIチャットボットにも影響を与え、AIセキュリティ問題への懸念を高めています。

【AiBase要約:】

🔍 研究者らは、Claude AIのComputer Use機能にプロンプトインジェクションの脆弱性があることを発見し、マルウェアのダウンロードにつながる可能性があります。

💻 この脆弱性を悪用する方法はZombAIsと呼ばれ、攻撃者はAIに悪意のあるコードの作成と実行を誘導できます。

⚠️ Anthropic社はユーザーに予防措置を講じるよう促し、Claudeを機密データや操作と直接接触させないようにしています。