【AI日報】へようこそ!ここは、あなたの人工知能の世界を探求するための毎日のガイドです。毎日、AI分野のホットな話題をお届けし、開発者に焦点を当て、技術トレンドの洞察と革新的なAI製品の応用に関する情報を提供します。

最新のAI製品詳細はこちら:https://top.aibase.com/

1、微信がDeepSeekを導入 テンセントの回答:ユーザーの個人情報やプライバシーデータは使用しません

最近、微信は検索機能にイノベーションを加え、DeepSeek R1モデルの段階的導入テストを開始しました。これは、ユーザーのAI検索体験を向上させることを目的としています。テンセントは、テストに参加するユーザーは無料でこのモデルを使用でき、より充実した検索サービスを利用できると確認しました。この新機能の導入は、微信の検索技術における重要な進歩を示しており、同時にテンセントはユーザーの個人情報は使用せず、ユーザーのプライバシー保護を保証すると約束しています。

【AiBase要約:】

🧠 微信検索にDeepSeek R1モデルが導入され、AI検索機能が向上し、ユーザーはよりスマートな検索体験を楽しむことができます。

🔒 テンセントは、AI検索においてユーザーの個人情報を使用しないと約束し、ユーザーのプライバシーと安全性を確保しています。

🌐 テンセントの複数の製品がDeepSeekモデルの導入を検討しており、より安定した包括的な検索サービスを提供します。

2、百度検索:DeepSeekと文心深度検索機能を全面導入

百度検索は最近、DeepSeekと文心大規模言語モデルの深度検索機能を全面的に導入すると発表しました。これは、ユーザーの検索体験を向上させることを目的としています。文心大規模言語モデルの深度検索機能は2月13日に既に上线しており、マルチモーダル入出力機能を備え、専門家レベルの回答を提供できます。同時に、百度文心インテリジェントプラットフォームもDeepSeekを導入し、開発者がより簡単にモデルを呼び出せるようにします。

QQ_1739754437546.png

【AiBase要約:】

🚀 文心大規模言語モデルの深度検索機能が2月13日に上线し、多様な検索サービスを提供しています。

💡 開発者は百度文心インテリジェントプラットフォームを通じてDeepSeekにアクセスし、インテリジェントエージェントの作成と最適化を簡素化できます。

📅 文心一言は4月1日から全面的に無料で公開され、今後数ヶ月以内に新バージョンもリリースされる予定です。

3、開発者歓喜!バイトダンスのAIプログラミングツールTraeがWin x64版を正式リリース

バイトダンスのAIプログラミングツールTraeのWin x64版が正式リリースされ、開発者ツール分野における新たな重要な進歩を示しています。このアップデートは、ユーザーによりスムーズな操作体験を提供し、開発効率をさらに向上させることを目的としています。TraeのBuilderモードは、AIとの対話を通じてタスクの実行を簡素化し、マルチモーダル機能とスマートな自動補完を組み合わせることで、開発プロセスを大幅に最適化し、開発者が創作に集中できるようにします。

image.png

【AiBase要約:】

🚀 Traeは現在Win x64版に対応し、ユーザーによりスムーズな操作体験を提供します。

🤖 Builderモードでは、ユーザーはAIと対話してタスクを自動的に分解および実行し、作業効率を向上させることができます。

💡 先進的なスマート自動補完機能がユーザーの意図をリアルタイムで予測し、開発効率を大幅に向上させます。

詳細リンク:https://www.trae.ai/

4、マスク氏がxAIがGrok3を発表、「地球上で最も強力なAIモデル」と称賛

世界的な人工知能競争が激化する中、億万長者イーロン・マスク氏が設立した人工知能企業xAIが、最新のチャットボットGrok3を間もなく発表します。マスク氏はGrok3を「地球上で最も賢いAI」と呼び、既存の市場競争ツールを凌駕する能力を強調しています。Grok3は自身の誤りを反省する能力を持ち、データ分析を通じて論理的一貫性を達成できます。

【AiBase要約:】

🌟 マスク氏は今週月曜日にGrok3チャットボットを発表し、「地球上で最も賢いAI」と称賛しています。

💡 Grok3は自身の誤りを反省する能力を持ち、現在の市場にあるすべての競合ツールを凌駕しています。

🚀 世界各国でAIチャットボットの発表が加速しており、市場競争はますます激化しています。

5、UIデザインの神器!Ready AI:プロンプトを入力するだけでプロレベルのウェブページを生成

Ready AIは注目すべきツールで、簡単なテキスト指示でわずか30秒でプロレベルのウェブページインターフェースを生成できます。その独特の点は、リアルタイムプレビューとバージョン比較機能を提供することで、デザインプロセスをより効率的にします。ユーザーはフレーム、カラースタイル、レイアウト構造を自由に選択でき、画像をインスピレーションとしてアップロードすることもできます。

image.png

【AiBase要約:】

🚀 テキスト指示で秒速で2つのバージョンデザインを作成:A/Bテストと履歴バージョンの参照に対応

🛠️ フロントエンドインターフェース生成ツール:完全な機能を実現するにはプログラミングツールとの連携が必要です

💵 段階的な料金プラン:無料版では10個の完全なページを生成できます

詳細リンク:https://readdy.ai/home

6、QQブラウザがDeepSeek-R1フルバージョンを導入 微信公式アカウントなどへのリアルタイムネット検索に対応

QQブラウザは2月16日、DeepSeek-R1モデルのフルバージョンを正式に導入しました。これは、ユーザーによりスマートで便利な検索体験を提供することを目的としています。新しいモデルは、深い思考、ネット検索、複数回にわたる対話、履歴の参照などの機能を備えており、ユーザーが包括的で質の高い回答を得られるようにします。さらに、ユーザーはモバイル端末とパソコンの両方で簡単にこの機能にアクセスでき、検索の精度と効率が向上します。

image.png

【AiBase要約:】

🔗 DeepSeek-R1モデルを導入し、検索体験を強化し、複数回にわたる対話と履歴の参照に対応しています。

📱 ユーザーはモバイル端末とパソコンの両方でDeepSeekモデルを使用でき、微信公式アカウントの情報を含むリアルタイムネット検索を提供します。

📝 メモの作成と本文の抽出機能を提供し、様々な形式でのエクスポートに対応しており、情報の処理効率を向上させます。

7、Light-A-Video:トレーニング不要でビデオの再ライティングを実現

Light-A-Videoは、ビデオの再ライティングにおける時間的一貫性の問題を解決することを目的とした革新的な技術です。一貫性のある光アテンションモジュールと漸進的な光融合戦略を導入することで、この方法は光源の一貫性のない問題を効果的に処理し、ビデオの品質と時間的一貫性を大幅に向上させることができます。実験結果によると、Light-A-Videoは画像の高品質を維持するだけでなく、フレーム間のライティングの滑らかな遷移も保証し、ビデオの再ライティング分野の将来の研究に新たな方向性を提供します。

image.png

【AiBase要約:】

🌟 Light-A-Videoは、トレーニング不要の技術で、ビデオの再ライティングにおける時間的一貫性を実現することを目的としています。

🎥 一貫性のある光アテンションモジュールと漸進的な光融合戦略を採用し、ビデオの再ライティングにおける光源の一貫性のない問題を解決しました。

📈 実験によると、Light-A-Videoは再ライティングされたビデオの時間的一貫性と画像品質を大幅に向上させました。

詳細リンク:https://bujiazi.github.io/light-a-video.github.io/

8、Meta製!Pippo:一枚の人物画像から高解像度多視点画像を生成

Meta Reality Labsが最近発表したPippoモデルは、一枚の普通の写真から最大1K解像度の多視点ビデオを生成できる画期的な技術です。このイノベーションは追加の入力パラメーターを必要とせず、ユーザーは写真一枚を提供するだけで、システムが自動的に生き生きとした立体効果を生成します。開発者の便宜を図るため、Pippoはコードのみのバージョンでリリースされており、ユーザーはモデルを独自にトレーニングして適用できます。

image.png

【AiBase要約:】

🌟 Pippoモデルは、追加の入力なしで、一枚の普通の写真から高解像度の多視点ビデオを生成できます。

💻 コードのみのリリースで、事前トレーニング済みの重みはありません。開発者はモデルを独自にトレーニングして適用できます。

🔍 チームは今後、ユーザーエクスペリエンスを向上させるため、より多くの機能と改善をリリースする予定です。

詳細リンク:https://github.com/facebookresearch/pippo

9、マイクロソフトがOmniParser V2.0を発表:スクリーンショットをLLMが処理できる構造化形式に変換

マイクロソフトが発表したOmniParser V2.0は、ユーザーインターフェースのスクリーンショットを構造化データに変換することを目的とした新しい解析ツールで、大規模言語モデルベースのユーザー操作体験を向上させます。このツールは、改良されたデータセットとアルゴリズムにより、画像認識の精度と処理速度を大幅に向上させ、ユーザーが仮想マシンを操作する際の効率性を高めます。

【AiBase要約:】

🔍 OmniParser V2.0は、UIスクリーンショットを構造化情報に変換し、ユーザー操作体験を向上させます。

⚡ 新バージョンでは平均遅延が0.6秒/フレームに短縮され、精度は39.6%に達しています。

🔐 使用時には入力内容のセキュリティに注意し、開発者はセキュリティ基準と倫理規範に従う必要があります。

詳細リンク:https://huggingface.co/microsoft/OmniParser-v2.0

10、月の裏側解明o1:Long-CoTが鍵、モデルの思考には長期的な視点が必要

月の裏側研究者であるFlood Sung氏は、長文の中でk1.5モデルの開発思想とOpenAI o1モデルの技術的示唆について深く掘り下げています。この記事では、Long-CoT(長鎖思考)の重要性を強調し、小型モデルのトレーニングにおける顕著な効果を示しています。以前はコストの観点からLong Contextの最適化に重点を置いていましたが、OpenAI o1の発表により、チームは技術の方向性を再検討し、Long-CoT研究を全面的に推進して、より人間に近い思考能力を実現することを決定しました。

QQ20250217-143705.png

【AiBase要約:】

🌟 Long-CoTは、小型モデルのトレーニングにおける多桁演算で顕著な効果を発揮することが証明されており、出力端における重要性が強調されています。

💡 OpenAI o1の発表により、月の裏側チームは技術の優先順位を再検討し、パフォーマンスの向上を最優先事項としました。

🔍 月の裏側チームは、o1モデルを体系的にベンチマークし、関連分野で実質的な研究を行うことを目指しています。

詳細リンク:https://mp.weixin.qq.com/s/sJmT-tM3A-mglZ1d4OI80A

11、80%の精度!Metaが非侵襲型ブレイン・コンピューター・インターフェースを開発、思考だけでタイピングが可能に

Metaは最近、人間の脳の神経信号を読み取ることで文字入力を実現できる非侵襲型ブレイン・コンピューター・インターフェースデバイスを開発しました。この技術は、脳磁図(MEG)スキャナーと深層学習AIモデルを利用して、タイピング時の脳波信号を解読し、完全な文章を再構築することに成功しました。デバイスの重量は約半トン、価格は200万ドルと高価で、特殊な環境で使用が必要ですが、現在の精度は80%に達しています。

image.png

【AiBase要約:】

🧠 Metaが開発した非侵襲型ブレイン・コンピューター・インターフェースデバイスは、脳信号を通じて文字入力を実現できます。

💰 このデバイスは半トンの重さがあり、価格は200万ドルと高価で、特殊な環境で使用しなければなりません。

📊 現在の精度は80%ですが、まだ改良が必要であり、実用化にはまだ距離があります。