【AI日報】へようこそ!ここは、あなたが毎日人工知能の世界を探求するためのガイドです。毎日、AI分野のホットなコンテンツをご紹介し、開発者に焦点を当て、技術トレンドの洞察や革新的なAI製品の応用を理解するお手伝いをします。

最新のAI製品詳細はこちら:https://top.aibase.com/

1.理想汽車のAI大規模言語モデルアプリが間もなく登場!「理想同学」がスマホにやってきて、万能な生活アシスタントに

理想汽車のCEO、李想氏は2024理想AI Talkで、「理想同学」AI大規模言語モデルアプリが12月27日に正式にリリースされると発表しました。このアプリは、スマートな体験を車内からスマホまで拡張し、便利な生活アシスタント機能を提供します。ベータ版では、強力な認識能力と自然言語処理能力が示され、ユーザーの質問に素早く答え、生活用品を認識することができました。

image.png

【AiBase要約:】

🚗 「理想同学」アプリは、スマートな体験を車内からスマホまで拡張し、万能な生活アシスタントになります。

🔍 アプリには強力な物体認識機能があり、関連情報と解決策を迅速に提供できます。

📱 「理想同学」の登場は、理想汽車がAIエコシステムを積極的に拡大し、ユーザーの生活の利便性を向上させることを示しています。

2.Deepseek V3がオープンソース化!多言語プログラミング能力が大幅に向上し、Claude3.5Sonnet V2を凌駕

待ちに待ったDeepseek V3がついにオープンソース化され、卓越した多言語プログラミング能力を示し、Claude3.5Sonnet V2などの競合製品を上回りました。aiderによる多言語プログラミング評価での成功率は、V2.5の17%から48%に大幅に向上し、質的な飛躍を示しています。Deepseek V3は6850億パラメーターの混合専門家アーキテクチャを採用しており、複雑なタスクの処理をより効率的に行うことができます。

image.png

【AiBase要約:】

🌟 Deepseek V3は多言語プログラミング評価で優れた性能を発揮し、成功率48%を達成しました。

🧠 6850億パラメーターの混合専門家アーキテクチャを採用し、モデルの計算効率を向上させています。

🔧 オープンソース化は、AIコミュニティに新たな活力を与え、各業界のインテリジェント化を促進します。

詳細リンク:https://huggingface.co/deepseek-ai/DeepSeek-V3-Base/tree/main

3.XiaomiがAI大規模言語モデルの展開を加速、GPU万枚規模のクラスタを構築中

Xiaomiは、GPU万枚規模のクラスタを積極的に構築しており、AI大規模言語モデルに大規模な投資を行っており、AI分野における決意と実力を示しています。Xiaomiの大規模言語モデルチームは設立以来、6500枚のGPUリソースを保有しており、この計画は数ヶ月前から実施されており、雷軍氏が重要な役割を果たしています。DeepSeek-V2の主要開発者である羅福莉氏の参加により、XiaomiのAI技術における革新と応用がさらに促進される可能性があります。

【AiBase要約:】

🚀 XiaomiはGPU万枚規模のクラスタを構築し、AI大規模言語モデルへの投資を拡大しています。

🔍 羅福莉氏がXiaomiに参加し、大規模言語モデルチームを率いて技術革新を推進する可能性があります。

📈 XiaomiのAI技術は複数の分野を網羅しており、徐々に様々な事業部門に適用されています。

4.階躍星辰が画像生成モデルStep-1X-Mediumを発表、図生図などの新機能に対応

上海階躍星辰智能科技有限公司は、Step-1X-Mediumバージョンの画像生成モデルを発表し、生成速度と画像テキストの一貫性を大幅に向上させました。「図生図」機能に対応しており、ユーザーは簡単な指示で画像の詳細を強化したり、スタイルを変換したりできます。さらに、中国風の創作能力も強化され、東洋美学をより適切に捉えることができます。

image.png

【AiBase要約:】

🚀 生成速度が30%向上し、理解力と画像テキストの一貫性が大幅に向上しました。

🎨 「図生図」機能を追加し、詳細の強化、スタイルの変換、部分的な修正に対応しています。

🖌️ 中国風の創作能力を強化し、東洋風のキャラクターイメージを最適化し、ブランドデザインのニーズに対応しています。

詳細リンク:https://platform.stepfun.com/

5.ChatGPTの検索機能に潜在的なリスク:悪用され、信頼できない内容が出力される可能性

最近の調査では、OpenAIのChatGPTの検索機能に潜在的なセキュリティリスクがあることが明らかになりました。ChatGPTはウェブページのサマリーを処理する際に、隠されたコンテンツの影響を受ける可能性があり、不正確な評価や悪意のあるコードが返される可能性があります。これらの隠されたコンテンツは、サードパーティの指示や宣伝情報である可能性があり、ChatGPTの判断に影響を与えます。専門家は、このリスクが修正されない場合、ユーザーに大きなリスクをもたらすと警告しています。

【AiBase要約:】

🚨 ChatGPTは隠されたコンテンツによって操作され、不正確な評価が返される可能性があります。

🔍 隠されたテキストはChatGPTの評価に影響を与え、ページにネガティブなコメントがあっても影響を与えます。

🛡️ OpenAIは、検索ツールのセキュリティを向上させるために、潜在的な問題の修正に積極的に取り組んでいます。

6.テンセント研究が新型翻訳モデルDRT-o1を発表、文学作品翻訳を刷新

グローバル化が進むにつれて、ニューラル機械翻訳技術は、言語間のコミュニケーションにおいてますます重要になっています。テンセント研究チームが発表したDRT-o1翻訳システムは、文学作品翻訳に特化しており、マルチエージェントフレームワークを使用して隠喩や比喩の処理を最適化することで、翻訳の正確性と流暢性を大幅に向上させています。実験結果では、DRT-o1はBLEUスコアとCOMETスコアで大幅な向上を示し、文学翻訳分野における強力な能力を示しています。

image.png

【AiBase要約:】

🌟 DRT-o1システムには、7Bと14Bの2つのバージョンがあり、マルチエージェントフレームワークを使用して隠喩と比喩の翻訳を最適化しています。

📚 研究チームは、400冊の公共ドメインの書籍から63,000個の文学的な文を抽出して選別し、トレーニングデータとして使用しました。

🚀 DRT-o1はBLEUスコアとCOMETスコアで大幅な向上を示し、強力な文学翻訳能力を備えています。

詳細リンク:https://github.com/krystalan/DRT-o1

7.羅永浩氏がAI分野に進出、AI大規模言語モデル人材を募集

羅永浩氏が最近注目を集めているのは、AI分野への転身ですが、実際にはAR産業を諦めたわけではありません。AR技術はまだ成熟するまでに時間がかかるため、まずはAI製品を発売する計画です。羅永浩氏の新会社である細紅線科技有限公司は、AI分野の専門人材を積極的に募集しており、職種にはAIエンジニアリング開発エンジニア、大規模言語モデルアルゴリズムエンジニアなどがあります。

image.png

【AiBase要約:】

🚀 羅永浩氏はARを諦めたわけではなく、技術が成熟するまで時間がかかるため、まずはAI製品を発売します。

💼 細紅線科技有限公司は、AIエンジニアリング開発エンジニア、大規模言語モデルアルゴリズムエンジニア、AIプロダクトマネージャーなどを募集しています。

🌐 新製品は海外市場向けとなる可能性があり、海外ソーシャルメディア運営担当者や越境EC運営担当者を募集しています。

8.AI創業のベテラン胡雲華氏が智譜に参加、「智譜清言」のC端アプリケーション責任者に就任

胡雲華氏の参加は、「智譜清言」に新たな発展の機会をもたらし、AI分野における豊富な経験と技術的背景は、競争の激しい市場でこの製品が際立つのに役立ちます。「智譜清言」は現在、ユーザー数の増加と有料化への転換という課題に直面しており、胡雲華氏は製品定義とユーザー維持に関して効果的な戦略調整を行う必要があります。

【AiBase要約:】

🌟 胡雲華氏が「智譜清言」に参加し、この製品の技術と管理における新たな章を刻みました。

📈 「智譜清言」は現在2500万人のユーザーを擁し、年間収益は1000万元を超えると予想されていますが、激しい市場競争に直面しています。

💡 胡雲華氏のAI創業経験と大手企業での開発経験は、「智譜清言」の製品開発を強力に支えます。

9.NVIDIAのGB300/B300 GPUが登場!推論性能が大幅に向上、サプライチェーンに大規模な再編

NVIDIAは、GB200とB200を発売してからわずか6ヶ月後に、新しいGB300とB300 GPUを発表しました。これらの新製品は、推論モデルの性能を大幅に向上させており、特にメモリと計算能力において顕著です。B300のFLOPS性能は50%向上し、メモリ容量も288GBに増加し、メモリ帯域幅は8TB/sを維持しています。サプライチェーンに関しては、NVIDIAはSXM Puckモジュールに移行し、より多くのOEMとODMが製造に参加できるようになりました。

image.png

【AiBase要約:】

⚡ B300 GPUはTSMC 4NPプロセスを採用し、FLOPS性能はB200と比較して50%向上し、メモリは288GBにアップグレードされました。

💡 NVL72アーキテクチャにより、72個のGPUが協調して動作し、推論性能と対話性を向上させ、遅延を削減します。

🔗 サプライチェーンの再編により、より多くのOEMとODMが製造に参加できるようになり、NVIDIAの粗利益率に影響を与える可能性があります。

詳細リンク:https://semianalysis.com/2024/12/25/nvidias-christmas-present-gb300-b300-reasoning-inference-amazon-memory-supply-chain/

10.マスク氏予測:AIの知能は2025年には個人の人間を超え、2030年には全人類を超える可能性

億万長者のイーロン・マスク氏は、ソーシャルメディアXで人工知能に関する最新の予測を発表し、今後数年間でAI技術が驚異的な進歩を遂げると述べています。彼は、2025年末までにAIの知能が個人の人間の知能を超え、2027年から2028年にはAIが全人類の知能を超える可能性があると予測しています。この予測は、特にAIの潜在的なリスクに関する議論を引き起こしています。

【AiBase要約:】

🌟 2025年末までに、AIの知能は個人の人間の知能を超えると予想されています。

🚀 2027年から2028年には、AIが全人類の知能を超える可能性があります。

⚠️ 将来のAIの発展は、メリットよりもデメリットの方が大きくなる可能性があり、潜在的なリスクに注意する必要があります。

11.人工知能がサッカーの解説を行う:反則を識別し、重大性を評価し、解説を行うことができる

上海交通大学とアリババの研究者らは共同で、MatchVisionという新しい人工知能システムを開発しました。これは、サッカーの試合を観戦し、重要なプレーを識別し、人間のアナウンサーのような解説を提供することができます。このシステムは、大規模データセットSoccerReplay-1988に基づいており、正確度は84%に達します。研究によると、AIと人間のアナウンサーは解説の重点が異なっており、将来的には自動で試合ハイライトを作成したり、審判の判定を支援したりすることができる可能性があります。

QQ20241226-095420.png

【AiBase要約:】

🔍 MatchVisionシステムは、ゴールや反則など24種類の試合イベントを識別でき、正確度は84%に達します。

🗣️ AIと人間のアナウンサーは、解説の重点が異なります。AIは技術的な詳細に注目する一方、人間は感情の流れに注目します。

📊 研究チームは、より多くの研究者や開発者が利用できるように、データセットとモデルをオープンソース化する予定です。

12.2024年にGoogleが実現した5つの最大のAIイノベーションを総括

2024年、Googleは人工知能分野で顕著な進歩を遂げ、多くの革新的な技術を発表しました。これらの技術は、ユーザーエクスペリエンスの向上だけでなく、技術の限界を押し広げるものとなっています。Gemini2.0はエージェント機能を導入し、Veo2はビデオコンテンツ生成の方法を変え、Marinerプロジェクトは人と機械のインタラクションを改善し、LearnLMは教育にパーソナライズされたサポートを提供し、NotebookLMはユーザーが情報をより適切に管理するのに役立ちます。

【AiBase要約:】

🌟 Gemini2.0はエージェント機能を導入し、マルチモーダル推論を実現し、ユーザーインタラクションエクスペリエンスを向上させています。

🎥 Veo2は、高品質で文脈的に正確なコンテンツを提供することで、ビデオ生成の新しい基準を確立しました。

📚 LearnLMは、パーソナライズされたAIチューターを通じて、教育体験を強化し、生徒と教育関係者をサポートします。