【AI日報】へようこそ!ここは、AIの世界を探求するためのあなたの毎日のガイドです。毎日、AI分野のホットなコンテンツをご紹介し、開発者に焦点を当て、技術トレンドの洞察や革新的なAI製品の応用に関する情報を提供します。
最新のAI製品詳細はこちら:https://top.aibase.com/
1、NVIDIAへの挑戦!AMDが最強AIチップ「Ryzen AI 300シリーズ」を発表
AMDはComputexテクノロジーショーで最新のAIチップ製品ラインを発表し、Zen5アーキテクチャを採用したRyzen 9 9950XプロセッサとRyzen AI 300シリーズAPUを披露し、AI分野におけるNVIDIAへの挑戦を表明しました。

【AiBase要約:】
🚀 NVIDIAとAMDがComputexテクノロジーショーで最新の技術成果を発表。AMDはZen5アーキテクチャを採用したRyzen 9 9950XプロセッサとRyzen AI 300シリーズAPUを発表。
💥 リサ・スーCEOは、Zen5アーキテクチャのRyzen CPUがより広いCPUエンジン命令ウィンドウを備え、完全なAVX-512スループットをサポートすることで、AI性能を2倍に向上させたと強調。
🔥 AMDのRyzen AI 300シリーズAPUはXDNA AI NPUを採用し、最大50TOPSの演算能力を実現。競合他社の性能基準を上回っています。
2、Sunoが新機能を発表!口ずさむだけで曲が作れる!
Sunoは最近、口ずさむ声から完全な曲を生成できるエキサイティングな新機能を発表しました。これは、AIが音楽創作分野に無限の可能性をもたらすことを示しています。Sunoの革新的な取り組みは、音楽創作に新たな活力を吹き込み、ユーザーが日常の音声から音楽作品を創作することを可能にし、音楽創作の可能性を広げています。Sunoの今後の更なる革新に期待しましょう。
【AiBase要約:】
🎵 口ずさむだけで作曲:Sunoの新機能を使えば、短いメロディーを口ずさむだけで完成度の高い楽曲を作成可能。音楽と原音の融合も自然です。
🎶 日常の音声を音楽に変換:Sunoの新機能は、あらゆる音声を音楽作品に変換でき、その技術力の高さ、創造性を示しています。
🎤 音楽創作への活力の注入:Sunoの革新的な取り組みは、音楽創作分野に新たな活力を与え、音楽創作の可能性を広げています。
詳細リンク:https://top.aibase.com/tool/suno-ai
3、昆侖万維が2000億パラメータのスパース大規模言語モデル「Skywork-MoE」をオープンソース化
昆侖万維は、画期的なスパース大規模言語モデル「Skywork-MoE」をオープンソース化しました。このモデルは、高い性能と大幅な推論コスト削減を実現し、大規模かつ高密度なLLMに対する効果的なソリューションを提供します。
【AiBase要約:】
🌟 オープンソースと商用利用無料:Skywork-MoEのモデルウェイト、技術レポートは完全にオープンソース化され、商用利用も無料です。AI分野の発展を促進します。
💡 推論コストの削減:Skywork-MoEは、性能を維持しながら推論コストを大幅に削減し、大規模データ処理の課題を解決します。
🚀 技術革新と性能上の優位性:Skywork-MoEは、単一の4090サーバーでの推論をサポートする初のオープンソースの千億パラメータMoE大規模モデルであり、高い性能と大量のパラメータ数を誇ります。
詳細リンク:https://top.aibase.com/tool/skywork-moe
4、Adobeが超解像度ビデオモデル「VideoGigaGAN」を発表
Adobeと研究者チームが共同で、フレームレートの連続性と細部描写の両方を兼ね備えた超解像度ビデオモデル「VideoGigaGAN」を発表しました。このモデルは、超解像度ビデオモデルにおける時間的連続性と細部描写の問題を解決し、ビデオ処理分野に大きな進歩をもたらしました。

【AiBase要約:】
⭐ VideoGigaGANはGigaGANモデルをベースに開発され、時系列畳み込み、自己注意機構層、オプティカルフロー誘導モジュールを追加することで、超解像度ビデオモデルの時間的連続性と細部描写の問題を解決しています。
⭐ VideoGigaGANは、時系列畳み込みを使用してビデオフレーム間の時間的依存関係を捉え、自己注意機構層で空間的な詳細とテクスチャ情報を抽出し、オプティカルフロー誘導モジュールで特徴の空間的一貫性を維持することで、鮮明な超解像度ビデオを生成します。
⭐ VideoGigaGANは、ビデオ超解像度、時間的一貫性、詳細な描写、アンチエイリアシング処理などの機能を備え、様々なビデオ処理シーンに適用できます。
詳細リンク:https://top.aibase.com/tool/videogigagan
5、スタンフォード大学のAI研究チームが清華系モデルの剽窃疑惑で謝罪
この記事では、スタンフォード大学のAI研究チームが開発したオープンソースモデル「Llama3-V」が、清華系スタートアップ企業である面壁智能が開発したオープンソースモデル「小鋼炮(MiniCPM-Llama3-V2.5)」を剽窃したとして物議を醸していることを報じています。発覚後、スタンフォード大学の主要著者2名は面壁智能チームと一般の人々に謝罪し、Llama3-Vモデルの全てを撤回すると約束しました。
【AiBase要約:】
🔍 スタンフォード大学のAI研究チームが開発したLlama3-Vモデルが、清華系スタートアップ企業面壁智能が開発したMiniCPM-Llama3-V2.5モデルの剽窃疑惑が浮上。
🚨 ネチズンがLlama3-Vモデルの構造とコードが「小鋼炮」モデルと酷似していることを発見し、大きな注目と議論を呼びました。
🔗 面壁智能チームが剽窃を事実確認。スタンフォード大学の主要著者2名がSNSで公に謝罪し、Llama3-Vモデルの全てを撤回すると約束しました。
詳細リンク:https://top.aibase.com/tool/minicpm-llama3-v-2-5
6、マルチモーダルモデルが進化、ポーカーや「12点計算」ができるように
この記事では、UCバークレーなどの研究チームが提案した新しい強化学習フレームワーク「RL4VLM」を紹介しています。このフレームワークは、マルチモーダル大規模モデルの意思決定タスクにおける性能を大幅に向上させました。このモデルは、強化学習による微調整を通して、ポーカーや「12点計算」などのタスクを学習し、GPT-4vを凌駕しました。この研究チームは多くの著名な研究者で構成され、その成果はGitHubで公開されています。

【AiBase要約:】
🧠 新しい強化学習フレームワークRL4VLMが、マルチモーダル大規模モデルの意思決定能力を大幅に向上させ、GPT-4vを上回りました。
🌟 研究チームは、チューリング賞受賞者であるヤン・ルカン氏など、著名な研究者で構成されています。
💡 RL4VLMは強化学習による微調整を採用し、環境報酬情報を直接使用することで、マルチモーダルモデルに自律的な意思決定能力を与えています。
論文アドレス:https://arxiv.org/abs/2405.10292
プロジェクトアドレス:https://top.aibase.com/tool/rl4vlm
7、OpenAIスピンオフ企業の人工知能モデル、ロボットに人間のような思考と学習能力を付与
この記事では、OpenAIからスピンオフしたCovariantが発表した人工知能モデルについて紹介しています。このモデルは、ロボットに人間のような思考と学習能力を与えることができます。このモデルは推論と物理能力を組み合わせ、マルチモーダル入力、自律的なタスク実行、フィードバックとインタラクション、適応性などの特徴を備え、ロボット学習と自動化技術における大きな進歩を示しています。

【AiBase要約:】
🤖 CovariantのAIシステムは、推論能力と物理的な器用さを融合。RFM-1モデルは様々な入力タイプを処理し、ロボットがタスクの要求をより包括的に理解できるようにします。
🧠 ロボットは自律的にタスクを実行し、フィードバックとインタラクションに基づいて提案を行い、特定のタスクコードに依存することなく環境に適応。プログラミングプロセスを簡素化します。
🔗 CovariantのAIシステムは、ロボットに視覚認識、思考、行動、学習能力を与え、自動化の柔軟性と効率性を向上させます。
8、ビットコインマイナーがAI企業に数百万ドル投資、数十億ドルの収益を目指す
ビットコインマイナーのCore Scientificは、クラウド企業CoreWeaveと35億ドル規模の提携を結び、AI事業を拡大し、AI分野の需要増に対応します。この動きは、多大な収益をもたらし、ビットコインの半減期による課題への対応としてマイナー企業の転換を促進します。
【AiBase要約:】
⭐ ビットコインマイナーのCore ScientificとCoreWeaveが35億ドル規模の提携を結び、AI事業を拡大。
⭐ AI分野の需要は大きく、多大な収益をもたらし、マイナー企業の転換を促進。
⭐ ビットコインマイナーはAI市場で多様な収入源を模索し、半減期による課題に対応。
9、IBMが効率的なLLMベンチマーク手法を発表、計算コストを99%削減
IBMリサーチは、LLMの評価に必要な時間とコストを大幅に削減する革新的なLLMベンチマーク手法を発表しました。この手法は、ミニチュア化されたベンチマークテストを使用することで、AIコミュニティの注目を集め、AIモデル評価分野の急速な発展を促進すると期待されています。
【AiBase要約:】
⭐️ 革新的なLLMベンチマーク手法により、計算コストを99%削減。
⭐️ この効率的な手法は、ミニチュア化されたベンチマークテストを使用し、LLMの評価に必要な時間とコストを削減。
⭐️ AIコミュニティの注目を集め、広く採用され、AIモデル評価分野の発展を促進すると期待されています。
10、マッキンゼーのグローバル調査:生成AIの導入が価値を生み出し始めている
AIの広範な応用は組織の運営方法を変えつつありますが、同時にいくつかの負の影響も引き起こしています。マッキンゼーの調査によると、AIはマーケティングやセールスなどの分野でコスト削減と収益増加をもたらしていますが、不正確さと安全性は依然として懸念事項です。高パフォーマンス企業はGenAIの導入においてより多くの課題に直面していますが、ベストプラクティスを通じて成功を収めています。
【AiBase要約:】
⭐️ 65%の組織がAIを定期的に使用しており、GenAIは複数の分野で広く活用され、コスト削減と収益増加をもたらしています。
⭐️ 44%の回答者がGenAIの使用から悪影響を受けており、主なものとしては不正確さ、サイバーセキュリティ、知的財産権侵害などのリスクが挙げられます。
⭐️ 高パフォーマンス企業はGenAIの導入においてより多くの課題に直面していますが、リスク認識の向上、明確なプロセスの構築、従業員のスキル向上を通じて成功を収めています。
