【AI日報】へようこそ!ここは、人工知能の世界を探求するための毎日のガイドです。毎日、AI分野のホットなニュースをお届けし、開発者に焦点を当て、技術トレンドの洞察と革新的なAI製品の応用に関する情報を提供します。

最新のAI製品詳細はこちら:https://top.aibase.com/

1.百度世界2024大会で文心iRAGとノーコードツール「秒哒」が発表

百度世界2024大会で、百度創業者である李彦宏氏が、AIアプリケーションの新たな潮流をリードする文心iRAG技術とノーコードツール「秒哒」を発表しました。これらの技術の導入により、AI生成コンテンツの実用性と開発効率が大幅に向上し、クリエイティブ産業に革命的な変化をもたらすと期待されています。李彦宏氏は、技術応用の強力な効果を実演し、AIアプリケーションが新たな時代に入ることを示唆しました。

image.png

【AiBase要約:】

🌟 文心iRAG技術は、大規模モデルによる画像生成における幻覚問題を解決し、実用性を向上させました。

💻 ノーコードツール「秒哒」を使用すると、ユーザーは自然言語で複雑なアプリケーション開発を実現でき、技術的なハードルを下げることができます。

🤖 インテリジェントエージェントは、将来のAIアプリケーションの主要な形態となり、企業のマーケティングとサービスの効率向上を促進します。

2.通義千問がQwen2.5-Coder全シリーズをオープンソース化、GPT-4o並みのコード能力を実現

通義千問チームは、Open Code LLMsの発展を促進するために、最新のQwen2.5-Coder全シリーズをオープンソース化しました。このシリーズのモデルは、強力で多様性があり、実用的なことで知られています。特にQwen2.5-Coder-32B-Instructモデルは、コード能力においてSOTAレベルに達し、GPT-4oに匹敵します。オープンソース化された4つのサイズのモデルは、主要な6つのモデルサイズを網羅し、さまざまな開発者のニーズに対応します。

image.png

【AiBase要約:】

🚀 Qwen2.5-Coder-32B-Instructモデルは、コード生成、修正、推論など、包括的な能力を備え、コード能力においてSOTAレベルに達しました。

💡 Qwen2.5-Coderは、複数のコード生成ベンチマークテストで最高の結果を示し、Aiderベンチマークテストでは73.7点を獲得し、40種類以上のプログラミング言語をサポートしています。

🔧 Qwen2.5-Coder-32B-Instructは、複数のプログラミング言語におけるコード修正能力において優れた性能を発揮し、MdEvalベンチマークテストでは75.2点を獲得し、1位にランクインしました。

詳細リンク:https://modelscope.cn/collections/Qwen25-Coder-9d375446e8f5814a

3.秘塔AI検索が特集機能をリリース、お気に入り登録とデータソースのカスタマイズに対応

秘塔AI検索は、ユーザーが資料をナレッジベースにアップロードし、個人または専門分野のデータソースをカスタマイズして、検索効率と関連性を向上させる新しい特集機能を発表しました。ユーザーは専用の検索環境を作成し、検索エクスペリエンスを強化できます。API機能により、特集検索機能をユーザーのプログラムに統合し、パーソナライズされた専門的な検索サービスを提供できます。

image.png

【AiBase要約:】

🔍 ユーザーは資料をナレッジベースにアップロードし、個人または専門分野のデータソースをカスタマイズして、検索効率と関連性を向上させることができます。

📚 ユーザーは、AI検索で表示されたウェブページまたはファイル、気に入った検索結果のお気に入り登録、コンピューター内の資料の直接アップロードの3つの方法でナレッジをアップロードできます。

🔗 秘塔AI検索はAPI機能を提供しており、ユーザーは特集検索機能を自分のプログラムに統合して、学術研究や専門分野におけるさまざまなユーザーのニーズに対応できます。

4.Google DeepMindがAlphaFold3をオープンソース化:ノーベル化学賞受賞モデルが医薬品開発を支援!

Google DeepMindは、AlphaFold3のソースコードとモデルウェイトを公開しました。これは、科学的発見と医薬品開発における大きな進歩を示しています。開発者は2024年のノーベル化学賞を受賞し、タンパク質構造予測への貢献が認められました。AlphaFold3は技術能力が飛躍的に向上しており、タンパク質、DNA、RNA、小分子などの複雑な相互作用をモデル化でき、医薬品発見と疾患治療に非常に重要です。

image.png

【AiBase要約:】

🌟 AlphaFold3の公開は、科学的発見と医薬品開発を加速させます。

🔬 新バージョンは、タンパク質、DNA、RNA、小分子など、複雑な分子相互作用をモデル化できます。

📈 オープンソース化は、科学研究と商業利益のバランスを取り、学術的な探求を促進することを目的としています。

詳細リンク:https://github.com/google-deepmind/alphafold3

5.百度が初の中国語大規模言語モデル搭載AIグラスを発表:45gの軽量設計、56時間の長時間バッテリー

百度は2024年世界大会で、最新のAIハードウェア製品である小度AIグラスを発表し、ウェアラブルデバイス分野における百度の革新的な能力を示しました。この製品は軽量化設計で、重量はわずか45g。16MP超広角カメラを搭載し、バッテリー持続時間は最大56時間です。歩行中での音声検索、カロリー認識、物体百科事典、視覚翻訳など、実用的な機能を豊富に備えています。

image.png

【AiBase要約:】

🔍 小度AIグラスは、中国語大規模言語モデルを搭載した世界初のネイティブAIグラスであり、百度のAIハードウェア分野における革新的な能力を示しています。

📸 小度AIグラスは軽量化設計で、重量はわずか45g。16MP超広角カメラを搭載し、バッテリー持続時間は最大56時間です。

🔊 音響システムは4マイクアレイ設計を採用し、歩行中での音声検索、カロリー認識、物体百科事典、視覚翻訳など、豊富な機能を備えています。

6.最上位のグラフィックカードは不要、MeissonicでSDXLに匹敵する高解像度画像を簡単に生成!

Meissonicは画期的な画像生成モデルです。一連のアーキテクチャの革新と最適化戦略により、非自己回帰マスク画像モデリング技術を、最上位の拡散モデルに匹敵するレベルにまで高めました。性能と効率が大幅に向上し、わずか10億パラメーターで高品質の1024×1024解像度の画像を生成でき、消費レベルのGPUでもスムーズに動作します。Meissonicは、トレーニングプロセスで段階的に最適化され、定量的および定性的指標による評価を通じて、優れた性能と効率を示しています。また、ゼロショット画像から画像への編集においても優れた性能を発揮します。

image.png

【AiBase要約:】

⚙️ アーキテクチャの革新と最適化戦略により、非自己回帰マスク画像モデリング技術のレベルが向上しました。

💡 10億パラメーターで1024×1024の高品質画像を生成し、優れた性能を発揮します。

🔗 Meissonicは、トレーニングプロセスで段階的に最適化され、優れた性能を発揮します。

詳細リンク:https://github.com/viiika/Meissonic

7.AI顔交換技術CHANGER:参照アバター写真とターゲットボディのシームレスな統合

CHANGERは、デジタルコンテンツ制作における顔合成の問題を解決することを目的とした、新しいタイプの顔融合パイプラインです。この技術は、カラーキー技術とH2エンハンスメントを使用して、高忠実度の背景と顔の融合効果を実現します。研究によると、CHANGERは既存の主流の合成技術を上回り、さまざまな産業用途に適しています。

【AiBase要約:】

🌟 CHANGERは、高忠実度の顔合成ソリューションを提供し、顔の形や髪型の違いによって合成境界が不自然になる問題を解決します。

🔧 CHANGERは、カラーキー技術とH2エンハンスメント技術を採用し、アーチファクトのない背景生成とさまざまな顔の形や髪型のシミュレーションを実現します。

📈 CHANGERは、定量的および定性的評価結果において既存の技術を上回り、産業レベルの高忠実度の合成効果を示しています。

詳細リンク:https://hahminlew.github.io/changer/

8.ロボットをよりスマートにしたいですか?清華大学のチームがロボット学習の速習法を発見

この記事では、清華大学研究チームが最近発表した論文について論じています。この論文では、ロボット模倣学習におけるデータ規模化の法則を検討し、効率的なデータ収集戦略を提案することで、ロボットが新しい環境や新しい物体において約90%の成功率を実現することを可能にしました。研究結果によると、データ規模化の法則はロボット学習にとって非常に重要であり、汎用ロボットが複雑な問題を解決するための新しいアイデアを提供しています。

image.png

【AiBase要約:】

🔍 ロボット学習の速習法:清華大学のチームは、効率的なデータ収集戦略を提案し、90%の成功率を実現しました。

📊 データ規模化の法則:べき乗則の関係がロボットの汎化能力に影響を与えます。

💡 効率的なデータ収集戦略:多様な環境でデータを収集し、各環境に1つの物体を使用することで、強力な汎化能力戦略をトレーニングします。

詳細リンク:https://arxiv.org/pdf/2410.18647

9.AIブランドネーミングツールNamify AI

AIブランドネーミングツールであるNamify AIは、企業がブランドネーミングプロセスを簡素化するソリューションを提供します。ブランド名のインテリジェントな生成、商標とドメイン名の自動チェック、無料のロゴ生成サポートにより、企業は適切なブランド名を見つけ、その合法性と可用性を確保できます。Namify AIの登場により、企業は革新的なブランドネーミング方法を獲得し、効率性を向上させ、ブランドプロモーションとイメージ形成を促進します。

image.png

【AiBase要約:】

🌟 AIツールによるブランドネーミングの簡素化:Namify AIは、ブランド名のインテリジェントな生成により、企業が適切な選択肢を迅速に見つけるのに役立ちます。

🔍 商標とドメイン名の自動チェック:このツールは、商標とドメイン名の可用性を自動的にチェックし、ブランド名の合法性を確保します。

🎨 無料のロゴ生成サポート:Namify AIは無料のロゴオプションを提供し、企業のブランドプロモーションとイメージ形成を支援します。

詳細リンク:https://namify.tech/

10.マスク氏がホワイトハウス入り?請願書がトランプ氏にAI顧問への任命を要請!

人工知能分野の重要人物であるイーロン・マスク氏は、「責任あるイノベーションアメリカ」という団体からの請願を受け、トランプ氏にホワイトハウス人工知能特別顧問への任命を要請されました。この動きは、人工知能の安全性、規制、責任に関する議論を引き起こしました。

【AiBase要約:】

🌟 マスク氏がホワイトハウス人工知能特別顧問に指名され、安全と技術開発への貢献が強調されました。

📈 テスラと新興企業xAIへのマスク氏の関与は、人工知能革命における彼の重要な役割を浮き彫りにしています。

⚖️ マスク氏が支持したカリフォルニア州の法案が否決され、大手テクノロジー企業の規制と責任に関する問題が提起されました。

11.百度の文心大規模言語モデル、日間の呼び出し回数が15億回を突破、半年で7.5倍以上の増加

2024年百度世界大会で、百度創業者である李彦宏氏は、文心大規模言語モデルの1日あたりの呼び出し回数が15億回を突破し、過去半年で7.5倍以上増加したと発表しました。この成果は、百度の人工知能分野における急速な発展と技術応用の広範な将来性を示しています。李彦宏氏は、1年以内に20億回に達すれば、百度の業界における地位をさらに強化すると予測していました。

image.png

【AiBase要約:】

🚀 文心大規模言語モデルの1日あたりの呼び出し回数が15億回を突破し、強力な市場需要を示しています。

📈 過去半年で、文心大規模言語モデルの呼び出し回数は7.5倍以上増加しました。

🧠 李彦宏氏は、1日あたりの呼び出し回数が20億回に達すれば、百度の人工知能分野における競争優位性をさらに強化すると予測しています。