【AI日報】へようこそ!ここでは、毎日人工知能の世界を探求するためのガイドとして、AI分野のホットな話題を毎日お届けします。開発者を重視し、技術トレンドの洞察や革新的なAI製品の応用に関する情報を提供します。

最新のAI製品詳細はこちら:https://top.aibase.com/

1、世界最速のAI推論アーキテクチャCerebras Inference、速度が20倍に向上!

Cerebras Systemsが発表したCerebras Inferenceは、AI推論を根本的に変革し、極めて低いコストで20倍の速度を実現し、AI計算の新たな基準を打ち立てます。この画期的なソリューションは、業界をリードする精度を維持しながら驚異的な速度を実現し、AI推論の新時代を切り開きます。

image.png

【AiBase要約:】

🌟 速度が20倍に向上し、価格競争力も高く、AI推論の新時代を切り開きます。

💡 各種AIモデルに対応し、特に大規模言語モデル(LLM)で優れた性能を発揮します。

🚀 3種類のサービスレベルを提供し、開発者や企業ユーザーは柔軟に選択できます。

2、Claudeの超強力な視覚化機能Artifactsが全ユーザーに無料開放

AnthropicのAIスタートアップ企業が、Claudeシリーズの大規模言語モデルの新機能「Artifacts」を発表しました。ユーザーは、インタラクティブな視覚化、グラフ、または小規模ゲームを簡単に生成でき、創作効率を向上させることができます。この機能は、無料版、プロフェッショナル版、チーム版ですべて利用可能になり、モバイル端末にも対応し、世界中のクリエイティブな交流を促進します。

image.png

【AiBase要約:】

🔧 Claude Artifacts機能は、無料版、プロフェッショナル版、チーム版の全ユーザー向けに開放され、モバイル端末にも対応しています。

🌍 無料版とプロフェッショナル版のユーザーのみがArtifactsを公開・再作成でき、世界中のクリエイティブな交流を促進します。

📊 多様な出力形式に対応し、開発者、製品マネージャー、デザイナー、マーケティング・セールスチームなど、幅広いユーザーの業務効率向上に役立ちます。

3、AI界の推論マスター!OpenAIがFBIに「ストロベリー」プロジェクトを公開、秋頃のリリース予定

OpenAIは、米国の国家安全保障担当官に「ストロベリー」プロジェクトを公開し、安全かつ合理的な範囲内で開発・利用することを約束しました。ストロベリーは、チャットボットの一部として、数学やプログラミングの問題解決能力を備えています。同社の事業は急速に成長しており、評価額は860億ドルに達しています。

image.png

【AiBase要約:】

🍓 OpenAIのストロベリープロジェクトは、複雑な数学やプログラミングの問題解決に焦点を当てています。

🚀 同社の事業は急速に成長しており、大規模言語モデル(LLM)とChatGPTのサブスクリプション収入は前年比で2倍に増加し、評価額は860億ドルに達しています。

🔍 ストロベリーで生成された高品質なトレーニングデータを使用することで、AIモデルのエラーを大幅に削減できる見込みです。

4、智譜がCogVideoX-5Bビデオ生成モデルをオープンソース化 低スペックPCでも動作可能

魔搭ModelScopeコミュニティは最近、国産オープンソースSoraビデオ生成モデルCogVideoXの大規模バージョンであるCogVideoX-5Bを正式にオープンソース化しました。新しいモデルは、ビデオ生成の品質と視覚効果が大幅に向上しており、3D因果変分自己符号化器とエキスパートTransformer技術を採用し、テキストとビデオの埋め込みを組み合わせ、3D-RoPEを位置エンコーディングとして使用し、3D全注意機構を用いて時空間の統合モデリングを行っています。また、漸進的トレーニング技術を採用することで、顕著な運動特徴を持ち、一貫性があり、長時間の高品質ビデオを生成できます。

image.png

【AiBase要約:】

✨ 新モデルCogVideoX-5Bは、ビデオ生成の品質と視覚効果が大幅に向上しています。

🔍 CogVideoX-5Bは大規模DiTモデルに基づいており、テキストからビデオを生成するタスク向けに設計されています。

⚙️ 3D因果変分自己符号化器とエキスパートTransformer技術を採用し、テキストとビデオの埋め込みを組み合わせ、3D-RoPEを位置エンコーディングとして使用し、3D全注意機構を用いて時空間の統合モデリングを行っています。

詳細リンク:https://modelscope.cn/models/ZhipuAI/CogVideoX-5b

5、夸克PC版AIが全面的にアップグレード AI検索、AI創作、AI要約などの機能を統合

夸克PC版アプリは全面的にアップグレードされ、AI検索、AIライティング、AI PPT、AIファイル要約などの主要機能が強化されました。AI検索機能は、より強力なモデル能力を備え、より高速なインタラクション速度を実現し、業界標準をリードしています。ライティング機能は、約200種類の原稿作成に対応し、高品質な記事を迅速に作成できます。システムレベルの全シナリオAI機能により、ユーザーはショートカットキーを使用してAI機能を呼び出し、検索、解釈、翻訳、校正などの操作を実行できます。

image.png

【AiBase要約:】

✨ AI検索機能がアップグレードされ、インタラクション速度が向上し、正確な回答を提供します。

📝 約200種類の原稿作成に対応し、30秒以内で高品質な記事を作成できます。

🔍 システムレベルの全シナリオAI機能により、ショートカットキーでAI機能を呼び出し、検索、解釈、翻訳、校正などが可能です。

6、テスト期間中は無料トライアル!元象が物理ベースの3Dモーション生成モデルMotionGenを発表

深圳元象信息科技が発表したMotionGenモデルは、中国の3D AIGC分野における大きなブレークスルーです。大規模モデル、物理シミュレーション、強化学習などのアルゴリズムを融合することで、ユーザーはシンプルなテキスト指示で、リアルで滑らかな3Dモーションを迅速に生成できます。このモデルは、3Dコンテンツ制作のハードルを下げ、創作の自由度と効率を向上させ、アニメーション、ゲーム、映画、仮想現実業界に大きな意味を持ちます。

image.png

【AiBase要約:】

⚙️ MotionGenモデルは、3Dコンテンツ制作のハードルを大幅に下げ、初心者でも簡単に高品質なアニメーションを作成できます。

🤖 MotionGenは正確なテキスト理解能力を備え、あらゆる複雑なモーションのアイデアに対応し、テキストからモーションへのシームレスな変換を実現します。

🌟 MotionGenGPTアルゴリズムは、様々な技術を組み合わせることで、モーション生成の細部表現力と整合性を向上させています。

7、智譜AIがGLM-4-Flashをオープンソース化:無料利用、多様なシーンに対応

智譜AIオープンソースプラットフォームは最近、GLM-4-Flashモデルを無料で公開すると発表し、AIアプリケーション分野における新たなイノベーションの波をリードすると期待されています。このモデルは高速で経済的で、さまざまなタスクに適用でき、多言語に対応しており、実行効率の向上と推論コストの削減を実現しています。幅広い用途と優れた性能を備え、既に多くの分野でその可能性を示しています。ユーザーはアンケートに回答することで、無料の微調整特典を受け取ることができます。

【AiBase要約:】

⚙️ GLM-4-Flashモデルは無料で利用でき、簡単なタスクに適しており、多言語に対応し、実行効率の向上と推論コストの削減を実現しています。

💡 GLM-4-Flashは優れた性能を備え、生成速度が速く、リアルタイムのウェブ検索機能と関数呼び出し機能を備えています。

🌐 GLM-4-Flashは幅広い用途があり、バイオデータ処理、トレーニングデータ生成、AIアシスタント作成、翻訳アプリ開発など、多くの分野で可能性を示しています。

詳細リンク:https://bigmodel.cn/console/trialcenter?modelCode=glm-4-flash

8、Google MeetがAIによる自動議事録機能を発表、会議での情報漏洩の心配はもう不要

Google Meetは、会議の記録をより便利かつ効率的にする新機能「議事録作成」を発表しました。この機能は、会議の内容を自動的に要約するだけでなく、遅刻した参加者向けの会議サマリーも提供し、常に会議の進捗状況を把握できるようにします。また、会議の議事録はGoogleドキュメント形式で保存され、参加者に自動的に送信されるため、ワンストップサービスを提供します。機能は強力ですが、現時点では英語のみ対応で、AIが誤りを犯す可能性もあります。2024年9月10日までに、すべてのGoogle Workspaceユーザーに展開される予定です。

image.png

【AiBase要約:】

📌 会議の内容を自動的に要約し、会議記録の効率を向上させます。

🕒 遅刻した参加者向けの会議サマリーを提供し、会議の進捗状況を迅速に把握できるようにします。

📄 会議の議事録はGoogleドキュメント形式で保存され、参加者に自動的に送信され、便利なサービスを提供します。

9、AIが神話の世界を再構築:抖音のブロガーが8日で「山海経」の壮大なビジュアルを作り出し、ネットユーザーは中国中央テレビを超えたと称賛

中国の豊かな文化遺産の中で、「山海経」は間違いなく輝く宝石です。抖音のブロガーであるAI疯人院は、人工知能技術を利用して8日間で「山海経」のAIリメイク動画を完成させ、原作の幻想的な世界を正確に再現し、大きな話題を呼び、視聴者から好評を得ています。この新しい創作方法は、AIが動画制作分野で持つ可能性を示し、コンテンツ制作に新たな可能性をもたらします。

image.png

【AiBase要約:】

🌟 抖音のブロガーAI疯人院は、人工知能技術を用いて「山海経」を再構築し、幻想的な世界を正確に再現した動画は、その品質に驚嘆させられます。

🔮 動画制作はわずか8日間で完了し、AIが短編動画制作分野で持つ可能性を示し、制作コストと期間を大幅に削減しました。

🎮 視聴者からの好評が殺到しており、中国中央テレビを超えるクオリティだと評価する声もあり、「山海経」IPをゲーム化する可能性を示唆しています。

10、AI顔交換の乱象:トランプ氏がAIの偽画像を信じてしまい、マスク氏もなりすまし詐欺の被害が頻発

最近、トランプ氏が偽の画像をリツイートしたことでテイラー・スウィフトのファンから反発を受け、マスク氏もAI顔交換詐欺事件に巻き込まれました。これらの事件は、投資と情報収集には注意が必要であり、デジタル時代において偽情報被害者にならないように注意すべきことを警告しています。

image.png

【AiBase要約:】

🤖 トランプ氏が偽の画像をリツイートしたことでテイラー・スウィフトのファンから反発を受けました。

🔍 マスク氏がAI顔交換詐欺事件に巻き込まれ、被害者は数十万ドルの投資を失いました。

😱 AI顔交換技術を使った詐欺事件では、マスク氏が最も頻繁に使われるなりすましターゲットの1人となっています。

11、Google Gemini 1.5シリーズモデルの新バージョンがリリース

Googleは最近、Gemini 1.5シリーズモデルの最新バージョンであるGemini 1.5 Flash-8B、Gemini 1.5 Flash、Gemini 1.5 Proを発表し、性能が大幅に向上しました。開発者たちは、Gemini 1.5 Flashの包括的な性能向上に興奮しています。しかし、新モデルに対するユーザーのフィードバックは二極化しており、Gemini 2.0の全面的なアップグレードを期待するユーザーもいれば、現在のアップデートの速度と性能を評価するユーザーもいます。

【AiBase要約:】

✨ Gemini 1.5シリーズモデルは、数学、プログラミング、複雑なプロンプトにおいて顕著な改善が見られます。

🚀 Gemini 1.5 Flashは、1000万トークンを超えるマルチモーダル入力を処理でき、適応能力が高いです。

🛠️ ユーザーのフィードバックは二極化しており、Gemini 2.0の全面的なアップグレードを期待するユーザーもいれば、現在のアップデートを評価するユーザーもいます。

12、小さくてもパワフル!香港大学の最新レコメンドシステムEasyRecはテキストからユーザーの気持ちを理解

情報があふれる現代において、レコメンドシステムは情報を絞り込むための重要なツールとなっています。EasyRecの登場は、レコメンド内容が好みと合致しない、精度が低いといった問題を解決するかもしれません。言語モデルに基づいたこのレコメンドシステムは、ユーザーの好みを予測する点で優れた性能を発揮します。

【AiBase要約:】

🔍 EasyRecは言語モデルに基づいたレコメンドシステムで、テキスト情報を分析してユーザーの好みを予測します。

🧠 EasyRecの中核技術はテキスト行動アラインメントフレームワークで、ユーザー行動のストーリーを分析して潜在的な好みを予測します。

🚀 EasyRecは複数のデータセットでテストされ、優れた性能を示しており、特に新規ユーザーや新規商品のゼロショットレコメンドシナリオに強みがあります。

詳細リンク:https://arxiv.org/pdf/2408.08821

13、デロイトが生成AIに関する最新レポートを発表

デロイトの最新レポートは、企業における生成AIへの投資状況と課題を明らかにしています。多くの企業が生成AIへの投資を増やしていますが、プロジェクトはまだ試験段階にあります。企業は、データフィードバックの不足や実装上の障害などの課題に直面しています。レポートでは、生成AIの価値を明確に示すことが継続的な投資を促進するために重要であると強調しています。

【AiBase要約:】

🌟 約66%の企業が生成AIへの投資を増やしていますが、多くのプロジェクトはまだ試験段階にあります。