【AI日報】へようこそ!ここは、あなたの人工知能の世界を探求するための毎日のガイドです。毎日、AI分野のホットな話題をお届けし、開発者に焦点を当て、技術トレンドの洞察や革新的なAI製品の応用について理解を深めるお手伝いをします。

最新のAI製品詳細はこちらhttps://top.aibase.com/

1、ChatGPT Edu版登場:GPT-4o、カスタムGPT、データ分析に対応

ChatGPT Edu版が登場し、大学キャンパスに多機能ChatGPTを提供することで、学生と教員の学習と教育の質向上を支援します。多くのトップ大学が既に教育にChatGPTを導入しており、18~24歳の若者が主要ユーザー層です。GPT-4o対応、データ分析、カスタムGPTなどの機能を備え、より高いメッセージ制限と音声サポートを提供します。安全対策も万全で、豊富な実用例があります。

【AiBase要約:】

🚀 ChatGPT Edu版が登場し、GPT-4o、カスタムGPT、データ分析に対応し、学習効率の向上を支援します。

🔍 多くのトップ大学が教育でChatGPTを使用しており、18~24歳の若者が主要ユーザー層で、高い学習意欲と受容力を持っています。

💡 期末試験の反省レポート、地域貢献活動、言語トレーニングなど、豊富な実用例があり、教育分野でのChatGPTの活用が深まっています。

2、快手、自社開発のテキストから画像生成の大規模言語モデル製品「可图」をリリース

快手は自社開発のテキストから画像生成の大規模言語モデル「可图」を正式に公開し、ユーザーに全く新しいAI画像作成体験を提供します。この大規模言語モデルは、テキストから画像生成と画像から画像生成の2つの機能に対応しており、AIによる画像創作やAIによるキャラクターカスタマイズに使用できます。「可图」の微信ミニプログラムまたはウェブ版から、簡単に最先端技術を体験できます。

image.png

【AiBase要約:】

🔍 「可图」大規模言語モデルのパラメータ数は10億規模で、データソースはオープンソースコミュニティ、快手内部の構築、および自社開発のAI技術の融合です。

🎨 「可图」は一般的な数千万規模の中国語のエンティティ概念を網羅し、より広範で深い画像創作サポートを提供します。

🧠 「可图」は強化学習と報酬モデル技術を導入し、テキストから画像生成の大規模言語モデルが長いテキストや複雑な意味を持つテキスト入力に対して効果が低いという問題を解決しています。

製品入口:https://top.aibase.com/tool/kuaishouketudamoxingkolors

3、百度網盤、漫画風アバターAI生成機能をリリース

百度網盤は、驚くべきAI新機能をリリースしました。子供の日を前に、ユーザーは写真1枚だけで、子供の頃のアニメの主人公に変身できます。この機能は非常にパーソナライズされており、ユーザーはまるで素晴らしいアニメの世界にいるかのような体験ができます。高速処理により、よりスムーズな体験も提供します。

【AiBase要約:】

🎨 パーソナライズされた変換:ユーザーは写真をアップロードするだけでアニメキャラクターに変身し、独特のスタイルを体験できます。

🚀 高速処理:百度網盤のAI機能は処理速度が非常に速く、わずか数秒で精巧なアニメ風写真を作成できます。

🌟 多様な効果:アニメ風画像への変換だけでなく、古典的なアニメーション効果をシミュレートすることもでき、さまざまなユーザーのニーズに対応します。

4、Claude 3、サードパーティAPIを公開、業務プロセスの自動化を実現

Anthropicの新機能により、ユーザーはClaudeとのインタラクションをより簡単にし、構造化されたAPI呼び出しを通じてさまざまなタスクの自動実行を実現できます。同時に、Claudeは画像を処理し、リアルタイムアプリケーションに統合することもでき、企業によりスマートで効率的なソリューションを提供します。

image.png

【AiBase要約:】

🔍 ユーザーはテキストで質問することで、Claudeにさまざまなタスクを自動実行させます。

🔍 ユーザーは構造化されたAPI呼び出しを通じて、一般的な操作や質問への回答を実現できます。

🔍 Anthropicの新機能により、Claudeは画像とリアルタイムアプリケーションを処理できます。

5、Novita AI、Animate Anyoneプロジェクトをオープンソース化 写真1枚でアニメーション合成が可能に

Novita AIはAnimate Anyoneプロジェクトをオープンソース化しました。ユーザーは写真1枚をアップロードするだけでアニメーションを合成できます。この技術はアニメーション制作に新たな可能性と機会をもたらし、ユーザーはすばらしい作品を迅速に作成できます。

image.png

【AiBase要約:】

👉 ViViDは自然に服を動画の人物に着せることができます。

👉 ワンピースでもズボンでも自由に交換でき、様々な服装試着ニーズに対応できます。

👉 現時点ではデモと論文のみ公開されており、コードは公開されていません。

プロジェクトページ:https://top.aibase.com/tool/vivid

論文アドレス:https://arxiv.org/pdf/2405.11794

6、阿里と中国科学技術大学、共同でバーチャル試着技術ViViDを発表 動画での服の交換を容易に

アリババと中国科学技術大学が共同で開発したViViDフレームワークは、バーチャル試着体験に革命を起こし、動画内の人物の衣服をリアルタイムで交換することを実現しました。時間の一貫性と画像品質の問題を解決し、試着効果を向上させました。

image.png

【AiBase要約:】

👗 先端技術:ViViDは拡散モデル技術に基づき、動画内の衣服のリアルタイム交換を実現し、自然でリアルな効果を生み出します。

🔧 3つの主要コンポーネント:衣服エンコーダー、姿勢エンコーダー、時間モジュールが連携して動作し、衣服の詳細情報を抽出し、姿勢をエンコードし、時間の一貫性を維持します。

🌟 革新的な特徴融合:アテンション特徴融合メカニズムを導入して衣服のセマンティック情報の統合を最適化し、試着効果をユーザーのニーズに近づけます。

詳細リンク:https://top.aibase.com/tool/vivid

7、Perplexity、Page作成機能を発表 専門性の高いドキュメントを迅速に生成

Perplexity AIは最新の機能Perplexity Pagesを発表しました。これは、ユーザーが専門性の高いドキュメントを迅速に生成し、コンテンツクリエイターの生産性を向上させ、従来のナレッジベースプラットフォームに挑戦することを目的としています。このツールはコンテンツを迅速に生成し、高度なカスタマイズ、メディアコンテンツの挿入、情報の検証とソース管理、共有と検索最適化をサポートします。

【AiBase要約:】

🚀 専門性の高いドキュメントを迅速に生成し、時間と労力を節約します。

🔧 高度なカスタマイズにより、さまざまなニーズに対応します。

📸 メディアコンテンツの挿入により、ドキュメントの魅力を高めます。

詳細リンク:https://top.aibase.com/tool/perplexity

8、Midjourney、V6.5版をリリース予定 近日中にウェブ版が全ユーザー向けに公開

MidjourneyはまもなくV6.5版をリリースし、画像品質の大幅な向上をもたらします。ウェブ版も大幅なアップデートが行われます。動画モデルの開発には課題がありますが、チームは継続的な努力により、より大きなブレークスルーを達成できると確信しています。

【AiBase要約:】

🚀 画像品質が大幅に向上し、V7版と同等の可能性があり、一貫性、肌、手、体の表現が改善されます。

💻 ウェブ版はDiscordへの依存から解放され、より優れたユーザーエクスペリエンスを提供します。

💡 スタイル空間エクスプローラーと更新されたエクスプローラーページを導入し、サブスクリプション割引を提供してより多くのユーザーを獲得することを検討しています。

9、Suno 3.5版モデル、全ユーザー向けに公開 4分間の楽曲制作が可能に

Sunoの最新の3.5版モデルは全ユーザーが使用できるようになり、4分間の楽曲制作、2分間の楽曲拡張、改良された楽曲構造などの機能が追加されました。Sunoはまた、あらゆる音を音楽に変換できる新機能を発表し、音楽創作に新たな可能性をもたらしました。1億2500万ドルの資金調達を行い、AI音楽分野におけるリーダーシップを強化しました。Sunoは強力な革新力とリーダーシップを示しています。

image.png

【AiBase要約:】

🎵 4分間の楽曲制作と2分間の楽曲拡張

🎶 あらゆる音を音楽に変換し、新たな可能性を生み出します。

💰 1億2500万ドルの資金調達を行い、リーダーシップを強化しました。

詳細リンク:https://top.aibase.com/tool/suno-ai

10、You.com、カスタムアシスタント機能を発表

You.comはカスタムアシスタント機能を発表し、ユーザーがGPT-4o、Llama3、Claude3などのトップレベルの言語モデルを使用して、パーソナライズされたAIアシスタントを作成できるようにします。これは、複雑な作業タスクにおけるユーザーの生産性を向上させることを目的としています。この機能により、強力な言語モデルへのアクセスが容易になり、個々のニーズに適応できるため、ユーザーはカスタマイズされたAIアシスタントエクスペリエンスを得ることができます。

【AiBase要約:】

⭐️ カスタマイズされたAIアシスタントは、複雑な作業タスクにおけるユーザーの生産性を向上させることを目的としています。

⭐️ You.comは正確性とリアルタイム情報を提供することに尽力しており、オンラインアクセスを通じてより関連性の高い信頼できる応答を提供します。

⭐️ この技術の影響は大きく、カスタマイズされたAIアシスタントは、医療、金融、教育などの分野における知識労働を変える可能性を秘めています。

11、Cartesia、低遅延音声生成モデルSonicを発表 ChatGPTのリアルタイム音声チャットを再現?

Cartesiaが発表した低遅延音声生成モデルSonicは、その高速推論速度と超低遅延が注目を集めています。Sonicは、リアルな感情と表現力を持つ音声をリアルタイムで生成でき、ユーザーは10秒間の録音を提供するだけで話者の音声特性を模倣できます。Cartesiaの目標はリアルタイムインテリジェントシステムの構築であり、革新的なSSMアーキテクチャを導入し、初期段階の成果を上げています。

image.png

【AiBase要約:】

🚀 Sonicモデルの遅延はわずか135ミリ秒で、チャットアプリケーションに適しています。

😊 Sonicは人間の感情と表現力を示し、会話をより自然なものにします。

🔧 ユーザーは音程、速度、感情などのパラメーターを調整して、音声出力をカスタマイズできます。

詳細リンク:https://top.aibase.com/tool/carteisa-sonic

12、Gartner、2024年の人工知能チップの売上高は712億ドルに達すると予測

Gartnerの予測によると、2024年の世界人工知能半導体の売上高は33%増加し、712億ドルに達するとされています。このトレンドは、コンピューターが普遍的に人工知能機能を備えることを促進し、企業によるコンピューター購入は完全に人工知能コンピューターに移行すると予想されます。AI処理は主にデータセンターで行われ、アクセラレーターの価値は210億ドルに達すると予想されます。

【AiBase要約:】

📈 2024年の世界人工知能半導体の売上高は33%増加し、712億ドルに達すると予想されます。

💻 2024年にはコンピューターの22%が人工知能機能を備えていると予想され、2026年末までに企業によるコンピューター購入は完全に人工知能コンピューターに移行すると予想されます。

🏭 AI処理は主にデータセンターで行われ、2024年にはサーバーで使用されるAIアクセラレーターの価値は210億ドルに達すると予想されます。

13、Googleを凌駕!高精細3Dアバターが恐ろしいほどリアルに再現 まばたき、眉の動きも完璧

最近、ドイツのミュンヘン工科大学とユニバーシティ・カレッジ・ロンドンなどの研究チームが提案したNPGAアルゴリズムが注目を集めています。このアルゴリズムは、高精細3Dアバターを生成でき、リアルな表情は本物か偽物かを判別するのが困難なほどです。技術的な革新点は、ガウス点群を使用して3D人物の形状を生成し、神経パラメータ化されたヘッドモデルを導入して微妙な表情の変化を捉え、リアリティを高めることにあります。

image.png

【AiBase要約:】

⭐ 高精細3Dアバター:NPGAはリアルな3Dアバターを生成し、表情豊かで、本物の人間に近い表現をします。

⚙️ 革新的な技術:ガウス点群を使用して3D人物の形状を構築し、レンダリング効率とリアリティを向上させます。

😲 ニューラルネットワークモデル:神経パラメータ化されたヘッドモデルを使用して、顔の微妙な表情の変化を捉え、本物の人間の表情をシミュレートします。

詳細リンク:https://tobias-kirschstein.github.io/nersemble/