「AI日報」へようこそ!ここは、AIの世界を探求するためのあなたの毎日のガイドです。毎日、AI分野のホットな話題をお届けし、開発者に焦点を当て、技術トレンドの洞察や革新的なAI製品の応用について理解を深めるお手伝いをします。
最新のAI製品詳細はこちら:https://top.aibase.com/
1、百度文心大模型搭載学習機「小度学習機Z30」発表
この記事では、百度傘下的小度科技が発表した、文心大模型を搭載した初の学習機Z30を紹介します。AI教師の再定義を目指し、高度なAI技術で子どもの自主学習を支援するとともに、保護者には全面的なサポートを提供します。優れた視覚体験と数々の先進技術、学習の各段階における全面的な再構築により、科学的で効率的な学習プランを提供します。AI教師は豊富な教育コンテンツを提供し、多様なインタラクションとパーソナライズされたカスタマイズに対応することで、学習をより生き生きと、効率的で効果的にします。

【AiBase要約:】
📚 小度Z30学習機は文心大模型技術を採用し、教科書の状況をリアルに再現することで、子どもたちが知識をより良く理解し習得するのを支援します。
👩🏫 小度Z30はAIによる師弟間のインタラクティブな授業と、授業後のパーソナライズされた練習に対応し、学習計画をオーダーメイドで作成し、全教科全学年の質問にいつでも対応します。
💡 文心知識強化型大模型に基づくAI教師は、子どもたちに権威性があり豊富な教育コンテンツを提供し、多様な感覚入力と擬人化された表現に対応することで、学習をより生き生きと楽しくします。
2、Open-Sora 1.1発表 動画品質向上、生成時間は21秒に延長
Open-Sora 1.1の発表により、特に動画生成の品質と時間が大幅に向上しました。新バージョンのモデルは最長約21秒の動画を生成でき、高品質の視覚データと字幕を使用してトレーニングされており、世界が機能する仕組みへの理解が向上しています。CausalVideoVAEアーキテクチャの最適化により、パフォーマンスと推論効率が向上しています。

【AiBase要約:】
🚀 動画生成の品質と時間の向上:新バージョンでは最長約21秒の動画を生成でき、高品質の視覚データと字幕によるトレーニングにより、世界が機能する仕組みへの理解が向上しています。
🔍 高品質の視覚データと字幕によるトレーニング:より高品質の視覚データと字幕を使用してトレーニングすることにより、世界が機能する仕組みへの理解が深まりました。
⚙️ CausalVideoVAEアーキテクチャの最適化:最適化されたアーキテクチャにより、動画生成のパフォーマンスと推論効率が向上し、Soraの基本モデルのパフォーマンスに匹敵します。
詳細リンク:https://top.aibase.com/tool/open-sora-plan-v1-1-0
オンライン体験アドレス:https://huggingface.co/spaces/LanguageBind/Open-Sora-Plan-v1.1.0
3、Canvaが便利な機能を複数追加:テキストからイラスト生成、動画のハイライト自動編集
Canvaのデザインプラットフォームの最新アップデートは、専門チームとワークスペースの魅力を高めることを目的としており、プラットフォームの再設計、エンタープライズ版の導入、AIスタイルマッチング機能の提供などが含まれています。アップデート内容は、多くの機能と改善を含んでおり、デザイン作業をより効率的で便利にします。

【AiBase要約:】
🎨 Canvaエンタープライズ版が登場し、より高度なコラボレーションとセキュリティ制御を提供します。
🌟 AIスタイルマッチング機能が追加され、ワークスペースのカスタマイズが可能になります。
💡 Canva Docsに提案モードとカラー強調ブロックが追加され、編集の提案とテキスト領域の強調表示を提供します。
4、超強力ComfyUIノードAnyNode登場!必要な機能をAIに記述させよう!
AnyNodeはComfyUIにおける印象的な新ノードで、大規模言語モデル(LLM)の能力を活用し、ユーザーがプロンプトを入力することで特定の機能を持つノードを作成できます。ユーザーはComfyUIで多様な操作を行うためのツールを提供され、カスタムノードとワークフローの作成における可能性を大幅に広げます。高度な機能と自動化タスクを実現したいユーザーにとって、貴重なリソースとなるでしょう。
作者によるビデオチュートリアル
【AiBase要約:】
🔑 機能記述:ユーザーは要求に応じてPython関数を記述し、あらゆる機能を実現できます。
🔧 柔軟性:ユーザーはプロンプトを使用してLLMに様々なタイプのノード(テキスト要約、カラーチャンネル調整、Instagramフィルター効果など)の記述を依頼できます。
🔗 ComfyUIとの互換性:AnyNodeはComfyUIのノードとして、他のノードと組み合わせて使用し、必要な出力形式ノードに接続できます。
詳細リンク:https://top.aibase.com/tool/anynode
5、ChatTTS:対話シーン向けの音声生成モデル
ChatTTSは、対話シーン向けに設計された音声生成モデルで、中国語と英語に対応し、大量のデータでトレーニングされており、高品質で自然な音声合成を提供します。プロジェクトチームは基本モデルのオープンソース化を計画しており、モデルの制御可能性と安全性に重点を置いています。ChatTTSを使用する際には免責事項に注意し、オープンソースモデルはコミュニティに新たな学習とイノベーションの機会をもたらします。

【AiBase要約:】
🔑 幅広い用途:ChatTTSは大規模言語モデルアシスタントの対話タスク、対話音声、ビデオ紹介などに適しており、自然でスムーズなインタラクション体験を提供します。
🔑 多言語対応:中国語と英語に対応しており、言語の壁を越え、より幅広いユーザー層にサービスを提供します。
🔑 オープンソース化計画:チームは基本モデルのオープンソース化を計画しており、学術界と開発者コミュニティの研究開発を促進します。
詳細リンク:https://www.bilibili.com/video/BV1zn4y1o7iV/
プロジェクトアドレス:https://top.aibase.com/tool/chattts
6、動画修復プロジェクトProPainterがComfyuiノードを発表
この記事では、ComfyUI_ProPainter_Nodesプロジェクトを紹介します。これは、ProPainterフレームワークに基づき、ComfyUIインターフェースを実現した、動画修復に特化したソリューションです。高度な動画フレーム編集とシームレスな動画修復タスクを提供し、動画編集と修復分野に強力なツールをもたらします。

【AiBase要約:】
🔧 ProPainterフレームワークに基づき、高度な動画フレーム編集とシームレスな動画修復タスクを提供します。
🎨 ProPainterノードとProPainter Outpaintingノードを含む、動画修復ノードを提供します。
📚 詳細なインストール手順、ワークフロース例、推奨ノード、豊富な入力パラメーターとノード参照情報を提供します。
詳細リンク:https://top.aibase.com/tool/comfyui-propainter-nodes
7、AIで手話ジェスチャー動画が生成可能に!SignLLMはテキストの説明から手話動画を生成
SignLLMは革新的な多言語手話モデルであり、聴覚障害者にとって重要なコミュニケーションツールを提供し、人工知能における言語理解と生成分野の研究を推進しています。テキストの説明から手話動画を生成することで、情報のバリアフリーなコミュニケーションを促進します。

【AiBase要約:】
🤖 テキストから手話動画への変換:SignLLMモデルはテキストを手話ジェスチャー動画に変換でき、直感的で分かりやすいです。
🌍 多様な手話に対応:アメリカ手話(ASL)、ドイツ手話(GSL)など8種類の手話をサポートし、幅広い用途に対応できます。
📊 多言語手話データセットの先駆け:Prompt2Signデータセットを導入し、モデルのトレーニングと発展に不可欠です。
詳細リンク:https://top.aibase.com/tool/signllm
8、ノイズキャンセリング技術「Look Once to Hear」登場!話している人を見るだけで、他の音は消える
この記事では、ユーザーの視覚入力で音声の増幅または消音を制御する先進的なノイズキャンセリングイヤホン技術「Look Once to Hear」を紹介します。この技術は騒がしい環境で集中と利便性を提供し、ユーザーは目標とする話者の声をクリアに聞くことができます。人工知能、機械学習、音声処理アルゴリズムを組み合わせている可能性があり、特に聴覚障害者にとって有用です。

【AiBase要約:】
👀 視覚制御:ユーザーは聴きたい話者の方を短時間に見るだけで、イヤホンはその話者の声を認識して増幅します。
🌆 環境適応性:騒がしい環境に適しており、街中やカフェなどでも目標とする話者の声をクリアに聞くことができます。
🚶 移動中での使用:ユーザーが移動中でも、イヤホンは目標とする話者の音声を引き続き追跡して再生し、集中と利便性を提供します。
詳細リンク:https://top.aibase.com/tool/lookoncetohear
9、MetaがInstagramなどの写真を使用してAIモデルをトレーニングしていることが発覚し、プライバシー問題が浮上
この記事では、MetaがInstagramとFacebookのユーザーの写真を使用してAIモデルをトレーニングしていることでプライバシー問題が浮上していることを明らかにしています。ユーザーのプライバシーが深刻に侵害され、データプライバシー収集規則に重大な違反がありました。Metaはユーザーがデータ収集モードをオプトアウトできると主張していますが、以前に収集されたデータはAIモデルに残っている可能性があり、懸念と不安を引き起こしています。データプライバシーと保護に関しては、企業はコンプライアンス対策を強化し、ユーザーの個人情報が適切に処理され保護されるようにする必要があります。
【AiBase要約:】
📷 Metaはユーザーの写真を使用してAIモデルをトレーニングしており、データプライバシー収集規則に違反しています。
🔍 ユーザーのプライバシーが侵害され、大きな関心を集めています。
❌ ユーザーはデータ収集モードをオプトアウトできますが、以前に収集されたデータはAIモデルに残っている可能性があります。
10、口パクよりすごい!InstructAvatar:テキストから指定した顔の表情と動作を生成
InstructAvatarは最新の対話型アバター生成モデルであり、テキスト誘導方式により感情と顔の動作を細かく制御することで、仮想アバターのインタラクティブ性と汎化能力を向上させています。このモデルは、細粒度感情制御、口パクの同期品質、自然さにおいて既存の方法を上回り、顔の表情と動作を指定でき、感情表現のある2D仮想アバターの生成に画期的な進歩をもたらします。

【AiBase要約:】
👄 InstructAvatarは感情と顔の動作を細かく制御し、仮想アバターのインタラクティブ性と汎化能力を向上させています。
😊 実験結果によると、InstructAvatarは細粒度感情制御、口パクの同期品質、自然さにおいて既存の方法を上回り、顔の表情と動作を指定できます。
🎭 InstructAvatarのフレームワークには、変分オートエンコーダー(VAE)と拡散モデルベースのアクションジェネレーターが含まれており、自然言語インターフェースを通じて生成ビデオの細粒度制御を実現しています。
詳細リンク:https://top.aibase.com/tool/instructavatar
11、マスク氏のxAIが60億ドルを調達、評価額は240億ドルに
イーロン・マスク氏のxAI社はシリーズBの資金調達で60億ドルを調達し、企業価値は240億ドルに達しました。同社は高度な人工知能システムの開発に注力しており、真に有能で、人類にとって最大限に有益なAI技術を提供することを目指しています。最新の資金調達では、最初の製品の発表、先進的なインフラストラクチャの構築、そして将来の技術開発の加速に充てられます。
【AiBase要約:】
💰 xAI社はシリーズBの資金調達で60億ドルを調達し、評価額は240億ドルに達しました。
🚀 最新の資金調達は、最初の製品の発表、先進的なインフラストラクチャの構築、そして将来の技術開発の加速に充てられます。
🤖 xAIは高度な人工知能システムを開発しており、真に有能で、人類にとって最大限に有益なAI技術を提供することを目指しています。
12、アップルの「Greymatterプロジェクト」は、一般ユーザーが日常的に使用できるAIツールになる
