【AI日報】へようこそ!ここは、人工知能の世界を探求するための毎日のガイドです。毎日、AI分野のホットなニュースをお届けし、開発者に焦点を当て、技術トレンドの把握や革新的なAI製品の応用について理解を深めるお手伝いをします。

最新のAI製品詳細はこちら:https://top.aibase.com/

1、衝撃!Stability AIのSD3.5Lに3つのControlNet機能が追加され、画像生成能力がさらに向上

Stability AIは、新バージョンのStable Diffusion 3.5 Largeを発表しました。Blur、Canny、Depthの3つのControlNet機能が追加され、画像生成能力が大幅に向上しました。非商業利用であれば無料で使用でき、特に年収100万ドル未満の中小企業やクリエイターは商業利用も無料で利用できます。

image.png

【AiBase要約:】

🌟 3つのControlNet機能(Blur、Canny、Depth)を追加し、画像生成能力を向上。

💼 個人および年収100万ドル未満の企業は無料でモデルを使用可能。

🔒 モデルの悪用を防ぐための対策を実施。

詳細はこちら:https://stability.ai/news/sd3-5-large-controlnets

2、KimiがAI動画生成機能をクローズドβテスト開始:毎日100秒間の無料創作空間

AIチャットツールKimiは、革新的なAI動画生成サービス「Kimi創作空間」のクローズドβテストを開始しました。ユーザーに新しい創造表現方法を提供することを目指しています。12種類のプリセットスタイルテンプレートとカスタム作成機能を使用して、個性的なミュージックビデオを作成でき、毎日100秒間の動画を無料で生成できます。

image.png

【AiBase要約:】

🎨 Kimi創作空間は、12種類のプリセットスタイルとカスタム機能を提供し、ユーザーは自由に個性的な動画を作成できます。

🎶 ユーザーは毎日100秒間の動画を無料で生成でき、創造性を大幅に向上させます。

💡 動画のシーンを詳細に記述できるため、創造表現の可能性が広がり、AI動画生成技術の発展を促進します。

3、無限のクロスオーバー!智譜AIがAutoGLMのアップグレード版を発表、一言で全アプリを操作可能に

智譜AIは最近、ブラウザ版とパソコン版を含むAutoGLMの複数のアップグレード版を発表し、強力なクロスアプリ操作能力を示しました。ユーザーは一言で複数のアプリ間を自由に切り替え、操作でき、効率を大幅に向上させます。

【AiBase要約:】

⚡ クロスアプリ操作能力:一言で複数のアプリ間を操作でき、使用効率を大幅に向上。

🖥️ GLM-PC音声操作:音声コマンドでパソコンを直接操作し、ワークフローを簡素化、働く人の救世主に。

🌟 AutoGLM万能アシスタント:主要なアプリに対応し、ユーザーは簡単に食事の注文や検索などのタスクを実行でき、AIの知性と柔軟性を示しています。

4、テスラ「Optimus」ロボットがアップグレード:より巧みで繊細なハンドデザイン!

テスラ社は、人型ロボット「Optimus」のハンドデザインを大幅にアップグレードしました。22個の自由度と柔軟な保護層を追加し、ロボットの柔軟性と触覚能力を向上させました。この革新は、家庭、医療、産業などでのロボットの応用可能性を広げ、テスラ社のロボット技術における継続的な探求を示しています。

【AiBase要約:】

🤖 新しいハンドデザインは22個の自由度を持ち、操作の柔軟性と精度を向上。

🛡️ 追加された保護層により触覚能力が向上し、繊細な物品を安全に扱うことが可能。

⚙️ すべての駆動装置は前腕に統合され、年末までにセンサーの統合と軽量化を完了する予定。

5、アマゾンが新型マルチモーダル言語モデル「Olympus」を開発、AWSカンファレンスで発表か

アマゾンは「Olympus」というマルチモーダル大規模言語モデルを開発中で、来週のAWS re:Inventカンファレンスで発表される予定です。このモデルはテキストだけでなく、画像や動画も処理でき、幅広い応用可能性を秘めています。

【AiBase要約:】

💡 新モデル「Olympus」はテキスト、画像、動画を処理し、自然言語で特定の動画部分を検索できます。

🚀 このモデルは来週のAWS re:Inventカンファレンスで正式発表される予定で、AWS Bedrockの一部として発表される可能性があります。

🔧 アマゾンのAI戦略はソフトウェアだけでなく、ハードウェア開発にも及んでおり、トレーニングと推論のための専用チップシリーズを発売しています。

6、Rhymes AIが画期的なテキスト画像動画生成モデルAllegro-TI2Vを発表

Rhymes AIが最近発表したAllegro-TI2Vモデルは、テキストから動画を生成する技術の大きな進歩を示しています。最大79.2Kのコンテキスト長と720×1280の出力解像度に対応するだけでなく、効率的な動画生成能力も備えており、映画、ゲーム、デジタルアートなどの分野のクリエイターのニーズを満たすことができます。

【AiBase要約:】

🚀 Allegro-TI2Vは最大79.2Kのコンテキスト長と720×1280の解像度に対応し、動画生成速度は毎秒15フレームに達します。

🎨 後続動画生成と中間動画生成の2つの新しいモードが導入され、動画制作の柔軟性と効率が大幅に向上しました。

💻 Rhymes AIはApache2.0ライセンスの下でAllegro-TI2Vを公開しており、ユーザーは簡単なインストールで迅速に使い始めることができ、幅広い応用が期待できます。

詳細はこちら:https://huggingface.co/rhymes-ai/Allegro-TI2V

7、恐るべき!AIはわずか2時間のインタビューで、個性を完璧に再現、85%の精度!

最近、研究チームはGoogle DeepMindと協力して、わずか2時間のインタビューの後でパーソナリティシミュレーションを生成できる新しいAIアプリケーションを開発しました。精度は85%に達します。この技術はChatGPT大規模言語モデルに基づいており、参加者に質問し、回答を記録することで、個性的な特徴を深く理解します。

image.png

【AiBase要約:】

🔍 AIモデルは2時間のインタビュー後、85%の精度でパーソナリティシミュレーションを生成します。

💡 この技術は、社会学研究のコストと時間を削減し、調査の有効性と広範性を向上させることを目的としています。

🤖 シミュレートされたパーソナリティは「代理人」と呼ばれ、将来はワークアシスタントやパーソナルロボットの人と機械のインタラクション体験を改善する可能性があります。

詳細はこちら:https://techxplore.com/journals/arxiv/

8、谷東科技が両眼フルカラーAI+ARグラスを発表:違和感のない装着感+高画質レンズ

谷東科技が発表したStar1とStar1Sグラスは、AIとAR技術の完璧な融合を表しており、フルカラーディスプレイと強力なAI機能を提供します。これらのグラスは、デザインにおいて装着感を考慮しているだけでなく、技術面では高画質とマルチモーダルAIシステムの応用を実現しています。業界初のフルカラー両眼アレイ光波導ARグラスであるStar1Sは、12月に発売される予定です。

【AiBase要約:】

🖼️ Star1Sは業界初のフルカラー両眼アレイ光波導ARグラスで、より高い装着感と画面の鮮明さを提供します。

🤖 マルチモーダルAIシステムを搭載したStar1Sは、様々な環境下で全天候型の長時間駆動を実現し、様々なシーンのニーズを満たします。

📱 主要なアプリとの互換性をサポートしており、ユーザーはグラスで直接電話をかけたり、動画を見たりすることができ、機能はスマートフォンに近いです。

9.ChatGPT誕生2周年、ユーザー数2億突破

ChatGPTは2022年の発売以来、急速に発展し、日常生活に欠かせないデジタルツールとなっています。短期間でユーザー数が急増し、現在2億人を超え、月間アクセス数は31億回に達しています。新バージョンのGPT-4oと検索機能の導入により、ユーザーエクスペリエンスは向上しましたが、情報精度と倫理的問題はまだ残っています。OpenAIはこれらの課題の解決に努め、サービスとユーザーの信頼をさらに向上させています。

【AiBase要約:】

🌐 ChatGPTのユーザー数は2年で急増し、家庭で重要なデジタルアシスタントとなっています。

🔍 新しく導入された検索機能は情報取得方法を改善し、従来の検索エンジンに挑戦しています。

⚖️ ChatGPTは情報精度と倫理的問題に依然として直面しており、さらなるソリューションの向上が必要です。

10、驚異的な成長!xAIはわずか1年余りで500億ドルの評価額に到達

イーロン・マスクの人工知能企業xAIは、わずか16ヶ月で500億ドルの評価額に到達し、多くの競合他社を凌駕しました。OpenAIと比較して、xAIの急速な成長は、AI分野におけるその強力な潜在力と市場の魅力を示しています。同社は資金調達と技術革新、特にスーパーコンピューターの構築を通じて、業界における地位をさらに強化しています。

【AiBase要約:】

🚀 xAIは設立から16ヶ月で500億ドルの評価額に到達し、多くの競合他社を上回りました。

💰 最近50億ドルの資金調達を行い、NVIDIAチップの購入とスーパーコンピューターの構築に充当しました。

🤖 チャットボットGrokは市場の強力な競争相手となり、ソーシャルメディアのトレーニングを通じて応答能力を高めています。