【AIニュース】へようこそ!ここは毎日人工智能の世界を探索するためのガイドです。毎日、AI分野の注目コンテンツをお届けし、開発者に焦点を当てて技術トレンドや革新的なAI製品の応用についてご理解いただけるようにしています。
新鮮なAI製品:クリックして詳細を確認:https://app.aibase.com/zh
1. 腾讯元宝が新しい機能をリリース:一文または一枚の画像で動画を作成できます!
腾讯元宝は、ユーザーが一文または一枚の画像から動画を作成できる新しい機能をリリースしました。この機能は、騰訊混元チームが最新でオープンソースしたHunyuanVideo1.5モデルに基づいています。このモデルはDiffusion Transformer(DiT)アーキテクチャを採用しており、パラメータ数は8億3000万個で、5〜10秒の高解像度動画を生成できます。この機能は一般ユーザーにとって創作ツールとして非常に使いやすく、コンテンツクリエイターにとっても新たなインスピレーションを提供し、ソーシャルメディアコンテンツの豊かさをさらに高めます。

【AiBaseの要約:】
🎥 腾讯元宝が新しい機能をリリースし、ユーザーが一文または一枚の画像で動画を作成できるようになりました。
🚀 HunyuanVideo1.5モデルは5〜10秒の高解像度動画を生成でき、使用が簡単です。
💡 新しい機能はユーザーに多くの創造のインスピレーションを提供し、コンテンツの豊かさを助けます。
2. グーグルがNano Banana Proを発表:Gemini 3を基盤とし、4K対応、インターネット検索およびC2PA検証をサポート
グーグルはNano Banana Proを発表しました。これはGemini 3モデルを基盤とし、4K解像度、14オブジェクトの融合、5人分の顔認識の一致を保持し、ネットワーク検索とC2PA検証機能を追加しました。価格は引き上げられ、専門的なコントロール、ネットワーク生成、ダブルウォーターマークなどの機能のポイントがあります。開発者はさまざまな方法で接続できます。

【AiBaseの要約:】
📷 専門的なコントロール:ユーザーはプロンプトにカメラの位置、絞り、焦点、光効果、カラーグレーディングを指定できます。6枚の高精細写真がデフォルトで選択可能です。
🌐 ネットワーク生成:モデルはリアルタイムでネットワークを検索し、レシピ、情報や株価を自動的に取得し、対応する情報図を生成します。NotebookLM、Flow、Slides、Vidsに統合されています。
🔒 ダブルウォーターマーク:SynthIDの隐形ウォーターマークとC2PAのコンテンツ証明が同時に記録され、ユーザーが画像をアップロードすると、Geminiアプリでその画像がグーグルモデルによって生成または編集されたかどうかを確認できます。
3. 夸克AIアイウェアと高德の提携強化、徐々に街並み検索、タクシーなど出張サービスへの統合
夸克AIアイウェアは高德と提携を深め、ナビゲーションのスクリーン表示、方向指示の頭部に合わせた調整などの新機能をリリースし、ユーザーの移動体験を向上させています。

【AiBaseの要約:】
🚀 夸克AIアイウェアにはナビゲーションのスクリーン表示機能が追加され、スマートフォンとアイウェアのシームレスな接続が実現されました。
🧭 方向は頭部の動きに応じて調整され、歩行や自転車での利便性と安全性が向上します。
🍽️ 周辺検索およびタクシー予約の通知をサポートし、都市の探索体験を最適化します。
4. 豆包入力法が小米商店で登場、スマート音声インタラクションを特徴とする
豆包入力法は豆包エコシステムの新メンバーであり、豆包アプリと同じソースの音声入力技術を搭載しており、複数の言語と入力方法をサポートし、スマート連想機能を持つことで、ユーザーの入力効率を向上させることを目的としています。

【AiBaseの要約:】
🎙️ 複数の方言、純粋な英語、中国語と英語の混合入力をサポートし、「静かに話す」機能を最適化しました。
⌨️ クラシックな9キーと26キーのレイアウトを提供し、クリップボード、よく使う文、即時翻訳などの実用ツールを内蔵しています。
🧠 スマート連想機能は文章、句読点、絵文字、数学式、日付など多方面にわたってカバーし、入力効率を向上させます。
5. 月之暗面は来年後半に上場を計画、評価額は40億ドルに達する見込み
月之暗面は来年後半に初公開募股(IPO)を計画しており、資金調達が完了すれば会社の評価額は約40億ドルになる見込みです。このプロジェクトは月の資源と地球での応用を探求しており、多くのテクノロジー愛好家や投資家の関心を集めています。

【AiBaseの要約:】
🌕 月之暗面は来年後半に初公開募股(IPO)を計画しています。
💰 資金調達が完了すれば、会社の評価額は約40億ドルになります。
🚀 月之暗面は月の資源と地球での応用を探求しています。
6. MOSS-Speechのオープンソース:国内初の音声から音声への大規模モデル、テキストの中間処理を不要に
MOSS-Speechは復旦大学MOSSチームがリリースした国内初のエンド・トゥ・エンドの音声から音声への対話モデルで、ASR→LLM→TTSのフローに依存することなく、音声質問、感情模倣、笑いの生成能力を持っています。複数の評価で優れた結果を示し、コードと重みをオープンソースし、商用許可をサポートしています。

【AiBaseの要約:】
🚀 MOSS-Speechはエンド・トゥ・エンドの音声から音声への対話モデルで、テキストの中間処理を必要としません。
📊 ZeroSpeech2025タスクではWERが4.1%に低下し、感情識別精度は91.2%です。
📦 48kHzの超サンプリング版と16kHzの軽量版を提供し、リアルタイム推論とローカルプライベートな音声クローンをサポートします。
7. ChatGPTのグループチャット機能が正式リリース:最大20人まで参加可能、AIが頭脳风暴に参加
ChatGPTのグループチャット機能が正式リリースされ、最大20人が同時に参加でき、AIが議論に参加できます。ユーザーは共有リンクを生成して他の人に招待でき、チーム協力能力が向上します。また、OpenAIはプライバシー保護を強調し、グループチャット作成者の個人データが共有されないことを保証しています。

【AiBaseの要約:】
🤖 ChatGPTのグループチャット機能が全面的にリリースされ、最大20人が同時に参加できます。
🌟 リンクを生成することで簡単に他人を招待でき、チーム協力性が向上します。
🔒 グループチャット作成者の個人データのセキュリティが確保され、AIは会話中に柔軟に参加できます。
8. グーグルNotebookLMの大規模アップデート:AIが1クリックで専門的なPPTを生成、画像が驚くほど優れています!
グーグルNotebookLMのアップグレード版にはSlide Decks機能が導入され、ユーザーがアップロードした資料を専門的なプレゼンテーションに変換できるだけでなく、画像はNano Banana Proモデルにより駆動され、視覚的品質が高くなります。さらに、カスタムプロンプトをサポートし、ユーザー体験を向上させます。

【AiBaseの要約:】
🖼️ Slide Decks機能を追加し、資料を1クリックで専門的なPPTに変換できます。
🎨 画像はNano Banana Proモデルにより駆動され、視覚的効果が驚くほどです。
⚙️ カスタムプロンプトをサポートし、深いカスタマイズ生成が可能です。
