腾讯混元ビデオモデル(Hunyuan Video)テスト参加者募集中、オープンソースの可能性

海外メディアの報道によると、アップルはグーグルのGemini AIモデルを自社のApple Intelligenceシステムに統合する計画を進めている可能性があります。このニュースは、ファームウェアアナリストのアーロン・ペリスがiOS18.4の最初のベータ版のコードを調査している中で発見したもので、バックエンドコードにグーグルをサードパーティモデルオプションとして追加する関連の引用が新たに見つかりました。この発見は、アップルの以前の戦略的配置と呼応しています。9to5Macによると、アップルのソフトウェアエンジニアリングのシニアバイスプレジデントであるクレイグ・フェデリギが言及しました。
人工知能動画生成ツールPixverseは、正式にV4.0バージョンを発表しました。このアップデートはユーザーによって「驚くほど強力」と評価されています。Xプラットフォームでの最新情報によると、Pixverse V4.0は底層モデルを大幅にアップグレードしただけでなく、同期生成音声および安定したスタイル転送機能を新たに搭載し、コンテンツクリエイターに新しい可能性をもたらしました。このアップデートの中で最も注目すべきハイライトの一つは「Restyle」スタイル転送機能です。Xユーザー@toto2AIは、通
イーロン・マスクのxAIが、自社のAIチャットボットGrok3の音声機能を正式に発表しました。この期待されていた機能は、Grokアプリケーションを通じてユーザーに開放されており、現在英語でのインタラクションをサポートしています。Xプラットフォームの最新情報によると、ユーザーはGrokアプリを更新するだけで、画面右上の「新しい対話」ボタンの横に新しい音声アイコンを見つけてクリックすることで、この新しい機能を体験できます。xAIによれば、Grok3の音声機能は最大10種類の異なるモードを提供しており、その中に2つの18禁とラベル付けされたモードが含まれています。
DeepSeekオープンソースウィーク初日に最新の技術成果FlashMLAを正式にオープンソース化しました。これはNVIDIA Hopperアーキテクチャ向けに特別に設計された高効率のマルチレイヤーアテンション(Multi-Layer Attention)デコードカーネルです。この技術は特に可変長シーケンスシナリオに最適化されており、大規模モデルの推論性能を大幅に向上させることができます。FlashMLAの核心技術特性にはBF16精度の全面サポートと、ブロックサイズ64のページングキー・バリューキャッシュ(Paged KV)が含まれています。
最近、xAIが開発したGrok APPがリアルタイム音声モードをリリースし、10種類のモードをサポートしています。ユーザーは音声を使ってAIと対話することができ、利用体験をさらに向上させます。しかし、あるXプラットフォームのユーザーがこのアプリに新たに追加されたUnhingedモードとセクシーモードについて発見し、広く注目を集めました。ユーザーの説明によれば、Unhingedモードは「ずっと反撃してくる」挑発的な議論が得意であり、セクシーモードは「いきなり誘惑してくる」ロマンチックまたは性的な暗示があるとのことです。ユーザーは投稿の中で「老馬は兄弟たちを理解している」と感慨深く述べています。
2月24日、LiblibAI(リブリブAI)は短期間のうちに連続して4ラウンドの資金調達を完了し、国内のAIアプリケーション分野における資金調達の速度に新記録を樹立した。2024年7月に公開された数億円の資金調達に続き、LiblibAIは再び数億円の資金を獲得しました。最新の2ラウンドの資金調達は、渶策資本と順為資本がリードし、明勢創投などの既存出資者も超過投資を行いました。