PixverseがV4.0アップデートを発表:同期音声とスタイル転送機能が衝撃の登場


映画『ヴェノム:レット・ゼア・ビー・カーネイジ』の公開を機に、AI駆動による『毒液変身』特效が抖音(TikTok)で急速に流行しています。このトレンドを牽引しているのが、国産AI動画ツールPixverseです。これにより、一般ユーザーでも簡単にプロレベルのスーパーヒーロー変身効果を作成できるようになりました。\#毒液変身チャレンジ\#というハッシュタグは、抖音のトレンドチャレンジランキングで4位にまで上昇し、多くのユーザーが創作に参加しています。AI生成の特效は細部がやや粗いものの、その手軽さからユーザーの創作意欲を大いに刺激し、さらには代行制作サービスの誕生にも繋がっています。
海外メディアの報道によると、アップルはグーグルのGemini AIモデルを自社のApple Intelligenceシステムに統合する計画を進めている可能性があります。このニュースは、ファームウェアアナリストのアーロン・ペリスがiOS18.4の最初のベータ版のコードを調査している中で発見したもので、バックエンドコードにグーグルをサードパーティモデルオプションとして追加する関連の引用が新たに見つかりました。この発見は、アップルの以前の戦略的配置と呼応しています。9to5Macによると、アップルのソフトウェアエンジニアリングのシニアバイスプレジデントであるクレイグ・フェデリギが言及しました。
イーロン・マスクのxAIが、自社のAIチャットボットGrok3の音声機能を正式に発表しました。この期待されていた機能は、Grokアプリケーションを通じてユーザーに開放されており、現在英語でのインタラクションをサポートしています。Xプラットフォームの最新情報によると、ユーザーはGrokアプリを更新するだけで、画面右上の「新しい対話」ボタンの横に新しい音声アイコンを見つけてクリックすることで、この新しい機能を体験できます。xAIによれば、Grok3の音声機能は最大10種類の異なるモードを提供しており、その中に2つの18禁とラベル付けされたモードが含まれています。
DeepSeekオープンソースウィーク初日に最新の技術成果FlashMLAを正式にオープンソース化しました。これはNVIDIA Hopperアーキテクチャ向けに特別に設計された高効率のマルチレイヤーアテンション(Multi-Layer Attention)デコードカーネルです。この技術は特に可変長シーケンスシナリオに最適化されており、大規模モデルの推論性能を大幅に向上させることができます。FlashMLAの核心技術特性にはBF16精度の全面サポートと、ブロックサイズ64のページングキー・バリューキャッシュ(Paged KV)が含まれています。
最近、xAIが開発したGrok APPがリアルタイム音声モードをリリースし、10種類のモードをサポートしています。ユーザーは音声を使ってAIと対話することができ、利用体験をさらに向上させます。しかし、あるXプラットフォームのユーザーがこのアプリに新たに追加されたUnhingedモードとセクシーモードについて発見し、広く注目を集めました。ユーザーの説明によれば、Unhingedモードは「ずっと反撃してくる」挑発的な議論が得意であり、セクシーモードは「いきなり誘惑してくる」ロマンチックまたは性的な暗示があるとのことです。ユーザーは投稿の中で「老馬は兄弟たちを理解している」と感慨深く述べています。