最近、GroqCloudはひっそりとWhisper V3 Largeを発表しました。ぜひお試しください!GroqChatに既に組み込まれており、誰でも体験できます。
開発者の皆様は、Whisperの音声テキスト変換機能とGroqCloudの速度を活用して開発を進めることができます。開発を続けましょう [体験リンク](https://groqchat.com)
最近、GroqCloudはひっそりとWhisper V3 Largeを発表しました。ぜひお試しください!GroqChatに既に組み込まれており、誰でも体験できます。
開発者の皆様は、Whisperの音声テキスト変換機能とGroqCloudの速度を活用して開発を進めることができます。開発を続けましょう [体験リンク](https://groqchat.com)
商湯科技は、画期的な「Vimi」制御可能人物ビデオ生成大規模モデルを発表しました。商湯科技の強力な「日日新」大規模モデルの能力に基づいて開発されたVimiは、前例のないビデオ生成の柔軟性を実現しました。
香港大学とバイトダンスの研究者らが共同開発したLlamaGenは、自己回帰モデルLlamaに基づく画像生成手法であり、画像生成分野において従来の拡散モデルを凌駕する可能性を示しています。LlamaGenのオープンソース化発表は、GitHub上で約900個ものスターを獲得するなど、大きな反響を呼びました。この成果は、自己回帰モデルの画像生成における競争力を証明するだけでなく、オープンソースコミュニティに新たな活気と革新の原動力をもたらしました。
古川氏は、生成AIは知的財産権を侵害する可能性のあるリスクのある技術だと明言。生成AIは多くの著作権保護されたコンテンツを学習に使用するため、革新的な影響を与える一方、法的および所有権に関する疑問が残る。
7月4日未明、Kyutaiが公式ウェブサイトでMoshiの発表を行いました。このモデルは、OpenAIが5月に発表したGPT-4oと同等の機能を備え、音声による質問を聞き取り、リアルタイムで推論に基づいた回答を行うことができます。しかし、GPT-4oの音声モードは秋まで本格的な公開が待たれるのに対し、Moshiは既に誰でも利用可能です。
ブラジルの国家データ保護局(ANPD)は、「予防措置」として、Facebookの親会社であるメタが自国民のデータを使用してAIアルゴリズムを訓練することを禁止しました。この決定により、先月メタがプライバシーポリシーに加えた変更(ユーザーデータ処理の説明に同社のAI訓練を追加したもの)はただちに停止されました。
OpenAIが最近リリースしたChatGPT Macクライアントに、懸念すべき潜在的なセキュリティ問題が発見されました。コンピューターに保存されている会話を容易に見つけ出し、平文で読むことができるのです。これは、悪意のある行為者や悪意のあるアプリケーションがデバイスにアクセスできれば、ユーザーとChatGPT間の会話とその中に含まれるデータに簡単にアクセスできることを意味します。