ネスレやユニリーバ、オレオなどの世界最大級の広告主は、コスト削減と生産性向上を目指して、生成AIソフトウェアの活用を試みています。この技術は、過去のデータに基づいてテキスト、画像、さらにはコンピューターコードを生成することができます。
しかし、セキュリティや著作権リスク、データに潜む可能性のある予期せぬバイアスへの懸念も依然として残っており、人間による介入は不可欠です。さらに、一部の広告主は、セキュリティリスクや著作権侵害についても慎重な姿勢を見せています。
ネスレやユニリーバ、オレオなどの世界最大級の広告主は、コスト削減と生産性向上を目指して、生成AIソフトウェアの活用を試みています。この技術は、過去のデータに基づいてテキスト、画像、さらにはコンピューターコードを生成することができます。
しかし、セキュリティや著作権リスク、データに潜む可能性のある予期せぬバイアスへの懸念も依然として残っており、人間による介入は不可欠です。さらに、一部の広告主は、セキュリティリスクや著作権侵害についても慎重な姿勢を見せています。
PikaがAI動画編集アプリをリリース。自撮りをアップロードするだけで多彩なスタイルの動画を自動生成。音声同期やシーンカスタマイズ機能も搭載。使いやすく高画質な仕上がりで、SNS向け動画作成を簡単に。....
最近、バイトダンスのSeedチームは新しいビジョン・ランゲージ・アクションモデル(VLA)であるGR-3を正式にリリースしました。このモデルはロボット操作分野において画期的な能力を示しており、抽象的な概念を含む言語指示を理解できるだけでなく、柔らかい物体を正確に操作することもできます。また、新規タスクへの迅速な適応力や新規オブジェクトの認識能力を持ち、汎化能力があります。この成果は「汎用ロボット脳」への重要な進展と見なされています。従来のロボット操作モデルは、訓練のために大量のロボット軌跡データに依存していました。
Z.aiが中国語対応のオープンソースプロジェクト読解ツールZread.AIをリリースしました。GitHubのリンクを貼るだけでプロジェクト構造と使用ガイドを自動生成し、開発者がオープンソースプロジェクトを理解するハードルを大幅に下げます。このツールは多くの人気プロジェクトをインデックス化しており、マイナーアイテムのインデックス申請も受け付けています。特徴的な機能Buzzはコミュニティの動向(コミット、問題、ニュースなど)を集約し、開発者がプロジェクトの進行状況を網羅的に把握するのを助けます。このツールは中国語のオープンソースプロジェクト読解ツールの空白を埋め、開発者にとって必須のツールになることが期待されます。
零一万物が「万仔」企業向けAgentソリューションを発表。5つの機能(効率的なタスク実行、正確な結果、自主学習、システム連携、迅速な展開)を備える。李開復CEOは「価値共創」モデルを強調。AI活用による業務改革と生産性向上を推進。....
バイトダンスがオープンソースした軽量な多言語翻訳モデルであるSeed-Xは、28言語の双方向翻訳をサポートし、トップクラスの大規模モデルと同等の性能を備えています。この70億パラメータのモデルはMistralアーキテクチャを基盤としており、翻訳の最適化に特化しており、さまざまな分野で優れた性能を発揮しています。画期的なトレーニング戦略を採用し、高品質なデータを生成してデプロイ効率を最適化しています。これは、バイトダンスがBAGELやSeed-Coderなどに続いて公開した新たなオープンソースプロジェクトであり、AI翻訳技術の進歩を推進しています。
クアルコムAI研究機関が新技術CSD-VARを発表。この技術は、コンテンツとスタイルの分解により視覚的自己回帰モデルの生成能力を向上させます。スケール感知生成とSVD補正を採用し、コンテンツとスタイルを正確に分離し、従来の拡散モデルよりも保真度とスタイル化効果に優れています。併せて公開されたCSD-100データセットはモデルのトレーニングと評価を最適化しています。CSD-VARはK-Vメモリ機構を導入し、処理効率を向上させ、アート制作やゲーム開発などの分野での応用可能性が広がっています。これはクアルコムが視覚生成技術において示す新たな成果です。