【AI日报】へようこそ!ここは毎日、人工知能の世界を探索するためのガイドです。毎日、AI分野の注目情報をお届けし、開発者に焦点を当てて、技術トレンドや革新的なAI製品の応用を理解するお手伝いをいたします。

新鮮なAI製品クリックして詳細を確認https://app.aibase.com/zh

1、OpenAIの次世代画像生成モデルが登場?Design ArenaとLM Arenaで盲測実施中

OpenAIは、「Chestnut」と「Hazelnut」という2つの新しい画像生成モデルを小規模な盲測テストにかけており、これはテキストから画像への生成分野での重要な進展を示しています。新しいモデルは、世界知識の理解力、画像の現実性、コードの埋め込み能力などにおいて、複数の重要な指標で顕著な改善を遂げています。

image.png

【AiBase要約:】

🧠 新モデルは世界知識の理解力において、グーグル最新のNano Banana Proとほぼ同等になりました。

📷 新モデルは、有名人物のスタイルの自撮り写真を、写真レベルの現実性を備えた形で生成でき、顔の細部、顔の比率、光の処理において、gpt-image-1より大幅に優れています。

💻 新モデルは画像内に読み取り可能なコードを埋め込む能力が特に優れており、複雑なコードスニペット、フローチャートのラベル、数学式を正確にレンダリングできます。

2、一枚の画像でAIスタイルのツールに!Qwen-Image-i2Lが画像生成を変革、ゼロコストのLoRAトレーニングが登場

Qwen-Image-i2Lは画期的な技術であり、任意の単一画像を微調整可能なLoRAモデルに変換することができ、個別化されたスタイル転送の障壁を大幅に下げます。この技術はマルチモーダルな特徴抽出システムを使用し、入力画像を「スタイル、内容、構図、トーン」などの主要な視覚要素にスマートに分割し、小さなサイズのLoRAモジュールを作成します。また、4種類の専用モデルスタイルについても紹介されており、その技術的裏付けと潜在的な課題も述べられています。

image.png

【AiBase要約:】

🖼️ 核心的イノベーション:一枚の画像からLoRAに、ワンクリックで個別化生成を解放

🎨 4種類のモデルバリアントがあり、多様なシナリオに適応可能です。

🚀 技術的背景と潜在的な課題:効率的だが過適合のリスクに注意

詳細リンク:https://modelscope.cn/models/DiffSynth-Studio/Qwen-Image-i2L/summary

3、智譜AIの入力法が新たにリリース、音声認識技術もオープンソース化!

智譜AIはGLM-ASRシリーズの音声認識モデルをリリースし、関連技術をオープンソース化しました。これによりユーザーの音声インタラクション体験が向上することを目的としています。また、デスクトップ版の智譜AI入力法もリリースされ、音声をテキストに変換したり、翻訳やテキストの再作成を行う機能を備え、PC端末での音声インタラクションを簡便にします。新規ユーザーには2000ポイントの積分がプレゼントされ、28日間の無料利用期間が提供されます。

image.png

【AiBase要約:】

🌟 GLM-ASRシリーズモデルが登場し、世界最先端のクラウド音声認識モデルとエッジ側モデルを含み、認識精度が高い。

🛠️ 新しい智譜AI入力法が登場し、音声→テキスト変換、翻訳、テキスト再編集に対応し、PC端末での音声インタラクションを簡単に行える。

🎁 新規ユーザーは2000ポイントの積分を無料で入手可能で、最大28日間の利用権を得られるため、多くのユーザーにインテリジェント入力法を体験してもらうことを促進している。

詳細リンク:https://huggingface.co/zai-org/GLM-ASR-Nano-2512

4、霊光に新機能登場:シンプルな操作で科学アニメーションを生成、複雑な原理を視覚的に表現

汎用AIアシスタント「霊光」は、複雑な科学的原理を直感的かつ生き生きとしたアニメーション形式で説明する新機能をリリースしました。この機能は、複数の主要な科学および工学分野をカバーしており、対話機能に統合され、ユーザーが即座に動的な説明を取得できるようにしています。

image.png

【AiBase要約:】

🧪 汎用AIアシスタント「霊光」は、抽象的な科学的原理を視覚的に表示する科学アニメーション生成機能をリリースしました。

🌍 霊光は、天文学や物理学などの分野の複雑な概念を自動的にアニメーションに生成し、ユーザーに理解を助けます。

🔄 この機能は対話機能に統合され、ユーザーはすぐに呼び出して動的な説明を取得できます。

5、マクドナルドのAI生成クリスマス広告が風評被害を受け撤回

マクドナルドオランダ支社がリリースしたAI生成のクリスマス広告は、伝統に反する意見と不十分な視覚効果によって強い批判を受けて最終的に撤回されました。制作会社は大量の時間と人材を投資したと主張しましたが、広告に対する一般の反感は依然として強かったです。

image.png

【AiBase要約:】

🌟 マクドナルドオランダ支社がAI生成のクリスマス広告をリリースしましたが、伝統に反する意見と視覚効果が悪いことからネット上で批判され、撤回されました。

🎬 広告の内容はシーンを速く切り替えたり、奇妙なキャラクターを使っていたため、観客の不満を引き起こしました。

💼 制作会社は広告に対して擁護を行い、大量の人力を投入したと主張しましたが、公衆の反応は依然として否定的でした。

6、マスクのxAIが新ツールをリリース、映画にリアルタイムでAI広告を埋め込む

マスクのxAIは、「Halftime」という名前の新しいツールをリリースしました。このツールは、AI生成の広告を映画やテレビドラマにリアルタイムで埋め込み、広告と物語が融合できるようにします。しかし、この技術は映画芸術の完全性と著作権問題に関する広範な議論を引き起こしました。

image.png

【AiBase要約:】

🌟 Halftimeは、映画やテレビドラマにAI生成の広告をリアルタイムで埋め込むことができるツールです。

🎥 このツールは、キャラクターの会話中に中断して製品を表示し、広告が物語の一環のように見えるようにしようと試みています。

📜 この技術は映画芸術の完全性に影響を与える可能性があるため、議論を引き起こしています。

7、アリババが千問C端事業群を設立、クォーク、UCを統合し、スーパーアプリの地位を挑戦

アリババグループは「千問C端事業群」を設立し、元のスマート情報とスマートインターネットの2つの事業群の核心的なリソースを統合しました。その目標は、「千問」をAI時代のスーパーアプリに育て、ユーザーがデジタル生活に入る最初の入口となることです。また、サングラス、PC、車などの多様な端末シナリオに拡大し、無所不在のAIネットワークを構築し、ユーザー体験を向上させ、AI時代におけるコア競争力を強化することを計画しています。

image.png

【AiBase要約:】

🚀 アリババは千問C端事業群を設立し、クォーク、UCなどの主要なアプリを統合しました。

📱 AI時代のスーパーアプリを目指し、ユーザーのデジタルライフの最初の入口となります。

🌐 サングラス、PC、車などの多様な端末シナリオに拡大し、無所不在のAIネットワークを構築します。

8、マイクロソフトExcelのウェブ版に「スマートエージェントモード」が登場、AIがデータ処理を効率化

マイクロソフトは、ウェブ版Excelの「スマートエージェントモード」をリリースし、AIが複雑なデータ処理タスクに深く関与することで、効率を高め、透明性を強化します。

image.png

【AiBase要約:】

🧠 スマートエージェントモードにより、Excelはよりスマートなデジタルアシスタントとなり、データ処理の効率が向上します。

📊 AIは複雑なワークフローを自主的に処理し、リアルタイムで表データを更新できます。

🔍 AIの透明性を提供し、ユーザーはAIの意思決定プロセスと推論ロジックをレビューできます。