【AI日報】へようこそ!ここは、あなたの人工知能の世界を探求する毎日ガイドです。毎日、AI分野のホットな話題を提供し、開発者に焦点を当て、技術トレンドの洞察と革新的なAI製品の応用を理解するお手伝いをします。
最新のAI製品詳細はこちら:https://top.aibase.com/
1、微信公式アカウントがAI画像生成に対応:スタイルや比率の調整も可能に
微信公式アカウントは最近、「AI画像生成」という新機能を導入しました。これは、コンテンツクリエイターがより効率的に画像を選択・挿入できるようにすることを目的としています。ユーザーは短いテキストの説明で記事の内容に合った画像を生成し、スタイルや比率を調整できます。この革新は、創作効率の向上だけでなく、著作権問題の懸念も軽減します。現在、機能は段階的に導入されています。

【AiBase要約:】
🖌️ AI画像生成機能により、ユーザーは短い説明で一致する画像を生成し、創作効率を向上させることができます。
📏 生成された画像は、スタイルと比率を調整して、最終的な仕上がりに満足できるようにすることができます。
🔒 この機能は記事の表紙にも拡張され、著作権問題による懸念を軽減します。
2、阿里雲通義万相が新しい画像編集モデルACEを発表、ワンクリックで画像修正を実現
阿里雲通義万相チームは、新しい画像編集モデルACEを発表しました。これは、簡単な口語的な指示で、手軽な画像生成と編集サービスを提供することを目的としています。ACEは様々な用途に対応し、強力な画像編集機能を備えています。ユーザーは、証明写真の背景変更などの操作を簡単に実行できます。その中核となる革新はLong-context Condition Unit(LCU)モジュールであり、高品質な編集効果を保証します。

【AiBase要約:】
✨ ACEモデルは、口語的な指示で手軽な画像生成と編集を実現し、複雑な編集プロセスを簡素化します。
🎨 スタイル写真、分鏡制作、インテリアデザインなど、様々な用途に対応し、ユーザーの多様なニーズを満たします。
🔧 LCUモジュールは正確な編集効果を保証し、グローバルな開発者向けにオープンソースサポートを提供することで、スマート画像処理技術の発展を促進します。
詳細リンク:https://github.com/ali-vilab/ACE
3、可灵AIが「AI試着」機能を発表:1.5モデルに「最初と最後のフレーム」対応を追加
可灵AIが新しく発表した「AI試着」機能では、最低2枚の画像をアップロードするだけで、モデルが服を着ている効果図を簡単に生成できます。さらに、1.5モデルは動画生成分野の強化により、動画の最初と最後のフレーム技術に対応し、クリエイターはより精細な動画制御を実現できます。可灵AIは「Inspiration Academy」も発表し、無料講座を提供しています。

【AiBase要約:】
👚 AI試着機能により、ユーザーは服とモデルの画像をアップロードして、試着効果図を生成できます。様々な服の着せ替えに対応しています。
🎥 新しく追加された最初と最後のフレーム技術により、ユーザーは2枚の画像をアップロードして、動画の始めと終わりを正確に制御し、動的なトランジションを実現できます。
📚 可灵AIが発表したInspiration Academyでは、無料講座を提供し、初心者でもAIツールの使用を迅速に習得し、技術の普及を促進します。
4、バーチャルインフルエンサーによる販売が硬すぎる?中国科学院とテンセントが共同で「AI販売王」AnchorCrafterを開発、自然な動きと表情を実現
技術の進歩に伴い、バーチャルインフルエンサーの表現力も向上しています。中国科学院とテンセントが共同開発したAnchorCrafterは、バーチャルインフルエンサーによる販売が新たな時代に入ったことを示しています。このツールは、自然でスムーズな販売動画を生成でき、インフルエンサーの動きや表情は非常にリアルで、ユーザーエクスペリエンスを大幅に向上させます。AI技術により、ユーザーはインフルエンサーの写真と製品情報を入力するだけで、高品質な動画を迅速に生成できます。

【AiBase要約:】
🛍️ AnchorCrafterは、自然でスムーズな販売動画を生成し、視聴者体験を向上させます。
🤳 ユーザーはインフルエンサーの写真と製品情報を入力するだけで、迅速に動画を作成できます。
📈 実験結果によると、生成された動画の品質と動きの自然さは業界トップレベルに達しています。
詳細リンク:https://cangcz.github.io/Anchor-Crafter/
5、AdobeがAIサウンドエフェクト生成システムMultiFoleyを発表
最近、Adobeとミシガン大学が共同開発したMultiFoley人工知能システムは、サウンドエフェクト生成技術の大きな飛躍を示しています。このシステムは、テキストプロンプト、参照オーディオ、またはビデオサンプルから高品質のサウンドエフェクトを生成でき、オーディオ出力の品質は48kHzに達し、ビデオとの同期精度は0.8秒に達します。これは従来のシステムを大幅に上回っています。
【AiBase要約:】
🔊 MultiFoleyシステムは、テキスト、オーディオ、ビデオ入力からサウンドエフェクトを生成し、音質は48kHzに達します。
🎵 平均同期精度は0.8秒で、従来のサウンドエフェクトシステムのパフォーマンスを大幅に上回っています。
📊 ユーザー調査によると、参加者の85.8%が、その意味の一貫性が他のシステムよりも優れていると考えています。
6、MyTimeMachine:50枚の写真をアップロードするだけで、あらゆる年齢の容姿を予測
MyTimeMachineは、ユーザーがアップロードした50枚の自撮り写真から、個人の顔の年齢をパーソナライズして変換できる革新的な技術です。このシステムは、グローバルな老化モデルと組み合わせて、高忠実度の年齢変化効果を生成し、同時にユーザーの特徴を維持します。この技術は静止画だけでなく、動画処理にも適用でき、映画の特殊効果や広告業界で広く利用されています。

【AiBase要約:】
🌟 MyTimeMachineは、グローバルな老化モデルとユーザー個人の自撮り写真とを組み合わせて、パーソナライズされた年齢変換を実現します。
📸 50枚の個人写真だけでアダプターネットワークをトレーニングし、リアルな年齢変化効果を生成できます。
🎥 この技術は静止画だけでなく、動画にも適用でき、高品質で本人確認可能な老化効果を実現します。
詳細リンク:https://mytimemachine.github.io/
7、逆操作!TryOffDiffでモデルから服をワンクリックで抽出、標準化された服の画像に変換
TryOffDiffは、ドイツのビーレフェルト大学が開発したAI技術で、ネットショッピングにおける購入者レビューと販売者レビューの大きな違いを解決することを目的としています。強力な拡散モデルにより、TryOffDiffは写真から服の特徴を抽出し、高解像度の標準的な商品展示図を生成し、背景を除去できます。その効果はプロのカメラマンによる撮影に匹敵します。

【AiBase要約:】
🧵 TryOffDiffはAI技術を利用して服の特徴を抽出し、高解像度の商品展示図を生成します。
📸 生成された画像は細部まで鮮明で、背景は自動的に除去され、プロの撮影に匹敵する効果があります。
🛒 この技術は、ECプラットフォームの商品展示効果の向上と返品率の低下に役立ちます。
詳細リンク:https://huggingface.co/spaces/rizavelioglu/tryoffdiff
8、GTX580などの古いグラフィックボードでもGPT-4のトレーニングが可能だが、コストは驚異の10倍に
Epoch AIは最近、古いグラフィックボードGTX580を使用してGPT-4をトレーニングする可能性を示すインタラクティブシミュレーターを発表しました。ただし、コストは最新のハードウェアの10倍にもなります。研究によると、GPT-4のトレーニングに必要な浮動小数点演算回数は1e25〜1e26の間で、モデルの規模が大きくなるにつれて効率は通常低下します。

【AiBase要約:】
💰 GTX580グラフィックボードを使用してGPT-4をトレーニングするコストは、最新のハードウェアの10倍で、効率も低いです。
📊 シミュレーターは、異なるGPUのパフォーマンスの違いを分析でき、複雑な複数データセンターのトレーニングシミュレーションに対応しています。
🔍 この研究は、大規模AIモデルのトレーニングをサポートするために、将来のハードウェアのニーズを深く理解することを目的としています。
9、暗号通貨ユーザーがAIロボットFreysaを説得し、4万7000ドルの賞金プールを移動させる
独特な人工知能対戦ゲームで、暗号通貨ユーザーが自律型AIロボットFreysaを説得し、4万7000ドルを超える賞金プールを自分に送金することに成功しました。最初の481回の試みはすべて失敗に終わりましたが、このテクノロジーライターは巧妙なプロンプトとFreysaの機能に対する深い理解を通じて、最終的にAIの防御を突破し、勝利を収めました。

【AiBase要約:】
💰 暗号通貨ユーザーは、巧妙なプロンプトでAIロボットFreysaを説得し、賞金プール資金の移動に成功しました。
🤝 プレイヤーは100ドルを寄付することにより、最終的にFreysaの承認を得て、送金に成功しました。
🧠 Freysaの意思決定メカニズムは依然として謎に包まれており、人間とAIのインタラクションにおける創造性と知性を示しています。
10、マスク氏が法廷命令を求め、OpenAIの利益企業への転換を阻止
最近、テスラCEOのイーロン・マスク氏の法律チームは、OpenAIが利益企業に転換することを阻止するための仮処分命令を裁判所に申請しました。その理由は、マスク氏が勝訴した場合、OpenAIが賠償金の支払いに資金不足になる可能性があるためです。さらに、マスク氏はOpenAIとその投資会社であるマイクロソフトが独占禁止法に違反したと主張し、投資家が競合他社を支援しないよう求めています。
【AiBase要約:】
⚖️ マスク氏の法律チームは、OpenAIが利益企業に転換することを阻止するよう裁判所に要請し、賠償金のリスクに直面する可能性があると主張しています。
📉 OpenAIとマイクロソフトが米国の独占禁止法に違反したと主張し、投資家が競合他社を支援しないよう求めています。
💰 マスク氏はかつてOpenAIの利益モデルを支持していましたが、現在は転換に反対しており、業界内の競争の複雑さを示しています。
11、OpenAIはアップルとの提携を通じて、年末までにユーザー数を10億人に到達することを目指す
OpenAIは、2025年までにユーザー数10億人を達成するという目標を全力で追求しており、新製品の発売、データセンターの構築、アップルとの提携を通じて成長を目指しています。ChatGPTの発売以来、ユーザー数は毎週2億5000万人のアクティブユーザーに増加しました。同社はシリコンバレーで60億ドルの資金調達を行い、開発を支援するために資金調達を継続する予定です。
【AiBase要約:】
✨ OpenAIは2025年までにユーザー数10億人を達成することを目標としており、アップルとの提携を通じて成長を加速させようとしています。
💰 同社はシリコンバレーの歴史上最大規模の資金調達を行い、60億ドルを調達し、資金調達を継続する予定です。
📈 生成AIの生産と安全管理への応用は急速に拡大しており、ますます多くの企業がその潜在的な価値を重視し始めています。
