【AI日報】へようこそ!ここは、人工知能の世界を探求するための毎日のガイドです。毎日、AI分野のホットな話題を皆様にお届けし、開発者をフォーカスすることで、技術トレンドの把握や革新的なAI製品の応用に関する理解を深めていただけます。
最新のAI製品はこちらで確認できます:https://top.aibase.com/
1、巨量引擎のAIGCツール「即創」正式版がリリース
巨量引擎のAIGCツール「即創」の正式版がリリースされました。AI脚本生成、スマート編集、デジタルヒューマンなど、多様なコンテンツ生成方法を提供しています。このプラットフォームは深層学習と自然言語処理を通じて、ユーザーがテーマを入力するだけで高品質のテキストと動画コンテンツを生成できます。新たに搭載された爆款裂変機能とワンクリック審査通過機能は、クリエイターが市場の変化に迅速に対応し、創作効率とコンテンツのコンプライアンスを向上させるのに役立ちます。
【AiBase要約:】
🌟 即創は多様なコンテンツ生成をサポートし、創作効率を向上させます。
📊 爆款裂変機能とワンクリック審査通過機能が追加され、クリエイターの市場への迅速な対応を支援します。
🎨 AI技術がコンテンツ創作革命を牽引し、クリエイターによる新ツールの探求を促します。
詳細リンク:https://top.aibase.com/tool/douyinjichuang
2、通義万相が2.1ビデオモデルを発表 複雑な動きを大幅に向上
アリババ傘下の通義万相ビデオ生成モデルは、最新の2.1バージョンで大幅なアップグレードを実現し、高速版とプロフェッショナル版を発表しました。それぞれ、高効率な性能と卓越した表現力に焦点を当てています。このバージョンは、複雑な動き処理と現実の物理法則の再現において顕著な進歩を遂げ、動画の映画のような質感と指示遵守能力を向上させました。
【AiBase要約:】
🚀 新バージョンは高速版とプロフェッショナル版があり、それぞれ高効率な性能と表現力を向上させます。
🐱 生成される動画はディテールが豊富で、「落書き」の問題を解決し、正確な英中文字の生成を実現しました。
🎬 カメラワークは映画監督のように、自動的にレンズを調整し、動画の芸術性を高めます。
詳細リンク:https://tongyi.aliyun.com/wanxiang/videoCreation
3、マイクロソフトが超強力な小型言語モデルPhi-4を正式にオープンソース化
マイクロソフトはHugging Faceプラットフォームで、パラメーター数が140億個の小型言語モデルPhi-4を発表しました。その優れた性能は、GPT-4oやLlama-3.1など多くの有名なモデルを凌駕しています。Phi-4は数学コンテストAMCで91.8点、MMLUテストで84.8点を獲得し、強力な推論能力を示しました。このモデルは革新的な合成データ生成方法を採用し、最大16kのコンテキスト長をサポートし、消費者向けハードウェアにも適しています。
【AiBase要約:】
🧩 マイクロソフトが発表したPhi-4モデルのパラメーター数はわずか140億個ですが、性能テストではGPT-4oやLlama-3.1などの複数の有名モデルを上回っています。
📈 Phi-4は数学と推論能力において優れた性能を示し、特にAMCとMMLUテストで高得点を獲得しました。
🌍 このモデルはオープンソース化されており、商用利用も可能です。多くの開発者やAI愛好家の注目を集めています。
詳細リンク:https://huggingface.co/microsoft/phi-4
4、画期的な動画修復技術SeedVR:ぼやけた映像を高画質化、任意の長さの動画に対応
デジタルメディアの急速な発展に伴い、動画品質の向上は重要な課題となっています。南洋理工大学とバイトダンスの研究チームが発表したSeedVR技術は、革新的な移動窓注意力機構を利用することで、動画修復効果を大幅に向上させ、特にAI生成動画の処理において優れた性能を発揮します。この技術は任意の長さの動画を処理できるだけでなく、画像の詳細も効果的に修復し、ユーザーによりリアルな視覚体験を提供します。
【AiBase要約:】
🌟 SeedVRは移動窓注意力機構を利用することで、長い動画シーケンスの処理能力を向上させました。
🎥 この技術は大きなウィンドウサイズを採用することで、高解像度動画の復元品質を大幅に向上させました。
🚀 複数の最新の技術的手法を組み合わせることで、SeedVRは複数のベンチマークテストで優れた性能を発揮し、特にAI生成動画に適しています。
詳細リンク:https://iceclear.github.io/projects/seedvr/
5、AdobeのTransPixarが煙や反射などの透明効果をシームレスにシーンに融合
Adobe Researchと香港科技大学が共同開発したTransPixarシステムは、特に透明な要素の処理において、視覚効果の制作に革命をもたらしました。この技術はアルファチャンネルを含む視覚効果を生成することで、制作効率を大幅に向上させ、コストを削減します。TransPixarの登場は、高品質な特殊効果への需要が急増している時期にあたり、今後の映画制作プロセスの変革を予感させます。
【AiBase要約:】
🌟 TransPixarは革新的なAI技術により、限られたトレーニングデータで高品質の透明効果を生成し、特殊効果の制作プロセスを簡素化します。
💡 このシステムは、大規模な制作チームの作業効率を向上させるだけでなく、小規模なスタジオのコスト削減にも貢献し、複雑な特殊効果を実現可能にします。
🚀 TransPixarはリアルタイムアプリケーション分野で大きな可能性を示しており、透明効果を迅速に生成でき、ビデオゲームや拡張現実などのシーンに適しています。
6、バイトダンスと大学が共同開発!STARモデル:動画の鮮明さと解像度を向上
南京大学研究チームとバイトダンス、西南大学が共同開発したSTAR技術は、テキストから動画へのモデルを使用して動画の超解像度処理を実現し、低解像度動画の品質を大幅に向上させます。この技術は時空間強化手法を組み合わせ、動画共有プラットフォームでダウンロードされた低解像度の動画に適しています。研究チームはGitHubで事前学習済みモデルと推論コードを公開しており、使用方法はシンプルで、動画処理分野の進歩を促進しています。
【AiBase要約:】
🌟 新技術STARはテキストから動画へのモデルを組み合わせ、動画の超解像度を実現し、動画の品質を向上させます。
🛠️ 研究チームは事前学習済みモデルと推論コードを公開しており、使い方はシンプルで分かりやすいです。
📩 連絡先を提供し、ユーザーと研究チーム間の交流と議論を促しています。
詳細リンク:https://github.com/NJU-PCALab/STAR
7、Stability AIがSPAR3Dを発表:単一画像から3Dオブジェクトを1秒で生成
CES展示会で、Stability AIはSPAR3Dを発表しました。これは革新的な2段階の3D生成技術で、1秒以内に単一の画像から正確な3Dオブジェクトを生成できます。SPAR3Dは効率的な3Dプロトタイプ設計方法を提供するだけでなく、ユーザーは生成された3Dオブジェクトをリアルタイムで編集でき、創作の柔軟性を高めます。
【AiBase要約:】
⚡ リアルタイム生成能力:SPAR3Dは1秒以内に単一の画像から完全な3Dオブジェクトを生成し、迅速な編集をサポートします。
🔍 正確な構造予測:正確な幾何学的形状と360度のビュー(隠れた領域を含む)を提供し、高解像度の出力を保証します。
🚀 オープンな利用ポリシー:商業利用と非商業利用をサポートし、ユーザーは様々な方法でこのモデルを取得して利用できます。
詳細リンク:https://stability.ai/news/stable-point-aware-3d
8、2024年、238種類の生成系AIサービスが国家網信辦で备案完了
国家インターネット情報弁公室は1月8日に発表した公告で、2024年12月31日までに302種類のサービスが备案を完了し、そのうち238種類が2024年に新たに登録されたことを明らかにしました。これは、この分野が急速に発展しており、より多くの新しいサービスが公式に承認されていることを示しています。公告では、世論属性を提供する企業に备案を求め、既に稼働しているアプリケーションの透明性を高め、コンプライアンスと安全性を確保するよう求めています。
【AiBase要約:】
🌟 2024年、計302種類の生成系AIサービスが国家網信辦で备案を完了し、238種類が新規登録されました。
🔍 世論属性を提供する企業は、所在地の網信部門を通じて备案を行うことができ、コンプライアンスを確保できます。
📝 既に稼働しているアプリケーションは、使用している备案済みのサービス情報を公開し、透明性を高める必要があります。
9、2024胡潤中国人工知能企業50強ランキング:科大訊飛が2位、商湯科技が3位
2024胡潤中国人工知能企業50強ランキングが正式に発表されました。寒武紀が2380億人民元の評価額で首位に輝き、AI分野におけるその強力な力を示しました。科大訊飛と商湯科技は、それぞれ1160億元と500億元の評価額でその後に続きます。ランキングは、北京、上海、深センが主要なAI企業の集積地であり、ランキング企業の80%を占めていることを示しています。
【AiBase要約:】
🌟 寒武紀が2380億元の評価額で首位、科大訊飛と商湯科技がそれぞれ2位と3位。
🏙️ 北京、上海、深センが人工知能企業の主要な集積地となり、ランキング企業の80%を占めています。
📊 このランキングは非具象知能企業に重点を置いており、ロボットやスマートホームなどの分野の企業は対象外です。
10、絶対に想像できない!この簡単な指示を繰り返すと、AIによるコード生成速度が100倍に!
BuzzFeedの上級データサイエンティスト、マックス・ウルフは、Claude3.5言語モデルを使用して実験を行いました。AIにコードの改善を繰り返し要求することで、元の657ミリ秒の処理時間を6ミリ秒に短縮し、100倍の性能向上を達成しました。「より良いコード」に対するAI独自の理解を示し、企業特有の機能を自動的に追加しました。
【AiBase要約:】
🌟 AIは繰り返し指示することでコードの性能を向上させ、元のコードの処理時間は657ミリ秒から6ミリ秒に短縮されました。
💡 AIはコードに企業特有の機能を自動的に追加し、「より良いコード」に対する独自の理解を示しました。
🛠️ プロンプトエンジニアリングは依然として重要であり、正確な要求は結果生成を加速させますが、依然として人間の開発者による検証と修正が必要です。
11、NVIDIAがGroot Teleop技術を発表 Apple Vision Proでロボットの訓練が可能に
NVIDIAはCES展示会で、特に産業および製造分野におけるヒューマノイドロボットの開発を加速させることを目的とした一連の革新的な技術を発表しました。Isaac GR00Tブループリントを使用することで、開発者は模倣学習を利用して大量の合成運動データを生成し、ヒューマノイドロボットを訓練できます。この技術はデータ収集の時間とコストを削減するだけでなく、Cosmosプラットフォームを通じて物理意識ビデオを生成し、物理人工知能の発展を促進します。
【AiBase要約:】
🚀 NVIDIAはIsaac GR00Tブループリントを発表し、模倣学習を利用して合成運動データを生成し、ヒューマノイドロボットの開発を加速させます。
📊 Cosmosプラットフォームは18兆件のデータでトレーニングされ、物理意識ビデオを生成し、物理人工知能の発展を促進します。
🤝 複数のロボット企業が既にIsaac GR00T技術を採用しており、優れた適用効果を示しています。
12、衝撃の発明!エンジニアがChatGPTを使ってロボットライフルを作成、OpenAIが即座に対応
最近、エンジニアSTS3Dは、ChatGPTの指示で照準と射撃を行うことができるロボットライフルを作成し、驚くべき反応速度と精度を示しました。この発明は、特にSF技術が現実になることへの懸念など、幅広い議論を引き起こしました。OpenAIは迅速に対応し、この行為は同社のポリシーに違反しており、同社のサービスを使用して武器を開発することを禁止していると述べています。
【AiBase要約:】
🌐 OpenAIは、使用ポリシーに違反したため、ロボットライフルを開発したエンジニアとの関係を迅速に断絶しました。
🤖 STS3Dのロボットライフルは、ChatGPTの指示に従って照準と射撃を行うことができ、高い精度を示します。
⚔️ OpenAIは昨年ポリシーを変更しましたが、いかなる形態の武器の開発にもサービスの使用を禁止しています。
13、ユーザーからの苦情により、マイクロソフトがBing AI画像ジェネレーターのアップグレードをロールバック、旧バージョンのDALL-Eに戻す