AI日報：天工SkyMusic公測開始；UP主がAI技術で巨人族を「復活」；通義千問オープンソースコードモデルCodeQwen1.5；無料AI音楽生成ツールSonauto

「AI日報」へようこそ！ここでは、毎日人工知能の世界を探求するためのガイドとして、AI分野のホットな話題を毎日お届けします。開発者を重視し、技術トレンドの把握や革新的なAI製品の応用に関する情報を提供します。
最新のAI製品　詳細はこちら:https://top.aibase.com/

昆仑万维「天工3.0」と「天工SkyMusic」音楽大規模言語モデルがパブリックテストを開始

昆仑万维が発表した「天工3.0」と「天工SkyMusic」音楽大規模言語モデルがパブリックテストを開始し、AI分野における同社の技術力と革新性を示しました。これらの2つの大規模言語モデルは、意味理解や音楽生成などの分野で卓越した性能を発揮し、ユーザーにより強力なAI体験を提供します。

ハイライト：

⚙️「天工3.0」は4000億を超えるパラメータを持ち、世界最大のオープンソースMoE大規模言語モデルであり、画期的な性能向上を実現しています。

🎵「天工SkyMusic」は中国初の音楽SOTAモデルであり、複数の方言に対応し、エンドツーエンドの音楽生成能力を備えています。

🔍「天工3.0」は、多段階検索、グラフ作成、調査モードなどのAI機能を備え、「天工SkyMusic」は、参考音楽生成や方言の歌の生成に対応しています。

詳細はこちら:🔗 https://top.aibase.com/tool/tiangongskymusic

通義千問がQwen1.5ベースのコードモデルCodeQwen1.5をオープンソース化

Qwen言語モデルをベースとしたコード専門モデルCodeQwen1.5は、70億のパラメータ、GQAアーキテクチャ、92種類のプログラミング言語のサポートを特徴としています。CodeQwen1.5は、コード生成、長シーケンスモデリング、コード修正、SQL機能などで優れた性能を発揮し、開発者の作業効率を大幅に向上させます。

ハイライト：

⭐ CodeQwen1.5は70億のパラメータを持ち、92種類のプログラミング言語に対応しています。

⭐ コード生成、長シーケンスモデリング、コード修正、SQL機能において優れた性能を発揮します。

⭐ 多言語プログラミング、長シーケンスサポート、コード修正において卓越した能力を示しています。

詳細はこちら:🔗 https://qwenlm.github.io/zh/blog/codeqwen1.5/

Splineが3D生成ツールAI3D Generationを発表

Splineが発表した最新の3D生成ツールは、3Dデザイン分野における大きな進歩を示しており、直感的で使いやすいインターフェース、豊富なリソースライブラリとテンプレート、高度なAIアシストデザイン、チームコラボレーション機能を提供します。

ハイライト：

🌟直感的で使いやすいインターフェースにより、3Dデザイン初心者でも簡単に使い始めることができます。

🎨豊富なリソースライブラリとテンプレートにより、デザインプロセスが加速されます。

🤖高度なAIアシストデザインにより、作品のプロフェッショナルな品質が向上します。

詳細はこちら:🔗 https://top.aibase.com/tool/spline-ai

CTRL-F-VIDEO：ビデオ内で特定の単語やフレーズを検索可能に

デジタル時代において、ビデオは重要な情報取得チャネルとなっています。CTRL-F-VIDEOプロジェクトは、Chrome拡張機能を通じてビデオ内検索機能を提供し、ユーザーの時間を節約します。OpenAI技術を利用して音声からテキストに変換することで、正確な検索を実現します。プロジェクトは優れた性能を示し、効率的な処理能力を備えています。

ハイライト：

⚙️ ビデオ検索効率の向上：ユーザーはYouTubeビデオ内で特定のコンテンツを検索でき、検索時間を節約できます。

🔍 技術の中核：テキスト検索とタイムラインマーキング、音声テキスト変換、一致する単語のマーキング。

💡 可能性：このプロジェクトは、ビデオコンテンツの検索と管理に関する新しいアプローチを開拓しており、初期段階ではありますが、優れた性能を示しています。

詳細はこちら:🔗 https://top.aibase.com/tool/ctrl-f-video

BilibiliのUP主がAI技術で「巨人族」を「復活」させ、大きな注目を集める

この記事では、BilibiliのUP主がAI技術を使用して、一見すると本物のような歴史的神話ビデオを作成し、130万回再生され、多くの議論を呼んだことを紹介しています。視聴者はAI生成コンテンツの真実性について議論し、ネットユーザーは「AI鑑定大会」を開催し、ビデオの詳細を探っています。

ハイライト：

🎬 BilibiliのUP主がAI技術を用いて、一見すると本物のような歴史的神話ビデオを作成しました。

🤔 視聴者はAI生成コンテンツの真実性について議論し、虚実の境界線が焦点となっています。

💬 ネットユーザーは「AI鑑定大会」を開催し、ビデオの詳細を探っています。

詳細:https://www.chinaz.com/2024/0417/1610688.shtml

無料AI音楽生成ツールSonauto

Sonautoは強力なオンライン音楽制作ツールであり、人工知能技術により、誰もが音楽制作者になることができます。その主な利点は、編集機能とユーザーフレンドリーな操作インターフェースであり、音楽制作プロセスを簡素化します。

ハイライト：

⚙️ 専門的な音楽制作スキルがなくても、テキストプロンプトや歌詞から完全な音楽作品を生成できます。

🎵 様々な音楽スタイルを選択でき、ユーザーは生成された音楽作品をさらに編集および調整できます。

🔓 音楽愛好家、インディーズミュージシャン、ビデオコンテンツ制作者など、あらゆる層の人々に適しています。

詳細はこちら:🔗 https://top.aibase.com/tool/sonauto-

MiniMax稀宇科技が万億MoEモデルabab6.5を発表

MiniMax稀宇科技はabab6.5シリーズモデルを発表しました。これは万億MoEモデルであり、大規模言語モデルの優れた能力を示しています。abab6.5とabab6.5sは順次製品にアップデートされ、ユーザーは海螺AIとMiniMaxオープンソースプラットフォームを通じて、高度な言語モデルを体験できます。

ハイライト：

⚙️ abab6.5シリーズにはabab6.5とabab6.5sの2つのモデルが含まれており、20万トークンのコンテキスト長をサポートしています。

💡 abab6.5sはより効率的で、1秒間に約3万文字のテキストを処理でき、世界をリードする大規模言語モデルに匹敵するレベルです。

🚀 abab6.5とabab6.5sは、海螺AIとMiniMaxオープンソースプラットフォームを含むMiniMax製品に順次アップデートされます。

多様なモダリティに対応する言語モデルReka Core：画像、ビデオ、音声の分析が可能

Reka Coreは、強力な性能と柔軟な展開を備えた最先端の多様なモダリティに対応する言語モデルであり、多様なモダリティの理解、超長コンテキストウィンドウ、強力な推論能力などの重要な能力を備え、業界をリードするモデルと肩を並べています。Snowflake、Oracleなどの主要なテクノロジー・プラットフォームや政府機関と連携し、多様なモダリティに対応する技術の開発を推進しています。

ハイライト：

🌟 Reka Coreは優れた性能と柔軟な展開を備え、画像、ビデオ、音声の分析が可能です。

🔍 Coreは、多様なモダリティの理解、超長コンテキストウィンドウ、強力な推論能力を備えています。

🤝 RekaはSnowflake、Oracleなどとの連携により、多様なモダリティに対応する技術の開発を推進し、顧客のデータ価値最大化を支援しています。

詳細はこちら:🔗 https://top.aibase.com/tool/reka-core

LLaMA2-7Bを上回る性能！AIモデルJetMoE-8Bのトレーニングコストは10万ドル未満

JetMoE-8Bは、スパース活性化アーキテクチャを採用した人工知能モデルであり、LLaMA2-7B、LLaMA-13B、DeepseekMoE-16Bを上回る性能を発揮し、トレーニングコストは10万ドル未満です。そのアーキテクチャ設計は独特であり、計算コストが低く、パラメータ活性化効率が高く、トレーニングは公開データに完全に依存し、完全にオープンソースです。評価において優れた性能を示し、効率的な性能とコストメリットを実証しています。

ハイライト：

⚙️ JetMoE-8Bはスパース活性化アーキテクチャを採用しており、複数のAIモデルを上回る性能を発揮します。

💡 独自の設計により計算コストが低く、入力トークンごとの活性化効率が高くなっています。

🔗 JetMoE-8Bのトレーニングは公開データに完全に依存しており、プロセス全体が完全にオープンソースです。

詳細はこちら:🔗 https://huggingface.co/jetmoe/jetmoe-8b

Ollamaソフトウェアのアップデート：性能向上と新しいモデルのサポート

Ollamaソフトウェアの最新アップデートにより、顕著な性能向上と複数の注目モデルのサポートが実現しました。VRAMとGPUの使用率が最適化され、WizardLM2、Snowflake Arctic Embedなどの新しいモデルがサポートに追加され、ソフトウェアの安定性と柔軟性が向上しました。ユーザーはより効率的にタスクを実行し、人工知能の可能性をさらに探求できます。

ハイライト：

🚀 VRAMとGPUの使用率を最適化し、メモリエラーを削減し、ソフトウェアの性能を向上させました。

💡 WizardLM2、Snowflake Arctic Embedなどを新たにサポートし、テキスト生成の品質を向上させました。

🔗 詳細な説明とモデルのダウンロードアドレスをご覧ください。更新内容の詳細については、こちらをご覧ください。

詳細はこちら:https://github.com/ollama/ollama/releases

モデルダウンロード:https://top.aibase.com/tool/ollama

専門家の37％が生成AIツールを使用して、毎週5～10時間の時短を実現

生成AIツールは効率性の向上をもたらし、専門家がより効率的に作業を行うことを支援します。生成AIツールを使用することで、専門家は作業時間を短縮できます。

ハイライト：

⭐専門家の37％が毎週5～10時間の時短を実現しています。

⭐ 生成AIツールにより作業効率が向上します。

⭐ 専門家は生成AIツールを使用して作業時間を短縮できます。

——————

今日のMidjourneyプロンプト：証明写真

画像出典：AI生成画像、画像ライセンスプロバイダーMidjourney

パッド画像+A handsome 20 year old Chinese man Wear a White shirt，exquisite Asian face，A delicate appearance ，Korean style short hair，eyebrows and ears exposed，no makeup，front，one inch photo，stock photo，Blue background，studio lighting --ar 5:7--no necklace or earrings --s 250--iw 2

ハンサムな20歳の中国人男性が白いシャツを着ている、洗練されたアジア人の顔、繊細な容姿、韓国風ショートヘア、眉毛と耳が見える、ノーメイク、正面、1インチの写真、ストックフォト、青い背景、スタジオ照明--ar 5:7--ネックレスやイヤリングなし