【AI日報】へようこそ!ここは、人工知能の世界を探求するためのあなたの毎日のガイドです。毎日、AI分野のホットな話題を、開発者に焦点を当ててお届けします。技術トレンドを把握し、革新的なAI製品の応用を理解するお手伝いをします。

最新のAI製品詳細はこちらhttps://top.aibase.com/

1、科大訊飛:訊飛星火Lite APIを永久無料公開

科大訊飛は、訊飛星火API機能を正式に無料公開すると発表しました。開発者の呼び出しコストを削減し、AI技術の普及を促進します。

image.png

【AiBase要約:】

🚀 開発者の呼び出しコストを削減、Pro/Max API料金はわずか0.21元/1万トークン、1トークンは1.5文字に相当

💡 訊飛星火Lite APIを永久無料公開、開発者はわずか2.1元で「訊飛星火3.5Max」によるコンテンツ生成を利用可能

🌍 科大訊飛はAPI機能を全面的に公開し、世界中の開発者を結集し、AI技術の各分野への応用を促進

2、李開復氏、大規模モデルの急激な値下げは双輸だと主張 推論大規模モデルのコストは毎年10倍削減

李開復氏は、中国の大規模モデルと米国の大規模モデルの差が6ヶ月に縮まったと述べ、中国の技術力の追い上げと成果を示しました。しかし、大規模モデル市場の価格競争について懸念を表明し、急激な値下げは短期的な双輸につながる可能性があると指摘しています。値下げがビジネス成功の唯一の道ではないと強調し、零一万物(Lingyi Wanwu)は引き続き最高性能の大規模モデルを投入していくとしています。

【AiBase要約:】

🚀 中国の大規模モデルと米国の大規模モデルの差が6ヶ月に縮まり、技術力の追い上げと成果を示す。

💰 大規模モデル市場の価格競争が懸念を引き起こし、急激な値下げは短期的に双輸の状況につながる可能性がある。

🔮 零一万物(Lingyi Wanwu)は様々なサイズのモデルを投入する計画で、中国で最高のモデルを目指し、大規模モデルが複雑な問題で優れた性能を発揮すると強調。

3、百度、Comateコード知識拡張2.0を発表

百度文心大規模モデルをベースとしたコードインテリジェント補完と推奨ツールであるComateコード知識拡張2.0は、包括的な検索とQ&A、Webオンライン検索、自動生成呼び出しコードとテストケースという3つの大きな利点を備えています。コードの記述、学習、面接、テストを包括的にサポートし、知識習得の加速、プログラミング効率の向上、ビジネスに合わせたコード生成を実現します。

【AiBase要約:】

⚙️ Comateコード知識拡張2.0は百度文心大規模モデルをベースとし、開発者のプログラミング意図をリアルタイムで解析し、最適なコード断片とライブラリ関数を推奨。

🔍 Comate2.0は包括的な検索とQ&Aをサポートし、開発者がオープンソースフレームワークにおける具体的なビジネスの説明を取得し、プログラミングスキルを向上させる。

💻 Comate2.0は、呼び出しコードとテストケースを自動生成し、コードの品質と効率を大幅に向上させる。

4、マイクロソフト、Phi-3 Visionなど最新の巨大言語モデルシリーズを発表

マイクロソフトは、Phi-3シリーズの大規模言語モデルを発表し、その強力な性能と柔軟性を示しました。研究者や開発者に新しいツールと可能性を提供します。これらのモデルは特定の分野で独自の強みを持ち、異なるコンテキストの長さと異なる規模のパラメータをサポートしています。

image.png

【AiBase要約:】

🔍 Phi-3Medium14Bモデルは強力な性能と高い競争力を持ち、Command R+104BやGPT3.5などの他の大規模モデルを上回る。

🔍 Phi-3Small7Bモデルは、リソースが限られた環境で潜在的な応用価値を持ち、Mistral7BやLlama38Bを上回る性能を示す。

🔍 Phi-3シリーズモデルのトレーニングには4.8Tトークンを使用し、42日間継続、長文データ処理をサポートし、新しいトークナイザーとウェイト互換性を導入。

詳細リンク:https://top.aibase.com/tool/phi-3-vision-128k-instruct

5、Windows 11にAIベースの複製と貼り付け機能を追加

マイクロソフトはWindows 11に新しい高度な貼り付け機能を追加しました。AI技術を利用して、クリップボードの内容を即座に変換します。この機能により、ユーザーはクリップボードの内容をプレーンテキスト、Markdown、JSONなどの形式にすばやく変換したり、要約、翻訳、コード生成などの操作を実行したりすることができ、作業効率を向上させます。

image.png

【AiBase要約:】

⭐ Windows 11に新しい高度な貼り付け機能が導入され、AI技術を利用してクリップボードの内容を即座に変換。

⭐ PowerToysのAdvanced Paste機能により、ユーザーはクリップボードの内容をプレーンテキスト、Markdown、JSONなどの形式に変換したり、OpenAIを使用して要約、翻訳、コード生成などの操作を実行したりできる。

⭐ この機能を使用するには、OpenAI APIキーを追加し、対応するOpenAIクレジットを購入して変換操作を行う必要がある。

6、Adobe LightroomにAIマジック消しゴム機能を追加

Adobe Lightroomは最近、オブジェクトの削除とAIレンズぼかし効果を含む新しい生成AIツールを発表し、ユーザーによりシンプルで便利な写真編集体験を提供します。これらの新機能により、背景ぼかしがより自然になり、不要なオブジェクトや人物の削除が容易になります。AdobeはFirefly AIモデルをクリエイティブソフトウェアに継続的に適用し、ユーザーにより多くの利便性と可能性をもたらします。

image.png

【AiBase要約:】

🎨 「Generative Remove」機能により、写真から不要なオブジェクトや人物を簡単に削除できる。

📸 AIレンズぼかしツールにより、ワンクリックで様々なぼかし効果を適用し、背景ぼかしの自然さを向上させる。

📱 新機能により、Lightroomを使った写真編集がよりシンプルで便利になり、新規ユーザーにとってより使いやすい操作体験を提供。

7、音楽AIスタートアップSunoが1億2500万ドルの資金調達を完了

Sunoは1億2500万ドルの資金調達を完了し、生成AIプラットフォームを通じて音楽業界を根本的に変革することを目指しており、人々の興奮と著作権に関する懸念を引き起こしています。AIが音楽分野で広く利用されるにつれて、技術の進歩とアーティストの権利保護のバランスをとることが重要な課題となります。

【AiBase要約:】

⭐️ SunoのAIプラットフォームは、音楽制作のハードルを下げ、音楽制作者に強力なツールを提供し、従来の音楽産業モデルに挑戦する可能性がある。

⭐️ Sunoの革新的なプラットフォームでは、誰でもテキストプロンプトや歌詞を入力してオリジナル曲を制作することができ、AIがそれに基づいてメロディー、ハーモニー、完全な作曲を生成する。

⭐️ Sunoの急速な成長と巨額の資金調達は、アーティストや権利保有者の明確な同意なしに、著作権で保護された音楽録音を使用してAIモデルをトレーニングすることについての激しい議論の中で発生している。

8、NVIDIA GH200スーパーチップが世界9台のスーパーコンピューターに導入

NVIDIAのGH200スーパーチップは、世界9台のスーパーコンピューターで驚異的な計算能力を発揮し、高性能コンピューティング産業のAI駆動への転換を推進しています。GH200はGrace Hopperの異種計算フレームワークを採用し、高性能GPUと多機能CPUを統合し、高性能コンピューティングとAIモデル処理能力を備えています。NVIDIAはここ2年間、サーバーと高性能コンピューティング分野に積極的に投資しており、GH200シリーズは強力なAIと高性能コンピューティング能力を示し、科学研究の進歩を加速させています。

【AiBase要約:】

⭐ NVIDIA GH200スーパーチップは、世界9台のスーパーコンピューターで毎秒20京回の浮動小数点演算という驚異的な能力を実現。

⭐ GH200はGrace Hopperの異種計算フレームワークを採用し、高性能GPUと多機能CPUを統合し、AIスーパーコンピューターの主要ハードウェアとなっている。

⭐ GH200シリーズチップは、強力なAIと高性能コンピューティング能力を示し、科学研究の進歩を加速させる。

9、ChatGPTの改良されたデータ分析機能の提供開始:速度とインタラクティブな体験が大幅に向上

OpenAIは最新のChatGPTデータ分析最適化機能を発表しました。処理速度が向上し、インタラクティブなグラフと表が追加され、データ分析ツールがより完全で強力になりました。ユーザーは、データのアップロード、分析、視覚的探索をより簡単に実行し、より深いデータの洞察を得ることができます。人工知能と高度なデータ可視化を統合したこのソリューションは、データアナリストとビジネスユーザーに大きな助けとなります。

image.png

【AiBase要約:】

🚀 速度向上:GPT-4oの速度優位性により、データ分析がより迅速に。

💬 インタラクティブなグラフと表:ユーザーはデータ可視化コンポーネントとインタラクトでき、ツールの有用性と柔軟性を向上。

📊 データの直接表示:アップロードされた表形式のデータはインターフェースに直接表示され、ユーザーは直感的に確認および操作できる。

10、FIFO-Diffusion:追加のトレーニングなしで無限長のビデオを生成可能

FIFO-Diffusionプロジェクトは、追加のトレーニングなしで無限長のビデオを生成する強力な能力を示しました。対角ノイズ除去技術により、高品質で一貫性のある長尺ビデオの生成を実現しました。この技術はビデオ生成分野で大きな優位性を持っていますが、複雑なシーンではちらつきが発生する可能性があります。全体的な効果は印象的です。将来的には、ちらつきの問題を解決し、ビデオ生成の品質と安定性を向上させることが期待されます。

image.png

【AiBase要約:】

✨ 追加のトレーニングが不要なため、FIFO-Diffusionは大きな優位性を持つ。

⚙️ 独自の対角ノイズ除去方法がコア技術。

🔗 FIFO-Diffusionは、長尺ビデオ生成の可能性を示している。

詳細リンク:https://top.aibase.com/tool/fifo-diffusion

11、終末フィルター下では、実物とAIの見分けがつかない

この記事では、抖音(Douyin)のブロガー「速速來電」が公開した終末ゲームフィルターのビデオを紹介しています。AIエフェクトで生成された画像と実物の原画を比較すると、その効果は非常にリアルで、見分けがつきにくいほどです。ネットユーザーはこのビデオについて活発に議論しており、そのリアルな効果を称賛しています。ブロガーは美图秀秀アプリを使用して終末エフェクトを生成する方法の制作チュートリアルを共有し、原画の品質が効果に重要であることを強調しています。

image.png

【AiBase要約:】

🔍 ビデオはリアルな効果を示し、真偽の見分けが難しい。

📈 ビデオのいいね数は17万件、転送数は2.4万件に達し、ブロガーの過去最高の作品となっている。

💡 制作チュートリアルではコツを共有し、原画の品質が最終的な効果に非常に重要であることを強調。

詳細:https://www.chinaz.com/2024/0522/1618351.shtml

12、bilibiliのUP主が様々な方法で盛り上げる:英語学習のために、AIが駄洒落を言い始めた

この記事では、bilibiliのUP主がAI技術を利用して有名人の声とイメージを合成して英語を教える方法を紹介し、大きな注目を集めています。駄洒落を使うことで、このビデオはbilibiliで100万回以上の再生回数を達成しました。UP主はエンターテイメントと教育を組み合わせ、ユニークな学習体験を生み出し、AI技術を活用してビデオ制作の頻度とファン数を増やしています。しかし、有名人や映画・ドラマの素材を使用することには著作権侵害のリスクも存在します。

image.png

【AiBase要約:】

🤖 AI技術を利用して有名人の声とイメージを合成し、英語教育を行い、多くのファンの注目を集めている。

🎬 ビデオは駄洒落を使うことで、100万回以上の再生回数を達成し、学習の面白さとインタラクティブ性を高めている。

💡 UP主はエンターテイメントと教育を組み合わせ、独特の学習体験を作り出し、AI技術を活用してビデオ制作頻度とファン数を増やしている。

詳細:https://www.chinaz.com/2024/0522/1618359.shtml

13、Googleが発表した「Say What You See」ゲームは、画像読解とAIプロンプトライティングを支援