書生・浦語2.5——InternLM2.5-7Bモデルのオープンソース化を発表、百万字の長文処理に対応

2024年7月3日、上海人工知能研究所と商湯科技は、香港中文大学および復旦大学と共同で、次世代大規模言語モデル「書生・浦語2.5」（InternLM2.5）を正式に発表しました。

InternLM2.5-7Bモデルは既にオープンソース化されており、他の規模のモデルも順次オープンソース化される予定です。上海人工知能研究所は、引き続き無料の商用ライセンスを提供し、高品質のオープンソースモデルを通じてコミュニティのイノベーションを支援することを約束しています。

微信截图_20240708083247.png

このモデルは、以下の点で顕著な改善が見られます。

推論能力：InternLM2.5の推論能力は大幅に向上し、Llama3-70Bモデルを一部の指標で上回りました。特に数学評価セットMATHにおいては、性能が100％向上し、精度が60％に達し、GPT-4Turbo1106バージョンと同等になりました。
長文対応：最大100万トークンのコンテキストに対応しており、約120万文字の長文を処理できます。コンテキストの長さと合成データの増加により、長文書の理解とエージェントとのインタラクションが最適化されました。
自律的な計画とツール呼び出し：数百ものウェブページ情報を検索・統合する能力を備えています。MindSearchマルチエージェントフレームワークを通じて、人間の思考プロセスを模倣し、ネットワーク情報を効果的に統合します。

Githubリンク:https://github.com/InternLM/InternLM

モデルリンク:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/internlm2_5-7b-chat

書生・浦語ホームページ:https://internlm.intern-ai.org.cn/

Moonshot AI、Kimiブラウザープラグインを発表　点問筆、サマリー機能などを搭載

Moonshot AIのKimiブラウザープラグインがリリースされました。ウェブページやアプリケーションでのユーザーエクスペリエンスを向上させることを目的としています。このプラグインは、点問筆とサマリー機能の2つの主要な機能を備えています。選択したテキストの即時的な解説と疑問への回答を得たり、ページ右下隅にあるサマリー機能で全文をすばやく要約したりできます。グローバルフローティングウィンドウとサイドバーモードに対応しており、ライティング中に継続的な会話や情報検索に便利です。ショートカットキーでKimiを起動し、効率的な操作を実現します。開発過程では、微信で開いたPDFファイルをアプリで直接開くなど、多くの使い勝手向上が行われています。

AI画像盗用対策ツールGlazeへの需要急増、多くのアーティストが注目

Glazeという無料ツールがアーティストの間で人気を集めています。このツールは、画像に目立たないノイズを追加することで、AI画像生成器によるアートスタイルの盗用を防ぐ機能を備えています。Metaがユーザーデータを用いたAIトレーニング計画を発表して以来、WebGlazeへのアクセス要求が急増し、アーティストは数週間から数ヶ月待つ必要がある可能性があります。Glazeの開発者Ben Zhao氏は、プロジェクトチームが手動で各

清華大学がCodeGeeX4-ALL-9Bをオープンソース化：主要な競合他社を凌駕する多言語コード生成モデル

清華大学知識工学グループとデータマイニングチームは、CodeGeeXシリーズの最新成果であるCodeGeeX4-ALL-9Bを発表しました。これは多言語コード生成分野においてピークに達し、自動コーディングの性能と効率の基準を再定義するものです。GLM-4-9Bフレームワークをベースに広範囲なトレーニングを受けたこのモデルは、9.4億個のパラメータを持ち、同種のモデルを凌駕します。コード生成、補完、解釈に優れ、優れた推論速度と全体的な性能を示しています。ソフトウェア開発のあらゆるニーズに対応できる高い適応性を持ち、リポジトリレベルのコードを提供します。

アップルApple Intelligenceと強化されたSiriが春にiPhoneに登場か

新たな報道によると、アップルは春にリリースされるiOSのバージョンに「Apple Intelligence」と呼ばれるAIシステムを搭載するとのこと。これは革新的な音声アシスタントSiriを強化するための措置です。アップルは通常、OSのポイントアップデートで徐々に新機能をリリースするため、ユーザーはまもなく、写真内の身分証明書情報の認識、オンラインフォームの自動入力など、Apple Intelligenceシステムに基づいたSiriサービスの改善を体験できるようになるでしょう。Siriインターフェースの最適化と、より深い製品知識の組み込みも予定されています。

達摩院「尋光」が話題を呼ぶ！制御可能な編集で、AIビデオワークフローが簡単に

アリババの達摩院が開発したAIビデオ制作革命的ツール「尋光」プラットフォームがWAICで発表され、クローズドβテストの予約が開始されました。このクラウドベースのAI制作プラットフォームは、脚本作成、ストーリボード設計、ビデオ素材編集などの機能を統合し、ビデオ制作プロセスを簡素化し、制作効率を向上させます。簡単な操作で、ターゲットオブジェクトを独立したレイヤーに変換し、背景ビデオにシームレスに統合することで、シーンの切り替えを大幅に簡素化します。AI技術の強みは、複雑なプロットを理解し、生成されたオブジェクトの一貫性を維持し、ビデオの精密な編集を実現することです。プラットフォームには、ビデオレイヤーベースの機能が統合されています。