アップル研究チームによるLazyLLM：LLMの長文推論効率向上

最近、アップル社の研究チームとMeta AIの研究者らが共同で、大規模言語モデル（LLM）の長文推論における効率性を向上させる「LazyLLM」という新技術を発表しました。

ご存じのとおり、現在のLLMは長いプロンプト処理、特にプリフィリング段階で速度が遅いという問題を抱えています。これは、最新のトランスフォーマーアーキテクチャが計算注意力において、プロンプト内のトークン数に比例して計算量が二乗で増加するためです。そのため、Llama2モデルを使用する場合、最初のトークンの計算時間は後続のデコードステップの21倍にもなり、生成時間の23％を占めています。

この状況を改善するために、研究者らはLazyLLMを提案しました。これは、重要なトークンの計算を選択的に行うことでLLM推論を高速化する新しい手法です。LazyLLMの中核は、前の層の注意力スコアに基づいて各トークンの重要性を評価し、計算量を段階的に削減することです。永続的な圧縮とは異なり、LazyLLMは必要に応じて削減されたトークンを復元し、モデルの精度を確保します。さらに、LazyLLMはAux Cacheと呼ばれるメカニズムを導入し、剪定されたトークンの隠れ状態を保存することで、これらのトークンを効率的に復元し、性能低下を防ぎます。

LazyLLMは推論速度において優れた性能を示し、特にプリフィリングとデコード段階で顕著です。この技術の3つの主な利点は、あらゆるトランスフォーマーベースのLLMと互換性があり、モデルの再トレーニングが不要で、多様な言語タスクで非常に効果的であることです。LazyLLMの動的剪定戦略により、重要なトークンの大部分を維持しながら、計算量を大幅に削減し、生成速度を向上させることができます。

研究結果によると、LazyLLMは複数の言語タスクで優れた性能を示し、TTFT速度はLlama2で2.89倍、XGenで4.77倍向上し、精度はほぼベースラインと同等でした。質問応答、要約生成、コード補完タスクなど、LazyLLMはより高速な生成速度を実現し、性能と速度のバランスを良好に保っています。漸進的な剪定戦略と層ごとの分析が、LazyLLMの成功の基礎となっています。

論文アドレス：https://arxiv.org/abs/2407.14057

要点：
🌟 LazyLLMは重要なトークンを動的に選択することで、LLM推論プロセスを高速化し、特に長文のシナリオで優れた性能を発揮します。
⚡ この技術は推論速度を大幅に向上させ、TTFT速度は最大4.77倍向上し、高い精度を維持します。
🔧 LazyLLMは既存のモデルに変更を加える必要がなく、あらゆるトランスフォーマーベースのLLMと互換性があり、実装が容易です。

商湯科技、LazyLLMプラットフォームを発表：わずか10行のコードで複雑なAIアプリケーションを作成

2025グローバルデベロッパー先駆者会議において、商湯科技はオープンソースのローコードプラットフォームLazyLLMを発表しました。これは、AIアプリケーション開発のハードルを下げることを目的としています。開発者は現在、約10行のコードだけで、複雑なマルチエージェント大規模モデルアプリケーションを簡単に構築できます。LazyLLMは、ユーザーがAIアプリケーションを迅速に開発できるだけでなく、簡単な操作で開発プロセスを容易で楽しいものにし、まるでブロックを積み重ねるように簡単にできます。LazyLLMという名前は「怠惰」に由来し、商湯科技がユーザーに…

面白くなくなってきた？生成AIによる創作が文学作品を均質化させる可能性

ChatGPTなどの生成系AIの台頭は、創造性とアイデアへの影響について活発な議論を引き起こしています。ロンドン大学とエクセター大学の研究によると、生成モデルは物語の創造性、面白さ、文章力において顕著な効果を示し、新規性と実用性の評価において最高点を獲得しました。しかし、この過程において、AIによって創作された物語が類似する傾向にある、つまり創作内容の均質化の危険性も示唆されています。特に「踏み台」として使用される場合、その傾向が強まります。研究は、生成AIが作家間の創作における差異をある程度埋め合わせていることを指摘していますが、その広範な使用は全体的な内面性の欠如というリスクを伴う可能性があると警告しています。

腾讯PhotoMaker V2アップグレード：数秒でパーソナルな人物画像をカスタマイズ、LoRAトレーニング不要

テンセントのオープンソースプロジェクトPhotoMaker V2がリリースされ、AIによるパーソナルな画像カスタマイズ機能が大幅にアップグレードされました。このバージョンでは画期的なID埋め込みスタック技術により、ユーザー提供の写真から迅速かつ効率的に高品質なパーソナル画像を生成することが可能になり、面倒なトレーニングプロセスが不要になりました。中核技術は独自のID埋め込み手法であり、統一されたID表現を抽出・作成することで、人物の特徴の一貫性と多様な変化を同時に維持します。テキストによる説明や参照画像の指示に従って、様々なシーン、状態、スタイルのパーソナル写真を生成できます。

インテル、AI Playgroundテスト版を発表 Arcグラフィックスカードユーザー向けにAI体験を提供

インテルは先日、Arcグラフィックスカードユーザー向けに、AIオープンソースソフトウェアであるAI Playgroundのテスト版を公開すると発表しました。この発表は、インテルの人工知能分野における新たな重要な展開を示しており、ユーザーはAI技術を探求し活用するための新しいプラットフォームを得ることになります。

アップル研究チームによるLazyLLM：LLMの長文推論効率向上

関連推奨

商湯科技、LazyLLMプラットフォームを発表：わずか10行のコードで複雑なAIアプリケーションを作成

面白くなくなってきた？生成AIによる創作が文学作品を均質化させる可能性

OpenAIが内部構造を再編、AI安全責任者が推論研究に異動

腾讯PhotoMaker V2アップグレード：数秒でパーソナルな人物画像をカスタマイズ、LoRAトレーニング不要

インテル、AI Playgroundテスト版を発表 Arcグラフィックスカードユーザー向けにAI体験を提供