記事本文

百度、汎用画像キー情報抽出ツールPP-ChatOCRを発表　文心大模型を基盤に開発

公開AI二ュ-ス

時間 :Aug 11, 2023

読む :1分

PP-ChatOCR: 文心大模型ベースの汎用画像キー情報抽出ツール

百度飛槳チームは、文心大模型に基づく汎用的な画像キー情報抽出ツール「PP-ChatOCR」を発表しました。

このツールは、OCR文字認識と大規模言語モデル技術を組み合わせることで、様々な場面で画像内の重要な情報を抽出できます。

PP-ChatOCRは既にPaddleXで公開されており、開発者はこのプラットフォームでトレーニングや微調整を行い、高性能な環境への展開が可能です。

このツールは、複数の場面で高い精度と安定性を示しています。

Moonshot AIと清华大学がPrfaaSアーキテクチャを発表大規模モデルの計算力の限界を突破

大規模言語モデルの推論効率に大きな進展が見込まれる。清华大学とMoonshot AIは、プリフィル即サービスという新しいアーキテクチャを共同で提案した。このアーキテクチャでは、推論プロセスをプリフィルとデコードの2つのフェーズに分割し、計算リソースの配分を最適化することで、ハードウェアの制限問題を効果的に解決し、モデルサービスのパフォーマンスを著しく向上させた。

Apr 20, 2026

245.5k

OpenAIが生物学専用の大規模モデルGPT-Rosalindを発表、研究の加速を目指す

OpenAIが生物学専用大モデルGPT-Rosalindを発表。ゲノムデータの過負荷と専門用語の壁という研究課題に対応し、汎用科学モデルとの差別化を図る。....

Apr 17, 2026

258.6k

本当のAI個人アシスタントをめざす：アップルが社内トレーニングセッションを開催　Siriの進化の基盤を解説

Apple launches 'AI Coding Bootcamp' for Siri engineers to enhance their large language model skills, supporting next-gen Siri and iOS AI features. This strategic move aims to catch up with Google and OpenAI in generative AI, focusing on prompt engineering and full-cycle model deployment.....

Apr 16, 2026

194.7k