最近、マイクロソフトは大規模言語モデル(LLM)のプロンプトエンジニアリング専用の新しいプロンプトオーケストレーションマークアップ言語(POML、Prompt Orchestration Markup Language)をリリースしました。AIbaseがネットワーク情報のまとめたところによると、POMLは従来のプロンプト開発における課題を解決することを目的としており、構造化され、保守可能な方法でAIアプリケーションの開発効率を向上させることを狙っています。しかし、この新しい言語がXMLの「再版」に過ぎないのか、またその複雑さが実用性を低下させるのかどうかについては、コミュニティ内で議論が巻き起こっています。

POMLの核心機能:構造化されたプロンプトエンジニアリング  

POMLはHTMLに似た構文を使用し、`<role>`、`<task>`、`<example>`などの意味的なコンポーネントを通じて、複雑なプロンプトをモジュール化された部分に分解することで、プロンプトの可読性、再利用性、保守性を向上させます。マイクロソフトは、従来のプロンプトエンジニアリングでは構造がないこと、データ統合が複雑であること、フォーマットが敏感であり、ツールのサポートが不足していることを解決すると述べています。開発者はPOMLを使ってプロンプトコンポーネントを体系的に整理し、テキスト、テーブル、画像など多様なデータタイプを簡単に埋め込むことができ、CSSのようなスタイルシステムによって出力フォーマットを柔軟に調整し、フォーマットの変化によってモデルが不安定になることを減らすことができます。

マイクロソフトがAI用に新たなマークアップ言語-POML: プロンプトオーケストレーションマークアップ言語を提案した。正直、これはXMLと何が違うの? (見.jpg

強力なツールサポート:VS Code拡張機能とSDK  

POMLは単なるマークアップ言語ではなく、強力な開発ツールエコシステムも備えています。Visual Studio Code拡張機能は構文ハイライト、コンテキスト感知自動補完、リアルタイムプレビュー、エラー診断などの機能を提供し、開発体験を大きく向上させます。さらに、POMLはNode.jsおよびPythonのSDKをサポートしており、開発者がプロンプトエンジニアリングを既存の作業フローおよびLLMフレームワークにスムーズに統合できるようにします。例えば、シンプルなPOMLの例では`<img>`コンポーネントを使用して画像を参照し、`<task>`および`<output-format>`を組み合わせてタスクと出力要件を定義することで、構造化されたプロンプトを迅速に生成できます。

コミュニティの反応:革新なのか「XMLの再版」なのか?  

POMLのリリースは注目を集めましたが、コミュニティからの評価は意見が分かれています。一部の開発者はPOMLの構造化された設計に肯定的で、そのモジュール化されたアプローチとテンプレートエンジン(変数、ループ、条件文のサポート)が複雑なプロンプトの開発を簡素化すると考えています。一方で、POMLがXMLと似ている点を指摘する声もあり、その複雑な構文がプロンプトエンジニアリングを「コードを書く」ようなものにし、学習コストを増やす可能性があると懸念しています。一部の開発者は、Agentic AIやツール呼び出しの進展により、LLMがプロンプト形式に敏感であることが減少したため、POMLの必要性に疑問を投げかけているとも述べています。

応用シーンと未来の可能性