CrossRoad

XRを中心とした技術ブログ。 Check also "English" category.

Microsoft Copilot Studioを使って簡単なエージェントを作ってみました

生成AIの盛り上がりで様々なサービスが出ています。今回は、その1つであるMicrosoft Copilot Studioについて調べてみました。

1. Microsoft Copilot Studioとは

自分で使いたいAIエージェントを自由に作ることができるサービスです。

2023年11月にMicrosoftが主催したカンファレンス「Ignite 2023」で発表されました。

またお客様ご自身で Copilot を開発できる Microsoft Copilot Studio も発表しています。カスタムの Copilot をローコードでゼロからスピーディに作ることができ、Salesforce や SAP、ServiceNow といった 1,100 以上のプラグインとコネクタを標準搭載するなど拡張性に優れ、OpenAI GPT との連動が大きな特徴となっています。

4 年ぶりに開催。Microsoft Ignite Japan: Microsoft Copilot で実現する AI トランスフォーメーション - Source Asia

2. 読み込んだURLの情報に基づいて回答をするエージェントの作成

Copilot Studioを始める方法ですが、こちらの記事の1-8までが参考になります。バージョンが変わったためか、9以降は別の画面になっていました。

Microsoft copilot studioを使ってみた-①【Web編】

Copilot Studioの冒頭画面は、7/12時点ではこのようになっています。 Top View of Copilot Studio

まずは「新しいエージェント」ボタンを押します。

Conversation with Copilot AI for Making an Agent

すると、このような画面になるので、対話しながらAIエージェントの概要を決めていきます。

An Example of AI Agent Overview of Copilot Studio” title=

「全般的な指示」という欄にある箇所が、最初の対話で答えた内容です。ここでは、WebGLフレームワークであるBabylon.jsについて回答してくれるAIエージェントを作ってみました。

また、下の方に「ナレッジ」とあります。「ナレッジの追加」を選択すると、任意のWebサイト、SharePoint、OneDrive、ローカルファイルアップロードをして知識を指定することで、その内容に基づいて回答できます。

Add Knowledge for AI Agent on Copilot Studio

今回は、Babylon.js DocumentationのURLを指定しました。なお、フォルダは2階層までしか指定できません。そのため、こちらは有効です。

https://doc.babylonjs.com/features/

こちらはエラーになって登録できません。

https://doc.babylonjs.com/features/featuresDeepDive/mesh/gaussianSplatting

なお、AIエージェントからの回答で、上記のGaussian Splattingの内容を回答してくれたので、登録時が2階層という制約があるだけで、実際は奥の階層まで確認しているようです。

URLを指定したところで、「Babylon.jsについて教えてください」という簡単なプロンプトで問いかけしてみました。 すると、このように公式ドキュメントを読み込んだ上での回答が返ってきます。
A Simple Question of What Babylon.js is

3. 自分が指定したURLの情報以外の回答を禁止も可能

「概要」の画面で「すべての公開 Web サイトをエージェントが検索できるようにします。」を無効にしていると、指定した情報以外を使わないようにできます。

たとえば、先ほどのBabylon.jsの公式ドキュメントのみを読み込む設定にしていて、three.jsのことを聞いてみます。すると、このように「回答できない」という返答がきます。

AI Agent can't answer questions when it is prohibited to access generic internet

次に、「すべての公開 Web サイトをエージェントが検索できるようにします。」を有効にしてから同じ質問をします。
すると、このようにthree.jsについて回答できるようになります。 AI Agent can answer questions when it is not prohibited to access generic internet

4. できること、できないこと

初見で色々試した感じだと、今回のような情報を提示するエージェントはうまくいきましたが、それ以外は思ったよりも色々準備が必要という印象でした。

任意の書類を読み込んで誤字脱字チェックをするとか、受信メールから最も受信数が多い宛先と件数を表にしてみるとか、Office365系のソフトウェアと合わせて使うような機能は、色々制約がでてうまくいきませんでした。

たとえば、ずっと前の勉強会PowerPoint資料を使って、誤字脱字チェックをする機能を作ってみようと思ったのですが、ローカル環境のPowerPointの使用法を提案されました。 A Failed Example of AI Agent on Copilot Studio

やればできるとは思いますが、PowerAutomateを準備するなど、それなりに他の技術への理解も必要で、なんとなく片手間でやりづらい印象を持ちました。

5. おわりに

Copilot Stdiioはどういうものか、というのがわかっただけでもよかったです。

次は、Copilot Studioでもっと複雑な処理を作る方法を考えてみます。