内容紹介
OpenAI、Anthropic、Gemini、LangChain、LangGraph、Gradio、Tavily、SerpApiなどを用い、基本からマルチエージェントシステムの設計まで、開発に必要なテクニックを体系的に解説
LLMエージェント(AIエージェント)は、ペルソナ(口調、知識、判断の方向、人柄)等を生成AIに組み込み、生きた人間の代わりに様々なことをするもので、カスタマーサービス、情報検索、分析、意思決定支援など、様々なタスクを自律的に遂行することができます。これにより、新たなサービスの創出、業務の自動化や効率化など、ビジネスに大きなインパクトをもたらすことが期待されています。
一方で、LLMエージェントを実際のビジネスに応用するためには、技術的な理解だけでなく、システム設計や運用における様々な課題をクリアする必要があります。例えば、エージェントの能力を最大限に引き出すための対話設計、複数エージェント間の連携制御、ユーザーとのインタラクションデザインなどを設計、解説します。
このような方におすすめ
生成AI、LLM、Chatボット開発者
目次
主要目次
第1章 LLMエージェントとは
1.1 言語モデルとは何か
1.2 LLMエージェントとは
第2章 エージェント作成のための基礎知識
2.1 OpenAI API
2.2 LangChain入門
2.3 Gradio を用いたGUI作成
第3章 エージェント
3.1 LLMに知識を与える
3.2 LLMにツールを与える
3.3 複雑なフローで推論するエージェント
3.4 記憶を持つエージェント
3.5 ペルソナのあるエージェント
第4章 マルチエージェント
4.1 マルチエージェントとは
4.2 マルチエージェントシステムの構築
4.3 マルチエージェントの活用
第5章 LLMエージェント研究の最先端
5.1 直近の研究動向
5.2 ビジネスでの利用例
補足 OpenAI API/Anthropic APIキー/Gemini APIキー/Tavily APIキー/Serp APIキー/Google Colaboratoryのシークレット機能
詳細目次
はじめに
A 謝辞
B ソースコード
C Google Colaboratory
D スクリプト実行の際の注意
第1章 LLMエージェントとは
1.1 言語モデルとは何か
1.1.1 LLMについて
1.1.2 LLM以前の言語モデル
1.1.3 LLMを支える技術と主要モデル
1.2 LLMエージェントとは
1.2.1 LLMエージェントの定義
1.2.2 LLMエージェントの最先端
第2章 エージェント作成のための基礎知識
2.1 OpenAI API
2.1.1 テキスト生成の基礎
2.1.2 テキスト生成の応用
2.1.3 画像を入力する
2.1.4 音声を扱う
2.1.5 画像を生成する
2.2 LangChain入門
2.2.1 LangChainとは
2.2.2 チャットアプリケーション
2.2.3 翻訳アプリケーション
2.2.4 テーブル作成アプリケーション
2.2.5 Plan-and-Solve チャットボット
2.3 Gradioを用いたGUI作成
2.3.1 Gradioとは
2.3.2 Gradioの基礎
2.3.3 イテレーティブなUI
2.3.4 Gradioの応用
第3章 エージェント
3.1 LLMに知識を与える
3.1.1 LLMに知識を与える
3.1.2 文書の構造化
3.1.3 文書検索機能を持つLLM
3.1.4 知識を与えることの限界
3.2 LLMにツールを与える
3.2.1 検索ツール
3.2.2 プログラム実行ツール
3.2.3 ツールを自作する
3.3 複雑なフローで推論するエージェント
3.4 記憶を持つエージェント
3.4.1 LLMエージェントの記憶とは
3.4.2 LLMエージェントへの記憶の実装
3.5 ペルソナのあるエージェント
3.5.1 ペルソナの重要性
3.5.2 ペルソナ付与のためのプロンプト技術
3.5.3 ペルソナ付与のためのメモリ技術
3.5.4 プロンプトに含める情報
3.5.5 メモリに含める情報
第4章 マルチエージェント
4.1 マルチエージェントとは
4.1.1 マルチエージェントLLMの概要
4.1.2 マルチエージェントLLMの利点
4.1.3 マルチエージェントLLMの応用例
4.2 マルチエージェントシステムの構築
4.2.1 LangGraphの概要
4.2.2 チャットボットの構築
4.2.3 複数のエージェントの接続
4.2.4 3つのエージェントから選択されたエージェントが回答するシステム
4.2.5 ツールの使用
4.3 マルチエージェントの活用
4.3.1 数学の問題を解かせよう
4.3.2 議論させてみよう
4.3.3 応答を洗練させよう
第5章 LLMエージェント研究の最先端
5.1 直近の研究動向
5.1.1 記憶プロセス
5.1.2 推論と計画
5.1.3 フレームワーク
5.1.4 複数エージェントによる統合
5.1.5 まとめ
5.2 ビジネスでの利用例
5.2.1 セールス
5.2.2 バックオフィス業務
5.2.3 コード生成
5.2.4 研究分野
5.2.5 まとめ
補足
OpenAI APIキーを取得する
Anthropic APIキーを取得する
Gemini APIキーを取得する
Tavily APIキーを取得する
Serp APIキーを取得する
mem0 APIキーを取得する
Google Colabのシークレット機能の利用方法
OpenAI o1
参考文献
索引
著者紹介
続きを見る