Why This Guide
なぜこのガイドが必要なのか?
公式ドキュメントはリファレンスとして優れていますが、初めて PydanticAI に触れる開発者にとって「全体の設計思想」や「データフロー」を直感的に掴むことは容易ではありません。
本ガイドは、Google Gemini を題材に、豊富な図解(Mermaid)を用いて PydanticAI のアーキテクチャを視覚的に解説します。「どのように動くのか」「なぜそのように設計されているのか」を視覚的に理解することで、実践的なエージェント開発への最短ルートを提供します。
Learning Cycle
4つのステップで確実に理解する
本ガイドは、すべてのレッスンで共通の学習サイクルを採用しています。視覚と実践を組み合わせることで、効率的にPydanticAIを習得できます。
読む (Read)
コンセプトと目的を理解します。
見る (Watch)
図解(Mermaid)でデータと処理の流れを視覚的に把握します。
動かす (Run)
Google Colab で実際にコードを実行し、手元で結果を確認します。
確認 (Check)
重要なポイントを振り返り、理解を定着させます。
Curriculum
カリキュラム概要 — 11チャプター / 全34レッスン
公式ドキュメントの構成に準拠した4つのフェーズで、PydanticAIを段階的に学びます。各レッスンは「読む 8〜15分 + Colab 10〜20分」で完結します。
基礎 (Foundation)
環境構築から Agent / DI といった土台概念までを押さえます。
3章 / 9レッスン
- Ch0Setup & First Run
Colab上でPydanticAI + Geminiが動く状態を作り、最初のAgentを実行するまで。
- Ch1Core: Agents
Agent本体のライフサイクルとシステムプロンプト設計を腹落ちさせる。
- Ch2Dependencies
Agentに外部リソース (DB, HTTPクライアント, 設定) を安全に渡す DI の作法。
コア (Core)
Function Tools・構造化出力・Gemini固有機能で実用度を一気に引き上げます。
3章 / 10レッスン
- Ch3Function Tools
Geminiに「関数を呼ばせる」ための定義・検証・リトライ。
- Ch4Structured Output
「テキストではなく構造化データを返させる」型安全な設計。
- Ch5Capabilities
Gemini固有の機能 (Web Search / Thinking / Safety Settings) を引き出す。
応用 (Advanced)
マルチモーダル入力・MCP連携・マルチエージェント協調で表現幅を広げます。
3章 / 9レッスン
- Ch6Multimodal Input
画像・PDF・YouTube URLなど、テキスト以外の入力を扱う。
- Ch7Toolsets, MCP
ツール群を再利用可能にまとめ、MCPサーバーを通じて連携する。
- Ch8Multi-Agent
複数Agentの協調パターンと、Pydantic Graphによるワークフロー記述。
本番運用 (Production)
観測・評価・耐久実行など、長く動かすための運用観点を整えます。
2章 / 6レッスン
- Ch9Observability & Evals
本番Agentの「見える化」と「評価」。Logfire・Pydantic Evals・LLM-Judge。
- Ch10Production
Durable Execution・UI Event Streams・A2Aで、本番クラスのシステムに乗せる。
Architecture & Design
設計上の重要な決断
本ガイドは、学習者が迷わず、安全かつ低コストで学べるよう、あえて「引き算」の設計を行っています。
バックエンドを持たない
運用負荷ゼロ。Webサイトは静的に配信され、可用性・セキュリティの責任を持ちません。
APIキーはユーザーのColab内のみ
流出リスクをプロジェクト側から完全分離。セキュアに学習を進められます。
コストはユーザー負担
Geminiの無料枠で十分動かせるため、実質ほぼゼロコストで学習が可能です。
動的機能をWebに作らない
インタラクティブな要素はColabに任せ、Webは「読み物」としての完成度に集中します。
画像・図解を最優先
文章だけでは伝わらない構造やフローを、豊富な図解(Mermaidなど)で視覚的に補完します。