Grandream
Hermes Agent とは何か?「使うほど賢くなる AI」の仕組みとメリットをやさしく解説
はじめに:AI を使っていて、こんな不満はありませんか?
ChatGPT や Claude を毎日使っているけれど、こんなことを感じたことはないでしょうか。
- 「先週話したことを、また最初から説明しなきゃいけない」
- 「毎回同じ前置きを貼り付けている」
- 「チャットを閉じると全部リセット。何も覚えていない」
そう、今の多くの AI チャットは 「会話のたびに記憶がゼロになる」 設計です。毎回初対面から始まる AI に、プロジェクトの背景や好みのスタイルを説明し直す——それがどれだけ非効率か、使っている人はみんな感じているはずです。
Hermes Agent は、この問題に正面から向き合った AI エージェントです。
Hermes Agent とは?
Hermes Agent は、Nous Research が開発したオープンソースの AI エージェントです。
"The only agent with a built-in learning loop"
(組み込みの学習ループを持つ、唯一のエージェント)
一言で表すなら、「使えば使うほど賢くなる AI アシスタント」 です。
ターミナル(コマンドライン)上で動き、コードを書く・ファイルを操作する・ウェブを検索する・Slack にメッセージを送るなど、70種類以上の「道具」を自分で選んで使いながらタスクをこなします。
料金は無料(MIT ライセンスのオープンソース)。使う LLM モデルの API 費用だけが発生します。LM Studio などのローカルモデルを組み合わせれば、完全無料での運用も可能です。
なぜ「使うほど賢くなる」のか? 3つの仕組み
仕組み① メモリ(記憶)
Hermes Agent はあなたとの会話を ローカルファイルに保存し続けます。
具体的には 2 つのファイルで管理しています。
ファイル | 何を覚えるか |
|---|---|
| プロジェクトのルール、発見した修正方法、コーディング規約など「環境に関する事実」 |
| あなたの好み、コミュニケーションスタイル、よく使う言語など「あなたに関する情報」 |
次のセッションが始まるとき、これらのファイルが自動的に読み込まれます。「先週の続き」をそのまま話せるわけです。
さらに、過去数週間のすべての会話は SQLite データベースに蓄積され、キーワードで検索できます。「3週間前にどうやって解決したんだっけ?」も振り返れます。
仕組み② スキル(技の習得)
人間が経験を積むと「次からはもっとうまくやれる」ようになるように、Hermes Agent も よく使う手順を「スキル」として自動で保存 します。
たとえば、あなたが「GitHub のPRをレビューして」と何度も頼んでいると、エージェントはその手順をスキルとして記録。次回からは「PR レビューのやり方を一から考える」ではなく、「覚えた手順を使う」になります。
スキルは自分で書いて追加することも、世界中のユーザーが公開している Skills Hub からインストールすることもできます。
hermes skills browse # 公開スキルを眺める
hermes skills install <名前> # インストール
仕組み③ ラーニングループ(学習の連鎖)
この 2 つの仕組みが組み合わさることで、ループが生まれます。
タスクをこなす
↓
経験をメモリに記録
↓
手順をスキルとして保存
↓
次のタスクで活用
↓
またタスクをこなす(より速く・より正確に)
人間で言えば「新人がベテランに育っていく」プロセスが、AI で再現されているイメージです。
何ができるの? 主な機能を一覧で
できること
カテゴリ | 具体例 |
|---|---|
コーディング | コードを書く・レビューする・バグを直す・テストを実行する |
ファイル操作 | ファイルの読み書き・検索・整理 |
ウェブ検索 | 最新情報を調べてまとめる |
ブラウザ操作 | ウェブページを開く・フォームを入力する・スクリーンショットを撮る |
画像認識 | 画像を見て内容を説明する(VL モデル使用時) |
音声対話 | マイクで話しかける・音声で返答する |
Slack / Discord など | メッセージを送る・受け取る・ボットとして常駐する |
スケジュール実行 | 「毎朝9時に〇〇する」を自動化 |
並列処理 | 複数のタスクを同時に走らせる |
あらかじめ用意されているスキル(プラグイン)
Hermes Agent にはインストール直後から使える 組み込みスキル が70以上搭載されています。カテゴリ別に紹介します。
開発・コーディング
github-pr-workflow— PR の作成・レビュー・マージを自動化github-code-review— コードレビューの観点チェックと改善提案test-driven-development— TDD スタイルでのテスト先行開発python-debug/nodejs-debug— デバッグセッションの支援
生産性・ドキュメント
google-workspace— Gmail・カレンダー・ドライブの操作notion— Notion ページの読み書き・データベース更新linear— タスク管理・Issue トラッキングairtable— スプレッドシート感覚のデータ操作pdf-edit— PDF の編集・テキスト抽出
クリエイティブ
image-generation(ComfyUI)— ローカルで画像生成video-creation(Manim)— 数式・図解アニメーション動画を生成excalidraw— 図・フローチャートの自動作成p5js— ビジュアルアート・インタラクティブコンテンツ生成
メディア・エンタメ
spotify— 音楽の再生・プレイリスト操作youtube— 動画検索・情報取得minecraft— Minecraft サーバーのホスティング管理gif-search— GIF 画像の検索と取得
AI・MLOps
claude-code— Claude Code CLI にタスクを委譲huggingface— HuggingFace のモデル・データセット操作vllm/llama-cpp— ローカル LLM の管理model-eval— モデルの評価・ベンチマーク実行
Mac 連携(macOS のみ)
apple-notes— Apple メモの読み書きapple-reminders— リマインダーの作成・管理imessage— iMessage の送受信find-my— デバイスの位置確認
リサーチ・情報収集
arxiv— 論文の検索・要約x-twitter— X(旧 Twitter)の投稿・検索
これらはすべて /スキル名 と入力するだけで呼び出せます。たとえば:
/github-pr-workflow ← PR 作業を開始
/arxiv ← 論文を調べる
/notion ← Notion を操作する
さらに世界中のユーザーが作ったスキルを Skills Hub から追加インストールすることもできます。
つながるサービス
Slack・Discord・WhatsApp・Telegram など 21以上のメッセージングプラットフォーム に接続できます。「Slack から話しかけると AI が作業してくれる」という使い方が可能です。
また MCP(Model Context Protocol) という仕組みで、GitHub・Notion・データベースなど外部ツールとも連携できます。
他の AI エージェントと何が違う?
Claude Code など既存の AI エージェントと比較してみます。
比較項目 | Claude Code(参考) | Hermes Agent |
|---|---|---|
セッション間の記憶 | なし(CLAUDE.md で手動補完) | あり(MEMORY.md・USER.md に自動保存) |
自己学習 | なし | あり(タスク完了後にスキルを自動作成) |
使える LLM | Claude のみ | 18以上のプロバイダー+ローカルモデル |
コスト | Claude API 費用が必須 | 本体無料・ローカルモデルなら費用ゼロ |
話しかける方法 | ターミナル・Dispatch・channels | ターミナル・Slack・Discord・音声など21以上 |
スケジュール実行 | あり | あり(cron で定期自動実行) |
コミュニティ資産 | なし | Skills Hub(世界中のスキルを共有・流用) |
一言でまとめると:
- Claude Code → 「コードを書く作業」に特化した高性能なペアプログラマー
- Hermes Agent → 「育てて使い続けるチームメンバー」。コーディングに限らず、業務自動化・メッセージング・音声まで幅広くカバー
どちらが優れているというより、用途が違います。コーディング品質を最優先するなら Claude Code、幅広いタスクを自動化してローカルで運用したいなら Hermes Agent が向いています。
こんな人に向いている
向いている人
- コードを書く仕事をしていて、繰り返し作業を自動化したい
- 毎回同じ前置きプロンプトを打つのが面倒
- AI に「自分のこと」を覚えさせたい
- Slack や Discord から AI に指示したい
- LLM の API 費用を抑えてローカルで運用したい
少し難しいかもしれない人
- ターミナル(黒い画面)を使ったことがない
- AI の回答をブラウザで見られれば十分
料金と使い始めるコスト
Hermes Agent 本体:無料(MIT ライセンス・オープンソース)
使う LLM によってコストが変わります。
選択肢 | コスト | 特徴 |
|---|---|---|
ローカルモデル(LM Studio など) | 完全無料 | インターネット不要・プライバシー◎・性能はマシン依存 |
Anthropic Claude | 従量課金 | 高性能・会話の自然さ◎ |
OpenAI GPT | 従量課金 | 汎用性が高い |
Nous Portal | サブスクリプション | 300以上のモデルが使い放題 |
OpenRouter | 従量課金 | 多数のモデルを一元管理 |
セキュリティは大丈夫?
「ファイルを操作する AI」と聞くと不安になるかもしれませんが、Hermes Agent は 7層のセキュリティ を備えています。
特に重要な点:
- 危険な操作は必ず人間に確認を求める(ファイルの削除など)
rm -rf /(全ファイル削除)のような致命的コマンドは 絶対に実行できない ハードブロックがある- Docker コンテナ内で動かすことで、ローカル環境を完全に隔離できる
- Slack などのボット運用では、許可したユーザーだけが操作できるアクセス制御がある
まとめ
Hermes Agent を一言で表すなら、「育てる AI」 です。
使うたびに経験を積み、手順を覚え、あなたの好みを学んでいく。最初は「普通の AI アシスタント」でも、使い続けるほど「自分専用のチームメンバー」に近づいていきます。
実際に使用してみた感想は以下です。
- Codexのサブスクでも動作するのでコスパがいい(API従量課金不要)
- 記憶が保持される
- 適切なSkillが自動的に起動する
- マルチエージェントで長時間の自走可能
- さまざまなツールから気軽に指示ができる
- カンバン機能でタスクを自律的に作業可能
24時間フルに稼働させるAIとしてかなりいい選択肢だと思いました。
X APIと連携して、Xの情報を収集するskillも用意されているみたいなので、試してみたいです。
本体は無料で、ローカルモデルと組み合わせれば月額コスト0円での運用もできます。「試してみる敷居が低い」のも大きなメリットです。
詳細は公式ドキュメントをご覧ください。
気になった方は、まず1コマンドでインストールしてみてください。
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
グランドリームでは、AI エージェントを活用したシステムの設計・開発・運用を支援しています。ご相談はお気軽にどうぞ。
参考
Grandream
株式会社グランドリーム
AI・システム開発のプロフェッショナルチームです。AIエージェント・業務自動化・Webシステム開発などを手がけています。
