Hermes AI 모델 Provider 선택 가이드 | AI 엔진 공급자 비용 비교 2026

TL;DR

상시 운용은 구독·월 플랜, API는 선별 사용, OAuth 자동화는 신중히 본다.

기본 엔진은 비용 예측이 쉬운 provider를 먼저 둔다.
OpenRouter, GLM, Kimi 같은 API는 테스트·확정·고난도 보조에만 붙인다.
Hermes 같은 에이전트는 입력 토큰이 계속 쌓이므로 종량제는 비용 상한을 먼저 정한다.

상시 운용은 구독·월 플랜, API는 선별 사용, OAuth 자동화는 신중히 보는 provider 선택 기준

핵심 주제: Hermes Model Provider Selection
운영 초점: Hermes Provider 선택 · Hermes 모델 설정
읽기 밀도: 8개 섹션
예상 학습 시간: 8분
난이도: 중급
발행일: 2026.05.09

헤르메스 전체 글

왜 provider 선택이 모델 비교가 아닌가

Hermes provider 선택을 상시 운용, 모델 테스트, 로컬 초안, OAuth 실험으로 나누는 판단표 — Provider 선택은 모델 이름 비교가 아니라 **상시 운용 비용, 테스트 목적, 로컬 처리, OAuth 위험**을 나누는 판단입니다.

Hermes나 OpenClaw처럼 파일·로그를 읽는 코딩 에이전트는 일반 채팅처럼 한 번 묻고 끝나지 않습니다. OpenClaw는 Hermes와 비슷하게 장시간 작업 맥락을 다루는 에이전트 계열 도구로 보면 됩니다. 파일을 읽고, 로그를 확인하고, 도구 결과를 다시 입력으로 넣는 과정에서 입력 토큰이 계속 누적됩니다.

그래서 종량제 API를 기본 엔진으로 오래 켜두면 예상보다 비용이 빨리 커질 수 있습니다. 기본값은 성능 순위표 1등이 아니라 비용이 예측 가능한 provider가 되어야 합니다. OpenRouter 같은 API 라우터는 특정 모델 테스트, 특정 로직 검증, 고난도 보조 작업에 선별 사용하는 쪽이 맞습니다.

작업 유형별 선택 기준

provider를 먼저 고르지 말고 작업을 먼저 나누면 선택이 단순해집니다.

작업 성격	권장 provider 유형	이유
매일 오래 켜두는 기본 코딩 엔진	구독·월 플랜형	월 비용과 사용량을 예측하기 쉽습니다.
특정 모델 비교·검증	종량제 API	필요한 순간에만 과금되게 만들 수 있습니다.
민감 자료·반복 초안	로컬 모델	외부 전송과 API 비용을 줄일 수 있습니다.
OAuth 구독 연결	개인 실험만	계정 정책 경고나 정지 리스크를 확인해야 합니다.

분류별 추천 provider

구독형 월 플랜을 기본 엔진으로 두고 종량제 API와 로컬 모델을 선별 사용하도록 나누는 비용 라우팅 그림 — 상시 엔진은 비용 예측이 쉬운 쪽에 두고, **종량제 API는 모델 테스트와 확정 작업에만 선별 사용**하는 편이 안전합니다.

자주 언급되는 provider는 아래처럼 나눠서 보면 됩니다.

분류	후보	쓸 때	제외·주의 이유
상시 운용 후보	OpenAI Codex, Nous Portal, OpenCode Go	오래 켜둘 기본 코딩 엔진입니다. 특히 월 플랜·구독형은 비용 예측이 쉽습니다.	조직·개인 계정 정책과 실제 사용량 한도는 먼저 확인합니다.
API 선별 사용 후보	OpenRouter, Z.AI / GLM, Kimi Coding Plan & Moonshot API	모델 비교, 특정 로직 확정, 고난도 보조 작업에만 씁니다.	상시 기본으로 두면 입력 토큰 누적으로 월 비용이 빠르게 커질 수 있습니다.
로컬·오픈모델 흐름	LM Studio, Ollama Cloud	민감 자료, 반복 초안, 외부 전송 최소화에 씁니다.	로컬은 성능·환경 설정 부담, 클라우드는 플랜 한도 확인이 필요합니다.
OAuth 신중 사용	Google Gemini via OAuth + Code Assist, Anthropic / Claude Code, Qwen OAuth	개인 실험과 짧은 테스트에만 둡니다.	구독 계정을 자동화 backend처럼 쓰는 방식은 경고가 뜰 수 있어 공개 운영에는 비추천입니다.

Nous Portal, OpenRouter, LM Studio, Anthropic은 선택 화면 상단에 먼저 보이는 항목이라 초반 비교 후보가 되기 쉽습니다. 다만 실제 운영 대화에서는 Codex, OpenCode Go, GLM, Ollama Cloud, Kimi, OpenRouter가 반복해서 언급됩니다. 작성자 환경에서는 OpenAI Codex가 currently active로 표시되어 있었지만, 이는 예시 상태일 뿐 모든 독자가 Codex를 active로 맞춰야 한다는 뜻은 아닙니다.

전체 provider 목록

OpenAI Codex, OpenCode Go, OpenRouter, GLM, Kimi, LM Studio, Ollama Cloud 등 provider를 분류한 레퍼런스 보드 — 긴 provider 목록은 처음부터 외우는 표가 아니라 **필요할 때 찾아보는 레퍼런스**로 두는 것이 읽기 쉽습니다.

아래 목록은 Hermes model 선택 화면에 보이는 provider를 빠짐없이 남긴 레퍼런스입니다. 처음부터 전부 외울 필요는 없고, 위 분류를 기준으로 필요한 항목만 보면 됩니다.

화면 표시	짧은 해석
Nous Portal	Nous Research subscription. 구독형 시작점입니다.
OpenRouter	100+ models, pay-per-use. 여러 모델을 비교하는 종량제 라우터입니다.
LM Studio	local desktop app with built-in model server. 로컬 모델 서버입니다.
Anthropic	Claude models, API key or Claude Code. Claude 계열 연결입니다.
OpenAI Codex	currently active. 코딩 기본 엔진 후보입니다.
Xiaomi MiMo	MiMo-V2.5 and V2 models, pro/omni/flash. MiMo 계열 모델입니다.
Tencent TokenHub	Hy3 Preview direct API via tokenhub.tencentmaas.com. Hy3 직접 API 경로입니다.
NVIDIA NIM	Nemotron models, build.nvidia.com or local NIM. NVIDIA 기반 모델 운영 경로입니다.
Qwen OAuth	local Qwen CLI login 재사용. Qwen 로그인 기반 경로입니다.
GitHub Copilot	GITHUB_TOKEN 또는 gh auth token 사용. GitHub 개발 흐름과 연결됩니다.
GitHub Copilot ACP	copilot --acp --stdio 실행. Copilot ACP 프로세스를 붙이는 방식입니다.
Hugging Face Inference Providers	20+ open models. Hugging Face 모델 생태계 연결입니다.
Google AI Studio	Gemini native API. Gemini 공식 API 경로입니다.
Google Gemini via OAuth + Code Assist	free tier supported, no API key needed. OAuth 자동화 리스크 확인이 필요합니다.
DeepSeek	DeepSeek-V3, R1, coder direct API. reasoning/coding 모델 실험 후보입니다.
xAI	Grok models direct API. Grok 계열 실험 후보입니다.
Z.AI / GLM	Zhipu AI direct API. GLM 계열 모델 비교 후보입니다.
Kimi Coding Plan & Moonshot API	api.kimi.com. 긴 문맥과 코딩 실험 후보입니다.
Kimi / Moonshot China	Moonshot CN direct API. 중국 endpoint 경로입니다.
StepFun Step Plan	agent/coding models via Step Plan API. StepFun 에이전트·코딩 모델 경로입니다.
MiniMax	global direct API. MiniMax 글로벌 API 경로입니다.
MiniMax via OAuth browser login	Coding Plan, minimax.io. 브라우저 OAuth 기반 경로입니다.
MiniMax China	domestic direct API. MiniMax 중국 domestic endpoint입니다.
Alibaba Cloud / DashScope Coding	Qwen + multi-provider. Alibaba Cloud와 Qwen 기반 경로입니다.
Ollama Cloud	cloud-hosted open models, ollama.com. Ollama 흐름을 클라우드 모델로 넓히는 선택지입니다.
Arcee AI	Trinity models direct API. Arcee Trinity 모델 경로입니다.
GMI Cloud	multi-model direct API. 멀티모델 직접 API 후보입니다.
Kilo Code	Kilo Gateway API. Kilo Gateway 기반 코딩 모델 경로입니다.
OpenCode Zen	35+ curated models, pay-as-you-go. OpenCode 종량제 모델 묶음입니다.
OpenCode Go	open models, $10/month subscription. 비용 예측이 쉬운 월 구독형 후보입니다.
AWS Bedrock	Claude, Nova, Llama, DeepSeek, IAM or API key. AWS 운영 기준이 있는 팀 후보입니다.
Azure Foundry	OpenAI-style or Anthropic-style endpoint. Azure AI deployment 연결 경로입니다.
Vercel AI Gateway	Vercel AI Gateway. Vercel 계정 기반 gateway 경로입니다.
Alibaba Cloud Coding Plan	dedicated coding tier. Alibaba Cloud 코딩 전용 tier입니다.
custom	direct API. 직접 API 설정입니다.
Custom endpoint	enter URL manually. OpenAI 호환 endpoint 등을 수동 입력합니다.
Configure auxiliary models	보조 모델 설정입니다. 요약·검수·특정 작업용 모델을 따로 잡을 때 봅니다.
Leave unchanged	현재 설정을 유지합니다.

실행 방법

provider를 바꾸기로 결정했다면 model 선택 화면을 다시 열면 됩니다. ChatGPT를 다른 작업에 쓰고 있거나, 기본 provider를 바꿔야 하거나, 특정 provider를 테스트할 때 사용합니다.

PowerShell에서 Docker profile을 쓰는 예시는 다음과 같습니다.

docker run -it --rm -v "$($env:USERPROFILE)\.hermes-bot5:/opt/data" nousresearch/hermes-agent model

macOS/Linux는 같은 명령에서 volume 경로만 ~/.hermes-bot5:/opt/data 형태로 바꾸면 됩니다.

화면에서는 ↑↓로 이동하고 ENTER 또는 SPACE로 선택합니다. ESC는 취소입니다. 모르면 이 명령 자체도 AI에게 “내 환경 기준으로 Hermes model provider 선택 화면 여는 명령 알려줘”라고 물어보면 됩니다.

최종 체크리스트

기본 엔진이 구독·월 플랜형 또는 비용 예측 가능한 provider인가?
월 비용 상한과 fallback 기준을 정했는가?
OpenRouter, GLM, Kimi 같은 API를 쓰는 목적이 명확한가?
Google Gemini OAuth, Claude Code OAuth 같은 구독 계정 자동화 리스크를 확인했는가?
선택한 이유와 제외한 이유를 짧게 기록했는가?

참고 링크

Hermes Agent AI Providers: https://hermes-agent.nousresearch.com/docs/integrations/providers
Hermes Agent Configuration: https://hermes-agent.nousresearch.com/docs/user-guide/configuration
OpenRouter Quickstart: https://openrouter.ai/docs/quickstart
LM Studio Developer Docs: https://lmstudio.ai/docs/app/api
OpenAI Codex 문서: https://developers.openai.com/codex/

작성 메모

2026년 5월 10일 오전 1시 49분 커뮤니티 메모의 핵심은 “기록을 하냐 OR 안 하냐”였습니다. provider 선택도 마찬가지입니다. 무엇을 골랐는지보다 왜 골랐고 왜 제외했는지를 남기면 다음 사람이 바로 참고할 수 있는 콘텐츠가 됩니다.

헤르메스 전체 글 바이브코딩 가이드