왜 provider 선택이 모델 비교가 아닌가

Hermes나 OpenClaw처럼 파일·로그를 읽는 코딩 에이전트는 일반 채팅처럼 한 번 묻고 끝나지 않습니다. OpenClaw는 Hermes와 비슷하게 장시간 작업 맥락을 다루는 에이전트 계열 도구로 보면 됩니다. 파일을 읽고, 로그를 확인하고, 도구 결과를 다시 입력으로 넣는 과정에서 입력 토큰이 계속 누적됩니다.
그래서 종량제 API를 기본 엔진으로 오래 켜두면 예상보다 비용이 빨리 커질 수 있습니다. 기본값은 성능 순위표 1등이 아니라 비용이 예측 가능한 provider가 되어야 합니다. OpenRouter 같은 API 라우터는 특정 모델 테스트, 특정 로직 검증, 고난도 보조 작업에 선별 사용하는 쪽이 맞습니다.
작업 유형별 선택 기준
provider를 먼저 고르지 말고 작업을 먼저 나누면 선택이 단순해집니다.
| 작업 성격 | 권장 provider 유형 | 이유 |
|---|---|---|
| 매일 오래 켜두는 기본 코딩 엔진 | 구독·월 플랜형 | 월 비용과 사용량을 예측하기 쉽습니다. |
| 특정 모델 비교·검증 | 종량제 API | 필요한 순간에만 과금되게 만들 수 있습니다. |
| 민감 자료·반복 초안 | 로컬 모델 | 외부 전송과 API 비용을 줄일 수 있습니다. |
| OAuth 구독 연결 | 개인 실험만 | 계정 정책 경고나 정지 리스크를 확인해야 합니다. |
분류별 추천 provider

자주 언급되는 provider는 아래처럼 나눠서 보면 됩니다.
| 분류 | 후보 | 쓸 때 | 제외·주의 이유 |
|---|---|---|---|
| 상시 운용 후보 | OpenAI Codex, Nous Portal, OpenCode Go | 오래 켜둘 기본 코딩 엔진입니다. 특히 월 플랜·구독형은 비용 예측이 쉽습니다. | 조직·개인 계정 정책과 실제 사용량 한도는 먼저 확인합니다. |
| API 선별 사용 후보 | OpenRouter, Z.AI / GLM, Kimi Coding Plan & Moonshot API | 모델 비교, 특정 로직 확정, 고난도 보조 작업에만 씁니다. | 상시 기본으로 두면 입력 토큰 누적으로 월 비용이 빠르게 커질 수 있습니다. |
| 로컬·오픈모델 흐름 | LM Studio, Ollama Cloud | 민감 자료, 반복 초안, 외부 전송 최소화에 씁니다. | 로컬은 성능·환경 설정 부담, 클라우드는 플랜 한도 확인이 필요합니다. |
| OAuth 신중 사용 | Google Gemini via OAuth + Code Assist, Anthropic / Claude Code, Qwen OAuth | 개인 실험과 짧은 테스트에만 둡니다. | 구독 계정을 자동화 backend처럼 쓰는 방식은 경고가 뜰 수 있어 공개 운영에는 비추천입니다. |
Nous Portal, OpenRouter, LM Studio, Anthropic은 선택 화면 상단에 먼저 보이는 항목이라 초반 비교 후보가 되기 쉽습니다. 다만 실제 운영 대화에서는 Codex, OpenCode Go, GLM, Ollama Cloud, Kimi, OpenRouter가 반복해서 언급됩니다. 작성자 환경에서는 OpenAI Codex가 currently active로 표시되어 있었지만, 이는 예시 상태일 뿐 모든 독자가 Codex를 active로 맞춰야 한다는 뜻은 아닙니다.
전체 provider 목록

아래 목록은 Hermes model 선택 화면에 보이는 provider를 빠짐없이 남긴 레퍼런스입니다. 처음부터 전부 외울 필요는 없고, 위 분류를 기준으로 필요한 항목만 보면 됩니다.
| 화면 표시 | 짧은 해석 |
|---|---|
| Nous Portal | Nous Research subscription. 구독형 시작점입니다. |
| OpenRouter | 100+ models, pay-per-use. 여러 모델을 비교하는 종량제 라우터입니다. |
| LM Studio | local desktop app with built-in model server. 로컬 모델 서버입니다. |
| Anthropic | Claude models, API key or Claude Code. Claude 계열 연결입니다. |
| OpenAI Codex | currently active. 코딩 기본 엔진 후보입니다. |
| Xiaomi MiMo | MiMo-V2.5 and V2 models, pro/omni/flash. MiMo 계열 모델입니다. |
| Tencent TokenHub | Hy3 Preview direct API via tokenhub.tencentmaas.com. Hy3 직접 API 경로입니다. |
| NVIDIA NIM | Nemotron models, build.nvidia.com or local NIM. NVIDIA 기반 모델 운영 경로입니다. |
| Qwen OAuth | local Qwen CLI login 재사용. Qwen 로그인 기반 경로입니다. |
| GitHub Copilot | GITHUB_TOKEN 또는 gh auth token 사용. GitHub 개발 흐름과 연결됩니다. |
| GitHub Copilot ACP | copilot --acp --stdio 실행. Copilot ACP 프로세스를 붙이는 방식입니다. |
| Hugging Face Inference Providers | 20+ open models. Hugging Face 모델 생태계 연결입니다. |
| Google AI Studio | Gemini native API. Gemini 공식 API 경로입니다. |
| Google Gemini via OAuth + Code Assist | free tier supported, no API key needed. OAuth 자동화 리스크 확인이 필요합니다. |
| DeepSeek | DeepSeek-V3, R1, coder direct API. reasoning/coding 모델 실험 후보입니다. |
| xAI | Grok models direct API. Grok 계열 실험 후보입니다. |
| Z.AI / GLM | Zhipu AI direct API. GLM 계열 모델 비교 후보입니다. |
| Kimi Coding Plan & Moonshot API | api.kimi.com. 긴 문맥과 코딩 실험 후보입니다. |
| Kimi / Moonshot China | Moonshot CN direct API. 중국 endpoint 경로입니다. |
| StepFun Step Plan | agent/coding models via Step Plan API. StepFun 에이전트·코딩 모델 경로입니다. |
| MiniMax | global direct API. MiniMax 글로벌 API 경로입니다. |
| MiniMax via OAuth browser login | Coding Plan, minimax.io. 브라우저 OAuth 기반 경로입니다. |
| MiniMax China | domestic direct API. MiniMax 중국 domestic endpoint입니다. |
| Alibaba Cloud / DashScope Coding | Qwen + multi-provider. Alibaba Cloud와 Qwen 기반 경로입니다. |
| Ollama Cloud | cloud-hosted open models, ollama.com. Ollama 흐름을 클라우드 모델로 넓히는 선택지입니다. |
| Arcee AI | Trinity models direct API. Arcee Trinity 모델 경로입니다. |
| GMI Cloud | multi-model direct API. 멀티모델 직접 API 후보입니다. |
| Kilo Code | Kilo Gateway API. Kilo Gateway 기반 코딩 모델 경로입니다. |
| OpenCode Zen | 35+ curated models, pay-as-you-go. OpenCode 종량제 모델 묶음입니다. |
| OpenCode Go | open models, $10/month subscription. 비용 예측이 쉬운 월 구독형 후보입니다. |
| AWS Bedrock | Claude, Nova, Llama, DeepSeek, IAM or API key. AWS 운영 기준이 있는 팀 후보입니다. |
| Azure Foundry | OpenAI-style or Anthropic-style endpoint. Azure AI deployment 연결 경로입니다. |
| Vercel AI Gateway | Vercel AI Gateway. Vercel 계정 기반 gateway 경로입니다. |
| Alibaba Cloud Coding Plan | dedicated coding tier. Alibaba Cloud 코딩 전용 tier입니다. |
| custom | direct API. 직접 API 설정입니다. |
| Custom endpoint | enter URL manually. OpenAI 호환 endpoint 등을 수동 입력합니다. |
| Configure auxiliary models | 보조 모델 설정입니다. 요약·검수·특정 작업용 모델을 따로 잡을 때 봅니다. |
| Leave unchanged | 현재 설정을 유지합니다. |
실행 방법
provider를 바꾸기로 결정했다면 model 선택 화면을 다시 열면 됩니다. ChatGPT를 다른 작업에 쓰고 있거나, 기본 provider를 바꿔야 하거나, 특정 provider를 테스트할 때 사용합니다.
PowerShell에서 Docker profile을 쓰는 예시는 다음과 같습니다.
docker run -it --rm -v "$($env:USERPROFILE)\.hermes-bot5:/opt/data" nousresearch/hermes-agent model
macOS/Linux는 같은 명령에서 volume 경로만 ~/.hermes-bot5:/opt/data 형태로 바꾸면 됩니다.
화면에서는 ↑↓로 이동하고 ENTER 또는 SPACE로 선택합니다. ESC는 취소입니다. 모르면 이 명령 자체도 AI에게 “내 환경 기준으로 Hermes model provider 선택 화면 여는 명령 알려줘”라고 물어보면 됩니다.
최종 체크리스트
- 기본 엔진이 구독·월 플랜형 또는 비용 예측 가능한 provider인가?
- 월 비용 상한과 fallback 기준을 정했는가?
- OpenRouter, GLM, Kimi 같은 API를 쓰는 목적이 명확한가?
- Google Gemini OAuth, Claude Code OAuth 같은 구독 계정 자동화 리스크를 확인했는가?
- 선택한 이유와 제외한 이유를 짧게 기록했는가?
참고 링크
- Hermes Agent AI Providers: https://hermes-agent.nousresearch.com/docs/integrations/providers
- Hermes Agent Configuration: https://hermes-agent.nousresearch.com/docs/user-guide/configuration
- OpenRouter Quickstart: https://openrouter.ai/docs/quickstart
- LM Studio Developer Docs: https://lmstudio.ai/docs/app/api
- OpenAI Codex 문서: https://developers.openai.com/codex/
작성 메모
2026년 5월 10일 오전 1시 49분 커뮤니티 메모의 핵심은 “기록을 하냐 OR 안 하냐”였습니다. provider 선택도 마찬가지입니다. 무엇을 골랐는지보다 왜 골랐고 왜 제외했는지를 남기면 다음 사람이 바로 참고할 수 있는 콘텐츠가 됩니다.