Freellmapi:16 家免费 API 一个端点全聚合,月省 17 亿 Token

你的免费token矿

先说一个反直觉的事实:目前市面上至少有16家AI厂商提供免费API额度,加在一起每月超过17亿token。单拿其中任何一家都是"玩具级",但如果你能把它们叠在一起?

GitHub上2.0K+ stars的开源项目 FreeLLMAPI,干的就这一件事。1

核心原理:一张网捕所有的鱼

FreeLLMAPI本质上是一个本地运行的代理服务器,它做的事情极度简单但又极度聪明:

  1. 你把它部署在本地(Docker一行命令)
  2. 你填入各家的免费API Key
  3. 它暴露一个标准的 /v1/chat/completions 端点
  4. 你在任何OpenAI兼容的客户端里把 base_url 指向它
  5. 它自动选择最优提供商、自动处理速率限制、自动故障转移

架构设计巧妙地解决了一个讨厌的问题:各家免费额度的速率限制各不相同。Google Gemini一天1500次请求,Groq一分钟30次,Cerebras一分钟30次……手动管理这种事,比管理多张信用卡还款日还累。2

FreeLLMAPI的router会追踪每个Key的用量、冷却时间,一旦当前提供商被限速(返回429),立即切换到下一个可用的模型——最多支持20级回退链。

16家提供商一览

截至2026年6月,FreeLLMAPI聚合了以下16家免费API提供商:3

提供商代表性免费模型速率限制
GoogleGemini 2.5 Flash/Pro1,500 RPD / 100万token/天
GroqLlama 3.3/4, GPT-OSS, Qwen330 RPM
CerebrasQwen3 235B30 RPM
NVIDIA NIM多种模型40 RPM
MistralLarge 3, Codestral2 RPM / 50K token/分
OpenRouter21个免费模型各模型不同
GitHub ModelsGPT-4.1, GPT-4o有限制
CohereCommand R+, Command-A试用额度
CloudflareKimi K2, GLM-4.7, GPT-OSS10,000 Neurons/天
HuggingFaceDeepSeek V4, Qwen3有限制
Z.ai (智谱)GLM-4.5, GLM-4.7 Flash有限制
Ollama CloudGLM-4.7, Kimi K2, Qwen3有限制
Kilo Gateway:free routes匿名可用
PollinationsGPT-OSS 20B匿名可用
LLM7GPT-OSS, Llama 3.1匿名可用
OVH AI EndpointsQwen3.5 397B, GPT-OSS匿名可用
OpenCode ZenDeepSeek V4 Flash, Nemotron促销期

总计约76个免费模型,从小而快的Llama 3.2-1B到GPT-4.1级别的能力都有。4

一行接入,所有工具通吃

接入Cursor/Claude Code

auto 模式让Router自动选择当前最优的可用模型。你也可以指定特定模型,比如 gemini-2.5-flashgpt-4.1

接入任意OpenAI SDK

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
from openai import OpenAI

client = OpenAI(
    base_url="http://localhost:3000/v1",
    api_key="your-local-password"
)

# router自动选择最优免费模型
response = client.chat.completions.create(
    model="auto",
    messages=[{"role": "user", "content": "写一段快排"}]
)

Anthropic API兼容

从v0.2起,FreeLLMAPI支持Anthropic Messages API(/v1/messages),这意味着 Claude Code可以直接跑在免费模型池上,无需任何中间层。5 Claude家族模型名(opus/sonnet/haiku)会自动映射到 auto 模式。

智能路由和故障转移是怎么工作的

Router的决策逻辑:

  1. 你的请求带着 model: "auto" 到达
  2. Router检查各Provider当前的速率限制状态
  3. 按你设置的权重和优先级选择最佳Provider
  4. 如果返回429(限速)或5xx(故障),自动跳过,冷却该Key
  5. 试下一个,最多20次回退
  6. 对所有请求追踪per-key用量,确保不超限

这意味着只要有一个Provider可用,你的请求就不会失败。16家Provider同时挂掉的概率——基本为零。6

部署:三分钟上手

1
2
3
4
5
6
7
8
9
# 克隆仓库
git clone https://github.com/tashfeenahmed/freellmapi
cd freellmapi

# Docker启动
docker compose up -d

# 打开浏览器配置Key
# http://localhost:3000 → Keys页面

然后去各Provider官网申请免费API Key(都免费),粘贴进来,刷新模型列表即可。

适用场景和限制

最适合:

  • 个人开发者日常编码(Cursor/Claude Code集成)
  • 轻量Agent开发和测试
  • 学习LLM应用开发,不想烧API费
  • 个人项目和小型实验

不适合:

  • 生产环境(免费额度不稳定、服务条款限制)
  • 超低延迟需求(多级回退可能增加延迟)
  • 大批量处理(总量虽大,但速率限制严格)

FreeLLMAPI官方声明这是"个人实验用途"(Personal experimentation only),别拿来做商业SaaS后端。但对于个人开发者来说,每月17亿token的实验预算,够你把所有side project都跑一遍了。7

你的零成本AI工作流

我的推荐配置:

1
2
3
4
5
6
Cursor/Claude Code → FreeLLMAPI(localhost:3000) → auto模式
  → 日常编码用 Gemini 2.5 Flash(Google免费额度)
  → 复杂推理用 GPT-4.1(GitHub Models免费)
  → 中文场景用 GLM系列(智谱Z.ai免费)
  → 高并发用 Groq(超快推理速度)
  → 兜底:OpenRouter 21个模型任意选

一个月下来,账单是 $0.008

📖 延伸阅读

📰 自游人日报 2026.6.27


  1. tashfeenahmed. “freellmapi - GitHub Repository”. 2026年6月. https://github.com/tashfeenahmed/freellmapi ↩︎

  2. CSDN. “FreeLLMAPI - 免费模型聚合代理”. 2026年6月21日. https://blog.csdn.net/Crown_22/article/details/160653914 ↩︎

  3. codeKK. “freellmapi OpenAI-compatible proxy”. 2026年6月24日. https://p.codekk.com/detail/typescript/tashfeenahmed/freellmapi ↩︎

  4. FreeLLMAPI Official. “Model Catalog”. https://freellmapi.co ↩︎

  5. tashfeenahmed. “freellmapi README - Anthropic Messages API section”. https://raw.githubusercontent.com/tashfeenahmed/freellmapi/main/README.md ↩︎

  6. FreeLLMAPI文档. “How it works - Smart routing and fallback”. https://github.com/tashfeenahmed/freellmapi#how-it-works ↩︎

  7. FreeLLMAPI GitHub. “Disclaimer section”. https://github.com/tashfeenahmed/freellmapi#disclaimer ↩︎

  8. 各提供商官网定价页:Google AI Studio (https://ai.google.dev), Groq (https://groq.com), Cerebras (https://cerebras.ai), GitHub Models (https://github.com/marketplace/models), Z.ai (https://docs.z.ai), Cloudflare Workers AI (https://developers.cloudflare.com/workers-ai/platform/pricing/↩︎

原文链接: https://www.17you.com/freeresources/freellmapi-guide/ 已复制!
寻找合作和资源

如果你也对文章内容或者分享的资源和机会有兴趣,欢迎联系我。

请点击联系我


相关内容