免费LLM API资源整理

整理可通过API访问的免费大语言模型(LLM)推理资源

一、资源分类

整体分为纯免费提供方提供试用额度的提供方两类,前者可直接免费调用API,后者赠送一定额度的免费使用资源,超出后需付费。

二、纯免费LLM API提供方(含核心限制+支持模型)

  1. OpenRouter:限20次/分钟、50次/天(终身充值10美元可提至1000次/天),支持Gemma 3系列、Llama 3系列、文心一言GLM-4.5-air等多类模型。
  2. Google AI Studio:非英/瑞/欧经济区使用数据会用于训练,不同模型限频不同,Gemma 3系列限频更宽松(30次/分钟、14400次/天),Gemini系列限20次/天。
  3. NVIDIA NIM:需手机号验证,上下文窗口有限制,40次/分钟,支持各类开源模型。
  4. Mistral:分La Plateforme(实验计划需同意数据训练、手机号验证,1次/秒、50万tokens/分钟)和Codestral(免费使用、手机号验证,30次/分钟、2000次/天),各支持对应品牌模型。
  5. HuggingFace Inference Providers:无服务器推理限模型小于10GB,每月赠0.1美元额度,支持多类开源模型。
  6. Vercel AI Gateway:可路由至多个合作提供方,每月赠5美元额度。
  7. Cerebras:不同模型限频/限tokens不同,主流模型均为30次/分钟、14400次/天,支持gpt-oss-120b、Llama 3.3 70B、文心一言GLM-4.6等。
  8. Groq:模型限频差异大,Llama 3.1 8B达14400次/天,还支持语音模型Whisper系列,同时含多语言、安全防护类模型。
  9. Cohere:20次/分钟、1000次/月,模型共享额度,支持c4ai-aya系列、command系列推理/翻译/视觉模型。
  10. GitHub Models:输入输出token限制严格,额度依赖Copilot订阅等级,支持Llama系列、GPT-4/5系列、Phi-4系列等超多元模型。
  11. Cloudflare Workers AI:10000神经元/天,支持Gemma、Llama、文心一言、通义千问等超百类开源模型。
  12. Google Cloud Vertex AI:支付验证严格,预览期免费,Llama 3.1 8B/70B限60次/分钟,90B视觉版限30次/分钟。

三、提供试用额度的LLM API提供方(含额度+支持模型)

  1. 低额度类(≤1美元):Fireworks、Nebius、Hyperbolic各赠1美元,Novita赠0.5美元且有效期1年,支持各类开源模型,Hyperbolic主打DeepSeek、Llama、通义千问系列。
  2. 中额度类(5-15美元):Cerebras赠5美元(3个月)、NLP Cloud赠15美元(需手机号)、Modal首登赠5美元/月(绑支付方式提至30美元/月),支持多类开源模型,NLP Cloud需手机号验证。
  3. 高额度类(≥10美元):AI21、Upstage各赠10美元(3个月),Baseten赠30美元,Alibaba Cloud(国际版)单模型赠100万tokens,Scaleway赠100万免费tokens,分别支持对应品牌核心模型(如AI21的Jamba、阿里云的通义千问、Baseten按计算时间计费支持全量模型)。

四、仓库网址

https://github.com/cheahjs/free-llm-api-resources

原文链接: https://www.17you.com/ai/%E5%85%8D%E8%B4%B9%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8Bllm%E6%8E%A8%E7%90%86%E8%B5%84%E6%BA%90/ 已复制!
一起薅AI羊毛

保持关注,记得把网址 (17you.com) 加收藏夹!有空经常来网站看看!我们每天都分享最新鲜、最实用的AI知识、最新动态、最新技术,以及最新的应用场景。

请点击联系我


相关内容