免费LLM API资源整理
目录
整理可通过API访问的免费大语言模型(LLM)推理资源
一、资源分类
整体分为纯免费提供方和提供试用额度的提供方两类,前者可直接免费调用API,后者赠送一定额度的免费使用资源,超出后需付费。
二、纯免费LLM API提供方(含核心限制+支持模型)
- OpenRouter:限20次/分钟、50次/天(终身充值10美元可提至1000次/天),支持Gemma 3系列、Llama 3系列、文心一言GLM-4.5-air等多类模型。
- Google AI Studio:非英/瑞/欧经济区使用数据会用于训练,不同模型限频不同,Gemma 3系列限频更宽松(30次/分钟、14400次/天),Gemini系列限20次/天。
- NVIDIA NIM:需手机号验证,上下文窗口有限制,40次/分钟,支持各类开源模型。
- Mistral:分La Plateforme(实验计划需同意数据训练、手机号验证,1次/秒、50万tokens/分钟)和Codestral(免费使用、手机号验证,30次/分钟、2000次/天),各支持对应品牌模型。
- HuggingFace Inference Providers:无服务器推理限模型小于10GB,每月赠0.1美元额度,支持多类开源模型。
- Vercel AI Gateway:可路由至多个合作提供方,每月赠5美元额度。
- Cerebras:不同模型限频/限tokens不同,主流模型均为30次/分钟、14400次/天,支持gpt-oss-120b、Llama 3.3 70B、文心一言GLM-4.6等。
- Groq:模型限频差异大,Llama 3.1 8B达14400次/天,还支持语音模型Whisper系列,同时含多语言、安全防护类模型。
- Cohere:20次/分钟、1000次/月,模型共享额度,支持c4ai-aya系列、command系列推理/翻译/视觉模型。
- GitHub Models:输入输出token限制严格,额度依赖Copilot订阅等级,支持Llama系列、GPT-4/5系列、Phi-4系列等超多元模型。
- Cloudflare Workers AI:10000神经元/天,支持Gemma、Llama、文心一言、通义千问等超百类开源模型。
- Google Cloud Vertex AI:支付验证严格,预览期免费,Llama 3.1 8B/70B限60次/分钟,90B视觉版限30次/分钟。
三、提供试用额度的LLM API提供方(含额度+支持模型)
- 低额度类(≤1美元):Fireworks、Nebius、Hyperbolic各赠1美元,Novita赠0.5美元且有效期1年,支持各类开源模型,Hyperbolic主打DeepSeek、Llama、通义千问系列。
- 中额度类(5-15美元):Cerebras赠5美元(3个月)、NLP Cloud赠15美元(需手机号)、Modal首登赠5美元/月(绑支付方式提至30美元/月),支持多类开源模型,NLP Cloud需手机号验证。
- 高额度类(≥10美元):AI21、Upstage各赠10美元(3个月),Baseten赠30美元,Alibaba Cloud(国际版)单模型赠100万tokens,Scaleway赠100万免费tokens,分别支持对应品牌核心模型(如AI21的Jamba、阿里云的通义千问、Baseten按计算时间计费支持全量模型)。
四、仓库网址
原文链接:
https://www.17you.com/ai/%E5%85%8D%E8%B4%B9%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8Bllm%E6%8E%A8%E7%90%86%E8%B5%84%E6%BA%90/
已复制!
一起薅AI羊毛
保持关注,记得把网址 (17you.com) 加收藏夹!有空经常来网站看看!我们每天都分享最新鲜、最实用的AI知识、最新动态、最新技术,以及最新的应用场景。