GLM-5.2 本地部署与量化实战指南 辉哥 发布于 2026-06-18 收录于 AI 智能体实践GLM-5.2 是 Z.ai 发布的 GLM-5 系列升级版本,Unsloth 提供 GGUF 转换与动态量化版本,用于本地推理。 很多人想在本地跑大模型,但往往受限于硬件配置,效果打折扣。这篇文章帮你搞清楚 GLM-5.2 的真实能力边界,告诉你它适合什么场景、怎么部署、怎么选量化,尤其适合想在本...
DiffusionGemma:谷歌新模型用扩散架构把文本生成提速4倍 辉哥 发布于 2026-06-13 收录于 AI 智能体实践📰 本文选自 自游人今日AI科技日报 引言 所有大模型都有一个共同点:它们都是一个字一个字往外蹦的。
Gemma 4 12B 无编码器多模态终章:本地跑的AI Agent时代已来 辉哥 发布于 2026-06-13 收录于 AI 智能体实践📰 本文选自 自游人今日AI科技日报 引言 2026年6月3日,Google DeepMind 发布 Gemma 4 12B。这不是一次普通的参数规模更新——它在技术上做出了一个关键转向:不再给语言模型外挂视觉/音频编码器,而是把所有模态统一到一个 Decoder-only Transformer...
Nvidia RTX Spark 发布:本地运行 120B 大模型的 AI PC 新时代 辉哥 发布于 2026-06-02 收录于 AI 智能体实践还在为笔记本跑不动大模型而烦恼吗?想在本地流畅运行120B参数的AI助手却只能望洋兴叹?Nvidia刚刚发布的RTX Spark系列芯片可能就是答案!这颗革命性的Arm架构CPU不仅能在消费级笔记本上本地运行120B参数大语言模型,还带来了完整的Windows生态和游戏兼容性。本文将为你深度解析这款...
AI智能体核心术语详解 辉哥 发布于 2026-05-26 收录于 知识库图书馆AI智能体领域发展迅猛,但术语乱飞、概念混淆,是不是经常让你一头雾水?特别是“运行框架”和“支撑层”这类词,听着就懵。别急,这篇文章就是来帮你排忧解难的。咱们结合行业实践,把那些容易混淆的核心术语捋清楚,搭一个清晰的概念框架,让你以后交流、学习都更顺畅。 ...
使用 Unsloth 免费训练你的 AI 模型 辉哥 发布于 2026-05-13 收录于 AI 智能体实践使用 Unsloth 在免费 GPU 环境下训练自己的模型,省去繁琐的本地配置,点一下“运行全部”就能把数据集塞进去,几分钟后得到可直接部署的微调模型,省时省力又省钱。 ...
小米MiMo 100万亿免费Token 全球开发者领取指南 辉哥 发布于 2026-04-28 收录于 免费资源与机会Xiaomi MiMo Orbit 百万亿 Token 创造者激励计划是一项面向全球高质量、AI 驱动用户的限时 Token 定向发放活动。计划在 30 天内免费发放总计 100 万亿 Token 权益,所有申请都会经过严格评估,旨在将资源交到真正利用 AI 进行创造的用户手中。 ...
OpenClaw2026.4.21版本更新及飞书插件错误解决 辉哥 发布于 2026-04-22 收录于 AI 智能体实践OpenClaw 4.20 & 4.21 版本更新日志,核心功能、性能改进以及关键 Bug 修复, 关于 Feishu 插件依赖缺失的临时解决方案,Feishu 插件依赖缺失 @larksuiteoapi/node-sdk 未随升级一起安装,导致 Gateway 启动失败的临时解决方案。 ...
Mozilla Thunderbolt:企业级AI安全可控解决方案 辉哥 发布于 2026-04-21 收录于 实用工具与脚本在当今 AI 工具遍地的环境中,企业常面临「高效能力」与「数据安全、合规」之间的矛盾。Thunderbolt 由 Mozilla 基金会旗下的 MZLA 技术公司推出,秉持「开源、跨平台、可自托管」的设计理念,为企业提供「数据不出本地、能力不打折扣」的 AI 中枢,让组织在保持安全可控的前提下,充分...
Llamafile单文件封装运行大模型的开源工具 辉哥 发布于 2026-04-19 收录于 实用工具与脚本llamafile 是由 Mozilla.ai 主导的开源项目,旨在将大模型封装为 单文件可执行程序,实现跨平台本地运行、无需安装,从而显著降低开源 LLM 的使用门槛。 ...