LLM - 标签 - 自游人（一起游） - 专注AI旅行与赚钱技术的自由行社区 17you.com

GLM-5.2 本地部署与量化实战指南

辉哥发布于 2026-06-18 收录于 AI 智能体实践

GLM-5.2 是 Z.ai 发布的 GLM-5 系列升级版本，Unsloth 提供 GGUF 转换与动态量化版本，用于本地推理。很多人想在本地跑大模型，但往往受限于硬件配置，效果打折扣。这篇文章帮你搞清楚 GLM-5.2 的真实能力边界，告诉你它适合什么场景、怎么部署、怎么选量化，尤其适合想在本...

DiffusionGemma：谷歌新模型用扩散架构把文本生成提速4倍

辉哥发布于 2026-06-13 收录于 AI 智能体实践

📰 本文选自自游人今日AI科技日报引言所有大模型都有一个共同点：它们都是一个字一个字往外蹦的。

Featured image for DiffusionGemma：谷歌新模型用扩散架构把文本生成提速4倍

Gemma 4 12B 无编码器多模态终章：本地跑的AI Agent时代已来

辉哥发布于 2026-06-13 收录于 AI 智能体实践

📰 本文选自自游人今日AI科技日报引言 2026年6月3日，Google DeepMind 发布 Gemma 4 12B。这不是一次普通的参数规模更新——它在技术上做出了一个关键转向：不再给语言模型外挂视觉/音频编码器，而是把所有模态统一到一个 Decoder-only Transformer...

Nvidia RTX Spark 发布：本地运行 120B 大模型的 AI PC 新时代

辉哥发布于 2026-06-02 收录于 AI 智能体实践

还在为笔记本跑不动大模型而烦恼吗？想在本地流畅运行120B参数的AI助手却只能望洋兴叹？Nvidia刚刚发布的RTX Spark系列芯片可能就是答案！这颗革命性的Arm架构CPU不仅能在消费级笔记本上本地运行120B参数大语言模型，还带来了完整的Windows生态和游戏兼容性。本文将为你深度解析这款...

AI智能体核心术语详解

辉哥发布于 2026-05-26 收录于知识库图书馆

AI智能体领域发展迅猛，但术语乱飞、概念混淆，是不是经常让你一头雾水？特别是“运行框架”和“支撑层”这类词，听着就懵。别急，这篇文章就是来帮你排忧解难的。咱们结合行业实践，把那些容易混淆的核心术语捋清楚，搭一个清晰的概念框架，让你以后交流、学习都更顺畅。 ...

使用 Unsloth 免费训练你的 AI 模型

辉哥发布于 2026-05-13 收录于 AI 智能体实践

使用 Unsloth 在免费 GPU 环境下训练自己的模型，省去繁琐的本地配置，点一下“运行全部”就能把数据集塞进去，几分钟后得到可直接部署的微调模型，省时省力又省钱。 ...

小米MiMo 100万亿免费Token 全球开发者领取指南

辉哥发布于 2026-04-28 收录于免费资源与机会

Xiaomi MiMo Orbit 百万亿 Token 创造者激励计划是一项面向全球高质量、AI 驱动用户的限时 Token 定向发放活动。计划在 30 天内免费发放总计 100 万亿 Token 权益，所有申请都会经过严格评估，旨在将资源交到真正利用 AI 进行创造的用户手中。 ...

OpenClaw2026.4.21版本更新及飞书插件错误解决

辉哥发布于 2026-04-22 收录于 AI 智能体实践

OpenClaw 4.20 & 4.21 版本更新日志，核心功能、性能改进以及关键 Bug 修复，关于 Feishu 插件依赖缺失的临时解决方案，Feishu 插件依赖缺失 @larksuiteoapi/node-sdk 未随升级一起安装，导致 Gateway 启动失败的临时解决方案。 ...

Mozilla Thunderbolt：企业级AI安全可控解决方案

辉哥发布于 2026-04-21 收录于实用工具与脚本

在当今 AI 工具遍地的环境中，企业常面临「高效能力」与「数据安全、合规」之间的矛盾。Thunderbolt 由 Mozilla 基金会旗下的 MZLA 技术公司推出，秉持「开源、跨平台、可自托管」的设计理念，为企业提供「数据不出本地、能力不打折扣」的 AI 中枢，让组织在保持安全可控的前提下，充分...

Llamafile单文件封装运行大模型的开源工具

辉哥发布于 2026-04-19 收录于实用工具与脚本

llamafile 是由 Mozilla.ai 主导的开源项目，旨在将大模型封装为单文件可执行程序，实现跨平台本地运行、无需安装，从而显著降低开源 LLM 的使用门槛。 ...

LLM 33

LLM ³³