LLM 33

GLM-5.2 本地部署与量化实战指南

GLM-5.2 是 Z.ai 发布的 GLM-5 系列升级版本,Unsloth 提供 GGUF 转换与动态量化版本,用于本地推理。 很多人想在本地跑大模型,但往往受限于硬件配置,效果打折扣。这篇文章帮你搞清楚 GLM-5.2 的真实能力边界,告诉你它适合什么场景、怎么部署、怎么选量化,尤其适合想在本...

Nvidia RTX Spark 发布:本地运行 120B 大模型的 AI PC 新时代

还在为笔记本跑不动大模型而烦恼吗?想在本地流畅运行120B参数的AI助手却只能望洋兴叹?Nvidia刚刚发布的RTX Spark系列芯片可能就是答案!这颗革命性的Arm架构CPU不仅能在消费级笔记本上本地运行120B参数大语言模型,还带来了完整的Windows生态和游戏兼容性。本文将为你深度解析这款...

AI智能体核心术语详解

AI智能体领域发展迅猛,但术语乱飞、概念混淆,是不是经常让你一头雾水?特别是“运行框架”和“支撑层”这类词,听着就懵。别急,这篇文章就是来帮你排忧解难的。咱们结合行业实践,把那些容易混淆的核心术语捋清楚,搭一个清晰的概念框架,让你以后交流、学习都更顺畅。 ...

Mozilla Thunderbolt:企业级AI安全可控解决方案

在当今 AI 工具遍地的环境中,企业常面临「高效能力」与「数据安全、合规」之间的矛盾。Thunderbolt 由 Mozilla 基金会旗下的 MZLA 技术公司推出,秉持「开源、跨平台、可自托管」的设计理念,为企业提供「数据不出本地、能力不打折扣」的 AI 中枢,让组织在保持安全可控的前提下,充分...