OmniVoice-Studio:本地开源AI影视配音与声音克隆工具 辉哥 发布于 2026-04-17 收录于 实用工具与脚本OmniVoice‑Studio 是一款 本地部署、全栈开源 的 AI 影视级音频配音、声音克隆与语音生成工具。它基于开源 OmniVoice 600 语言零样本扩散模型,无需 API 密钥和云端服务,直接在本地运行,兼顾隐私与高效。 ...
VoxCPM.cpp开源TTS语音合成与声音克隆推理引擎 辉哥 发布于 2026-04-15 收录于 实用工具与脚本VoxCPM.cpp 是 VoxCPM(OpenBMB 团队开发的无分词器 TTS 模型)的 C++ 原生推理实现,基于 ggml 库构建,专注于高效、轻量、跨平台的语音合成与声音克隆。它提供了比 Python 版更低的延迟、更小的内存占用以及更好的硬件利用率,并支持 GGUF 量化模型、CPU、C...
让AI输出有价值的内容我的项目开发笔记 辉哥 发布于 2026-04-12 收录于 编程技巧项目实战 和 我的项目为什么大多数 AI 速递没用? 因为它们回答的是“发生了什么”,而你需要的是“那又怎样”。 信息过载的本质不是信息太多,而是 缺乏判断。 ...
FunASR开源语音识别工具包使用指南 辉哥 发布于 2026-04-10 收录于 实用工具与脚本FunASR 是一个基础语音识别工具包,提供多种功能,包括语音识别(ASR)、语音端点检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离和多人对话语音识别等。FunASR 提供了便捷的脚本和教程,支持预训练好的模型的推理与微调。 ...
免费提供小初高(含五四学制)及大学PDF教材仓库 辉哥 发布于 2026-04-10 收录于 免费资源与机会TapXWorld/ChinaTextbook是GitHub热门开源仓库 免费提供小初高(含五四学制)及大学PDF教材 含数学等学科及配套习题,旨在抵制资源倒卖、普及义务教育、方便海外华人子女学习。 因文件大小限制,超50MB资源拆分存储,提供专用合并程序,国内与海外用户有针对性下载建议,支持捐赠与...
stable-diffusion.cpp 高性能本地生图与视频生成全攻略 辉哥 发布于 2026-04-08 收录于 免费资源与机会Stable Diffusion.cpp 高性能本地生图与视频生成 本文基于 2026 年 4 月最新资料整理,涵盖 SD、Z-Image、FLUX 及 Wan 视频模型的全栈部署与实战。 stable-diffusion.cpp(简称 sd.cpp)是基于 ggml的纯 C/C++ 推理引擎。它彻...
z-image-turbo MCP服务配置指南:OpenClaw与OpenCode集成 辉哥 发布于 2026-04-08 收录于 免费资源与机会根据最新的 MCP(Model Context Protocol)生态标准,z-image-turbo项目的 MCP 服务本质上是一个标准的 JSON-RPC 2.0 服务器。它通过暴露 generate_image等工具,让支持 MCP 的客户端(如 OpenClaw、OpenCode)能直接调用...
MiniMind-3拥有训练自己的LLM模型 辉哥 发布于 2026-04-04 收录于 AI 智能体实践想没想过真正拥有一个自己训练的小模型? MiniMind-3 是 MiniMind 项目在 2026 年 4 月发布的主线版本,定位为**“个人开发者也能低成本复现的极简语言模型”。它最大的特点是极低门槛**(单卡 3090、约 2 小时、成本约 3 元)和全流程透明(不依赖 transformer...
Claude Code 源码泄露 Claw Code 深度源码专题报道 辉哥 发布于 2026-04-03 收录于 实用工具与脚本Claude Code 源码泄露 Claw Code 深度专题报道 📌 项目概览 Claw Code 是一个开源 AI 编程 Agent 框架,被称为"GitHub 史上最快达成 50k star 的项目"。目前已经禁止 fork ...
Coding Agent辅助代码开发Rubrics标注技术与PE调优实战指南 辉哥 发布于 2026-04-03 收录于 知识库图书馆本文聚焦 AI 辅助代码开发与质量管控三大核心技术——代码类 Rubrics 标注、Coding Agent 辅助开发、Prompt Engineering (PE) 调优。 文档将从核心原理、标准化流程、实操技巧及协同场景四个维度展开,旨在解决代码评估标准模糊、AI 生成代码质量不稳定、人机协作效...