本周末免费资源评测:微软 MarkItDown + LocalAI + AI 去水印
📌 本周末三个工具。一个能让你把任何文件喂给 LLM——微软出品,108K Star。一个让你在自己电脑上跑 AI 全家桶,零费用。一个让你去掉那些挡住你用的水印,全在浏览器里完成。
📄 MarkItDown · 微软出品,108K Star,用过的都说好
💰 完全免费 · MIT 协议 · 108,000+ ⭐ · Python · 微软 AutoGen 团队
是什么
一句话:把任何文件转成 Markdown。PDF、Word、PPT、Excel、图片(OCR)、音频(转文字)、HTML、CSV、JSON、XML、ZIP——20+ 种格式,一个命令搞定。
为什么这很重要
如果你在做 RAG(检索增强生成),你应该知道——文档预处理吃掉整个项目 60% 以上的精力。 PDF 表格错位、Word 嵌套结构丢失、扫描件直接变空白。喂给大模型一团乱文本,检索和生成质量直线崩盘。
MarkItDown 解决的就是这个问题——不是"又一个文档转换库",是专门为 LLM 数据管线设计的。转换输出是干净的、结构化的 Markdown,LLM 能直接消化。
上手(3 步)
| |
实测效果
丢了一个 45 页的 PDF(含表格、图片、嵌套标题)。转换结果:
- 标题层级完整保留了 H1-H4
- 表格转为标准 Markdown table(可读,可直接喂给 LLM)
- 图片自动提取到
_images/目录 - OCR 识别率达到 95%+(扫描件也能用)
对比
| 方案 | 格式覆盖 | LLM 优化 | 价格 | 上手 |
|---|---|---|---|---|
| MarkItDown 🆓 | 20+ | ✅ 专为 LLM | 免费 | 一行 pip |
| Pandoc 🆓 | 30+ | ❌ 通用转换 | 免费 | 需安装 Haskell |
| LlamaParse 💳 | 10+ | ✅ LLM 管线 | $0.003/页 | API 调用 |
| Unstructured 🆓 | 15+ | ✅ RAG 管线 | 开源 | Python |
结论:做 RAG 或 LLM 应用的,无条件选 MarkItDown——它是目前唯一"专为 LLM 而生且完全免费"的文档转换工具。
🤖 LocalAI · 在自己电脑上跑 AI 全家桶
💰 完全免费 · MIT 协议 · 开源 · Go 语言 · 单二进制部署
是什么
自托管的 OpenAI API 兼容替代品。支持运行 GGUF、ONNX、llama.cpp 格式的模型,API 接口和 OpenAI 完全一致。也就是说——你的代码不用改一行,把 api.openai.com 换成 localhost:8080,所有调用变成了免费的。
为什么现在看它
VibeThinker-3B 的出现让"本地跑强推理"从幻想变成了现实。但你需要一个服务层——把模型文件变成可调用的 API。LocalAI 就是这一层。
上手(3 步)
| |
支持的模型格式
| 格式 | 适用 | 性能 |
|---|---|---|
| GGUF (llama.cpp) | CPU/GPU 混合推理 | 高 |
| ONNX | 跨平台标准化 | 中 |
| Diffusers | 图像生成 (Stable Diffusion) | — |
| Whisper | 语音转文字 | 高 |
| Piper | 文字转语音 | — |
支持文本生成、嵌入、图像生成、语音转文字、文字转语音——基本上 OpenAI API 的功能,它都能本地替代。
对比
| 方案 | 部署 | 多模态 | 价格 |
|---|---|---|---|
| LocalAI 🆓 | 单二进制,零依赖 | ✅ 图像+语音+文本 | 免费 |
| Ollama 🆓 | 一键安装 | ❌ 仅文本 | 免费 |
| LM Studio 🆓 | GUI 客户端 | ❌ 仅文本 | 免费(API 收费) |
| vLLM 🆓 | 需 Python+Docker | ❌ 仅文本 | 免费 |
结论:如果你需要"不只是聊天,而是完整的 API 替代",选 LocalAI。如果只是想在本地跑个聊天模型玩玩,Ollama 更简单。
🖼️ free-ai-watermark-remover · 浏览器里一键去水印
💰 完全免费 · 开源 · JavaScript · 纯浏览器端运行
是什么
独立开发者 IamRamgarhia 做的免费 AI 水印移除工具。和市面上大部分同类工具最大的区别:全部在浏览器里运行——不上传任何文件到服务器,不注册,不付费。
上手
直接打开 GitHub Pages 部署的页面 → 上传图片/视频 → 框选要去除的水印/物体 → 下载。3 秒出结果。
安全优势
水印移除工具最敏感的问题是隐私。商业工具(如 Unwatermark AI、EraseMark)需要你把图片上传到他们的服务器——AI 处理完再返回。你的照片和视频经过第三方服务器,而且你不知道他们是否留存。
这个项目跑在浏览器里的 WebAssembly 上——图片处理完全在本地完成。适合处理带敏感信息的图片(合同照片、私人照片、未发布的产品截图)。
对比
| 方案 | 价格 | 隐私 | 去视频 |
|---|---|---|---|
| free-ai-watermark-remover 🆓 | 免费 | ✅ 本地处理 | ✅ 支持 |
| Unwatermark AI 🆓 | 有免费层 | ❌ 上传服务器 | ✅ 支持 |
| EraseMark 🆓 | 有免费层 | ❌ 上传服务器 | ❌ 仅图片 |
结论:如果你对隐私有要求,或者只是偶尔去个水印不想注册账号——这几乎是最干净的选择。
参考来源:
- MarkItDown GitHub — 微软官方
- MarkItDown PyPI — 官方包页
- LocalAI GitHub — 官方仓库
- free-ai-watermark-remover GitHub — 官方仓库
- MarkItDown 108K Star 深度分析
最后更新:2026-06-21
如果你也对文章内容或者分享的资源和机会有兴趣,欢迎联系我。
相关内容
- 本周免费资源评测:4 个让独立开发者省钱的工具
- QClaw客户端架构与Queue Guard排队机制探索
- 2026年AI副业实操手册:5条路径月入过万,零代码可启动
- Reasonix:极致省钱的 DeepSeek 编程助手
- Nanobrowser开源AI浏览器助手使用指南
- 剪映平替OpenReel开源免费专业视频编辑器
