Nanobrowser开源AI浏览器助手使用指南
目录
Nanobrowser 是一款开源、在浏览器端运行的 AI Web Agent,适合需要自动化网页操作、信息抓取或内容总结的用户。只需输入自然语言指令,AI 即可完成打开网页、搜索、翻页、填写表单、爬取数据等全部操作。下面概述安装、配置、使用及常用快捷键。
安装
方式一:Chrome 应用商店(推荐)
- 打开 Chrome,搜索 “Nanobrowser” 或直接访问 Chrome 应用商店页面。
- 点击 Add to Chrome / 添加到 Chrome → 确认安装。
方式二:手动安装(GitHub)
- 前往 GitHub 发布页,下载最新的 nanobrowser.zip。
- 解压到任意文件夹。
- 在 Chrome 地址栏输入
chrome://extensions/。 - 右上角打开 开发者模式。
- 点击 加载已解压的扩展程序,选择刚解压的文件夹。
配置(绑定大模型 API)
- 安装完成后,点击浏览器右上角的 拼图图标 → 打开 Nanobrowser 侧边栏。
- 侧边栏右上角点击 齿轮 ⚙️(Settings)。
- 进入 LLM Providers → + Add New Provider,填写:
- 服务商:OpenAI / Anthropic / 豆包 / 通义千问 / 其他兼容 OpenAI 接口的模型。
- API Key(部分需填写 Base URL)。
- 点击 Save 保存。
- 向下滚动到 Model Selection:
- Planner(规划):建议使用更强的模型,如
gpt-4o、claude-3。 - Navigator(执行):可复用同一模型,也可选更快/更便宜的模型,如
gpt-4o-mini。
- Planner(规划):建议使用更强的模型,如
密钥仅存储在本地浏览器,不会上传到第三方服务器。
使用方法
- 在 Nanobrowser 侧边栏最下方的输入框中,用自然语言描述要完成的任务,越具体越好。
- 点击 发送 / Execute,系统会自动:
- Planner:将任务拆解为多个步骤。
- Navigator:自动打开网页、输入、点击、翻页等。
- 侧边栏实时显示执行过程,最后返回可复制的结果。
示例指令(直接复制即可尝试)
打开小红书,搜索“一人公司”,把前10条帖子的标题和点赞数列出来去京东搜“无线耳机 200元内”,按销量排序,列出前5款的名称、价格、好评率打开 https://xxx.com,把页面里所有邮箱地址提取出来进入我的 GitHub,把最近 7 天的 contribution 截图并总结
在任意文章、知乎帖子或新闻页输入:
帮我把当前页面内容浓缩成 3 条核心要点,简洁好读
AI 会直接读取页面并返回要点,无需手动复制文字。
功能概览
- 自动搜索、翻页、点击链接、切换站点。
- 跨多个页面汇总信息(如多页面比较、列表爬取)。
- 自动填表、点击按钮、逛电商比价。
- 不只是内容总结,而是全程代替手动操作浏览器。
常用快捷键
Alt + 点击打开侧边栏Alt/Command + B直接呼出侧边栏Alt + 1~8快速切换搜索引擎(Google、百度、豆包、ChatGPT 等)
资源链接
原文链接:
https://www.17you.com/tool/nanobrowser-ai-web-agent-automation/
已复制!
脚本编程和自动化工具
寻找技术支持帮助和技术合伙人一起搞事。
相关内容
- ComfyUI 完全开源节点式生成式工作流
- Kroki与Mermaid文本转图表流程图工具
- InvokeAI专业创作者的AI画布与节点工作流文生图工具
- HyperFrames vs Remotion:AI视频生成框架对比
- Mozilla Thunderbolt:企业级AI安全可控解决方案
- llamafile单文件封装运行大模型的开源工具
收录于 合集・AI技术教程 74