Nanobrowser开源AI浏览器助手使用指南

Nanobrowser 是一款开源、在浏览器端运行的 AI Web Agent,适合需要自动化网页操作、信息抓取或内容总结的用户。只需输入自然语言指令,AI 即可完成打开网页、搜索、翻页、填写表单、爬取数据等全部操作。下面概述安装、配置、使用及常用快捷键。

安装

方式一:Chrome 应用商店(推荐)

  • 打开 Chrome,搜索 “Nanobrowser” 或直接访问 Chrome 应用商店页面。
  • 点击 Add to Chrome / 添加到 Chrome → 确认安装。

方式二:手动安装(GitHub)

  1. 前往 GitHub 发布页,下载最新的 nanobrowser.zip
  2. 解压到任意文件夹。
  3. 在 Chrome 地址栏输入 chrome://extensions/
  4. 右上角打开 开发者模式
  5. 点击 加载已解压的扩展程序,选择刚解压的文件夹。

配置(绑定大模型 API)

  1. 安装完成后,点击浏览器右上角的 拼图图标 → 打开 Nanobrowser 侧边栏。
  2. 侧边栏右上角点击 齿轮 ⚙️(Settings)
  3. 进入 LLM Providers+ Add New Provider,填写:
    • 服务商:OpenAI / Anthropic / 豆包 / 通义千问 / 其他兼容 OpenAI 接口的模型。
    • API Key(部分需填写 Base URL)。
    • 点击 Save 保存。
  4. 向下滚动到 Model Selection
    • Planner(规划):建议使用更强的模型,如 gpt-4oclaude-3
    • Navigator(执行):可复用同一模型,也可选更快/更便宜的模型,如 gpt-4o-mini

密钥仅存储在本地浏览器,不会上传到第三方服务器。

使用方法

  1. 在 Nanobrowser 侧边栏最下方的输入框中,用自然语言描述要完成的任务,越具体越好。
  2. 点击 发送 / Execute,系统会自动:
    • Planner:将任务拆解为多个步骤。
    • Navigator:自动打开网页、输入、点击、翻页等。
    • 侧边栏实时显示执行过程,最后返回可复制的结果。

示例指令(直接复制即可尝试)

  • 打开小红书,搜索“一人公司”,把前10条帖子的标题和点赞数列出来
  • 去京东搜“无线耳机 200元内”,按销量排序,列出前5款的名称、价格、好评率
  • 打开 https://xxx.com,把页面里所有邮箱地址提取出来
  • 进入我的 GitHub,把最近 7 天的 contribution 截图并总结

在任意文章、知乎帖子或新闻页输入:
帮我把当前页面内容浓缩成 3 条核心要点,简洁好读
AI 会直接读取页面并返回要点,无需手动复制文字。

功能概览

  • 自动搜索、翻页、点击链接、切换站点。
  • 跨多个页面汇总信息(如多页面比较、列表爬取)。
  • 自动填表、点击按钮、逛电商比价。
  • 不只是内容总结,而是全程代替手动操作浏览器。

常用快捷键

  • Alt + 点击 打开侧边栏
  • Alt/Command + B 直接呼出侧边栏
  • Alt + 1~8 快速切换搜索引擎(Google、百度、豆包、ChatGPT 等)

资源链接

原文链接: https://www.17you.com/tool/nanobrowser-ai-web-agent-automation/ 已复制!
脚本编程和自动化工具

寻找技术支持帮助和技术合伙人一起搞事。

请点击联系我


相关内容