[开源] browser use - 利用 AI 自动化浏览器工具

利用 AI 自动化浏览器工具「browser use」支持多标签页管理、视觉识别、内容提取,并能记录和重复执行特定动作。支持开发者自定义动作,如保存文件、推送到数据库等。安装在高于 Python 3.11 的环境下,直接使用 pip 安装就行。

20250227

功能介绍

  • 网页浏览与操作:AI 代理能像人类用户一样浏览网页和执行操作。
  • 多标签页管理:支持同时管理多个浏览器标签页,提高任务处理效率。
  • 视觉识别与内容提取:识别网页视觉元素并提取 HTML 内容。
  • 操作记录与重复执行:记录 AI 在浏览器中执行的操作,并能重复这些操作。
  • 自定义动作支持:支持开发者定义和执行自定义动作,例如保存数据到文件或推送到数据库。
  • 主流 LLM 模型支持:兼容多种大型语言模型(LLM),如GPT-4、Claude、Llama等。

下载地址

  • 项目地址:
    https://github.com/browser-use/browser-use