[开源] browser use - 利用 AI 自动化浏览器工具
利用 AI 自动化浏览器工具「browser use」支持多标签页管理、视觉识别、内容提取,并能记录和重复执行特定动作。支持开发者自定义动作,如保存文件、推送到数据库等。安装在高于 Python 3.11 的环境下,直接使用 pip 安装就行。
功能介绍
- 网页浏览与操作:AI 代理能像人类用户一样浏览网页和执行操作。
- 多标签页管理:支持同时管理多个浏览器标签页,提高任务处理效率。
- 视觉识别与内容提取:识别网页视觉元素并提取 HTML 内容。
- 操作记录与重复执行:记录 AI 在浏览器中执行的操作,并能重复这些操作。
- 自定义动作支持:支持开发者定义和执行自定义动作,例如保存数据到文件或推送到数据库。
- 主流 LLM 模型支持:兼容多种大型语言模型(LLM),如GPT-4、Claude、Llama等。
下载地址
- 项目地址:
https://github.com/browser-use/browser-use
