[开源] Open Auto GLM - 基于豆包大模型安卓自动化
基于豆包大模型安卓自动化「Open Auto GLM」据介绍利用火山引擎的 doubao-seed-1.6-flash 视觉大模型作为智能中枢,实现"自然语言指挥AI操作手机"的功能。

功能介绍
- 智能Agent:基于火山引擎豆包大模型,理解屏幕内容并规划操作
- 屏幕感知:通过 MediaProjection API 实时截取屏幕
- 精准执行:通过 AccessibilityService 执行点击、滑动、输入等操作
- 安全存储:API Key 使用 EncryptedSharedPreferences 加密存储
- 实时日志:显示AI思考过程和操作执行日志
使用介绍
1. 配置 API Key
- 前往 火山引擎方舟平台 获取 API Key
- 在应用设置中输入 API Key
- (可选)配置推理接入点ID
2. 授权权限
- 屏幕截图权限:点击"截图"按钮,在弹出的系统对话框中授权
- 无障碍服务:点击"无障碍"按钮,在系统设置中开启服务
3. 执行任务
- 在任务输入框中输入自然语言指令
- 例如:"打开微信,给张三发一条消息说你好"
- 点击"开始执行"
- 观察实时日志,了解AI的思考和操作过程
下载地址
- 网盘下载:
https://pan.quark.cn/s/5b633aba48a3
- 项目地址:
https://github.com/HuSuuuu/HusxGLM
