20k star!让你的手机秒变AI智能体,点外卖、搜小红书

2026-01-19

关注CAIE,国内头部AI人才认证、培训体系,助你在职场升职加薪。
CAIE注册人工智能工程师
CAIE注册人工智能工程师
公众号作者
CAIE,全称 Certifed Artifcial Intelligence Engineer(人工智能工程师),简称 CAIE(赛一) ,是人工智能领域的技能等级认证。旨在评估和培养具备人工智能理论基础与实战能力的职业人士。

最近移动端AI智能体挺火的,就是让手机自动执行各种命令,例如,点外卖、搜小红书资讯、查询旅游路线等等。

但想找一款好用高效的框架不容易。今天就为大家介绍一下智谱AI开源的专用于安卓、鸿蒙、苹果的手机智能体框架PhoneAgent。目前在github已经超过20000颗星。

说真的它不是那种小玩具,而是能让手机,尤其是安卓版本彻底自动化的智能Agent框架。你们可以把它想象成给手机配了个24小时在线的全能AI助理。

例如,让智能体自动帮你点泰勒的歌曲

彻底打通AI指令到手机操作之间的那堵墙。用咱们平时说话的方式就能让安卓手机自动完成各种任务。开发者用它五分钟就能搭好自己的手机智能助手。

先说说第一个功能自然语言指令驱动。不管你是想打开微信给张三发句下班一起吃饭,还是打开小红书搜北京朝阳区的火锅推荐,它都能精准get到你的意思。不用写任何复杂的脚本或者代码就像跟朋友说话一样吩咐就行。

第二个功能智能屏幕理解加自动化操作。它会自己截取手机屏幕然后通过视觉语言模型分析界面上的各种元素,比如按钮输入框还有应用图标。

分析完之后就精准输出点击滑动输入这些操作指令再通过ADB执行。整个过程就跟咱们自己用手机一样甚至比手动点还精准。

最关键的是不用咱们手动标注界面元素也不用写固定的操作流程。不管是什么应用只要能在安卓手机上打开它都能看懂并且操作。适配性直接拉满就像给手机装了个万能解码器。

第三个活的模型部署方式。它支持两种模式一种是直接用已经部署好的远程模型服务不用自己搞GPU也不用下载几十G的大模型特别省事。另一种是本地部署适合那些有高性能GPU的开发者。

这样一来新手就不会被复杂的模型部署劝退了复制个链接就能用。资深开发者选择本地部署数据不会泄露自定义性也更强。不管是新手还是老手都能找到适合自己的用法。

第四个功能完善的ADB工具链。里面内置了一整套ADB工具像连接管理屏幕截图文本输入还有点击滑动这些核心功能全都涵盖了。不用咱们自己再去折腾ADB环境配置和权限调试省了超多麻烦。

很多人看到这种工具就怕复杂,但这个真的不用担心,保证五分钟就能搞定。首先要确保你的安卓手机开启了USB调试,一般在设置的开发者选项里就能找到,如果没看到的话,就连续点版本号7次,通常就能打开了。

然后用数据线把手机连到电脑,手机上会弹出来一个允许USB调试的提示,记得点击允许。

接着在电脑端执行adbdevices命令,能看到你的手机设备就说明连接成功了。如果没看到输出,可以换个数据线或者重新开一下调试。

然后安装依赖也很快。先克隆项目,再安装依赖包,基本上几分钟就搞定了。新手我特别推荐用远程模型。去智谱平台申请个APIKey,然后运行一条命令,就能立刻看到效果了。

确定要退出登录吗?
确定 取消
推广有奖