分享
MobileAgent提交案例
输入“/”快速插入内容
📱
MobileAgent提交案例
2024年8月14日创建
1226
1407
0
0
回顾一下赛事要求
赛事提交链接:
https://survey.aliyun.com/apps/zhiliao/I8AXazRGp
需要提交的内容主要有:AtomGit仓库链接、技术文档文件、录制视频文件
核心需要提交的内容
60%
评审标准
40%
AtomGit代码上传指南
链接:
https://atomgit.com/
技术文档正文(需直接上传文件)
智能体(Agent)设计
1.
各个智能代理的功能、行为和交互方式说明
Mobile-Agent-v2框架交互逻辑在本人看来已经比较完整,但在初始页面中未找到执行任务的应用时大概率会直接退出执行,因此本应用在该框架基础上增添了在页面中找不到目标 App 时自动左右滑动屏幕寻找的机制,这将显著提升手机智能体的实用性,拓展了其应用场景。
2.
应用场景说明
例如:
◦
用户想打开微信,但当前页面没有微信图标,智能体可以自动左右滑动屏幕,找到微信图标并打开。
◦
用户想查看天气预报,但当前页面没有天气预报 App,智能体可以自动左右滑动屏幕,找到天气预报 App 并打开。
3.
设计思路
左滑右滑工具实现:
使用预设好的 adb 命令模拟手机屏幕上的滑动操作。每次滑动预设好的距离,避免一次性滑动过远导致错过目标 App。
prompt改进:
增添了if_find_app 变量,表示是否寻找到目标App,该变量为False时:
在初始prompt中增添该工具描述以及在什么情况下使用该工具,在执行完命令后的prompt中显示已经执行过的滑动操作,比如:已经右滑1次、左滑2次。
为True时则不显示。
性能评估与分析
任务
目标App是否在初始屏幕
成功率
平均执行轮次
点外卖
是
80%
x轮
否
50%
x轮
演示视频(需直接上传文件)