我让平板电脑学会了“克隆”我:一个懒人的AI代理折腾实录

小编头像

小编

管理员

发布于:2026年04月18日

5 阅读 · 0 评论

唉,说起来都是泪。上个月我妈突然杀到我家,一进门看见我抱着平板躺在沙发上,茶几上外卖盒堆成山,张嘴就是那句灵魂拷问:“你都快三十的人了,天天抱着个平板,它能给你做饭还是能给你挣钱?”

我当时嘴里嚼着薯片,含糊不清地顶了句嘴:“妈,您别小看这玩意儿,它现在没准真能。”

这话说完我自己都不信。那时候我对平板的理解还停留在“爱奇艺启动器”和“盖泡面神器”的阶段。直到这半个月,我像着了魔一样,天天熬夜刷GitHub、逛酷安,硬是把我的旧安卓平板折腾成了一个能“克隆”我部分劳动力的平板ai代理

这事儿,得从我被工作群逼疯的那个凌晨说起。

受够了当“人肉传声筒”

我做的是社群运营,听起来高大上,说白了就是个“人肉传声筒”。每天睁眼就是在几个手机和平板之间来回倒腾:在这个平板上看到条有意思的行业资讯,得复制下来,贴到三个工作群里;那边用户反馈个Bug,我得截屏、标注、再转发给技术老大。

最崩溃的是有一次,我晚上十一点半刚躺下,老板在群里@我:“那个谁,把咱们上个月的活动复盘文档,单独私发给那二十个核心客户,再编辑条一样的提醒话术。”我特么当时真想顺着网线爬过去掐死他。

那一刻我就想,要是有个“第二自我”能帮我干这些脏活累活就好了。

第二天我开始疯狂,这才知道,原来能让AI像人一样操作手机App的东西,圈子里管它叫“AI代理”或者“智能体框架”,而不是那种你问它答的“人工智障”-2。我要找的,是一个能看见我的屏幕、能理解我的意图、甚至能动手帮我点击和输入的玩意儿-6

踩坑比吃过的盐还多

我开始在平板上瞎折腾。先试了那些国外的闭源方案,配置起来那个复杂啊,又要Python环境,又要ADB调试,我这个文科生看得头皮发麻。那时候真有点打退堂鼓,心想这他娘的是给人用的吗?

后来找到了一个开源的方案叫AppAgent,据说是腾讯那边的人搞出来的-8。我按照教程一步步走,把平板连上电脑,打开USB调试。那一刻手心都在冒汗,生怕把平板搞成砖头。

第一次让它学习的时候,我选了“自主探索模式”-2。我说:“你去研究研究微博怎么发私信。”然后我就盯着屏幕,那玩意儿真的跟个刚出生的傻子一样,这边点点,那边划划,有时候点错了还退回来重新点。那种感觉怎么形容呢?就像看一只好奇的猫在玩你的手机,又好笑又期待。

折腾了几个小时,终于让它学会了。我试着说了一句:“给XX同事发个私信,就说今晚加班别吃饭了。”几秒钟后,看着它自己打开微博、人名、点进主页、点击私信、输入文字、点击发送……我直接从椅子上跳了起来,差点把泡面打翻!

那一刻我对着平板大喊:“以后你就叫小贱(贱人的贱),专门帮我干这些重复的贱活!”

真正让我“爽”到的瞬间

不过说实话,新鲜劲儿过了也就那样。真正让我觉得这玩意儿“值了”的,是有一次我感冒发烧,躺床上起不来。

那时候我已经不满足于让它只干一件事,我开始研究怎么让它跨App执行任务。当时我用的是Claude Code后来推出的那种远程控制逻辑,虽然不是完全一样,但原理差不多——让平板作为一个移动控制窗口,去指挥家里那台24小时开着的旧电脑干活-1-4

那天我烧得迷迷糊糊,突然想起明天有个重要的方案要交。我躺在被窝里,浑身疼得不想动,就拿起平板,对着麦克风说:“小贱,登录我那台电脑的远程桌面,打开D盘‘工作方案’文件夹,找到‘618策划草案’,在里面新建一个文档,标题叫‘生病期间的备选方案’,然后写上:‘由于本人病重,建议启动Plan B,由小王全权负责’。”

说完我就昏睡过去了。

第二天早上醒来,打开电脑一看,那文件真真切切地躺在那里。那一刻,我承认我被自己感动了。这不是什么高科技的炫技,这是一个病号在绝境中抓住的一根稻草。我第一次真切地感受到,什么叫做技术“延伸”了我的手脚。

隐私那点事儿,咱得唠明白

可能有人要说了,你把这么大的权限交给AI,你手机里的隐私不要了?你银行卡密码不怕被盗?

嗨,这事儿我一开始也怕。毕竟是要让它能模拟点击和输入的玩意儿,这权限给出去,就跟把家门钥匙交给陌生人一样-6

但后来我研究明白了,这东西分两种。

一种像我最早折腾的AppAgent,它确实是需要你把API密钥填进去,如果你用GPT-4V这种云端模型,那你的截屏数据理论上是要上传到人家服务器去分析的-2。这就好比你找了个助理,但这助理是个“外地人”,他每次帮你做事都得打电话回老家请示,那你家里的情况不就全被他老家那边的人知道了吗?

另一种就比较“鸡贼”了,或者说比较“苹果范儿”。最近看到消息说苹果也在搞端侧AI代理,所有数据处理都在设备内部完成,不上云端-10。这就好比你找了个哑巴助理,他脑子够用,但嘴是封死的,看见了啥也只能烂在肚子里。

我现在采用的是混合模式。涉及到工作这种不太敏感的东西,我让平板ai代理走云端,因为快、理解能力强;但要是让它帮我找相册里某张身份证照片,或者整理备忘录,我会强制它调用本地的、参数小一点的模型-3-7。虽然反应会慢半拍,但心里踏实。

未来已来,只是还没均匀分布

其实这半个月折腾下来,我最大的感受不是“技术牛逼”,而是“我们这代人真特么累”。

你看啊,我们的父辈,他们干活靠手,累的是筋骨;我们这代人干活靠脑,累的是神经。而现在,我们甚至要把自己那点可怜的“脑力活动”再剥离出来,训练给机器去干。这到底是我们驾驭了工具,还是工具逼着我们不断进化?

昨天我躺在沙发上,看着平板自己在那兢兢业业地给客户发问候消息,我妈又过来了。这次她没骂我,只是叹了口气说:“这东西要是真能替你上班,你就该娶它当媳妇。”

我没回头,盯着屏幕上跳动的命令行,嘀咕了一句:“妈,它可能比媳妇听话。”


以下是几个网友的精彩发言,我觉得比我的故事更有意思,特意贴出来给大家看看:

网友“码农不码字”问:
“你吹得天花乱坠,这玩意儿现在到底有多智障?别光说爽点,说说那些让你气得砸键盘的瞬间。”

我的回答:
哈,说到痛处了!这玩意儿有时候蠢得你想顺着网线爬过去抽它。
就在昨天,我让它“把微信里昨天收藏的那条关于AI的公众号文章链接,发给我的小号”。结果这货干了件啥事儿呢?它先打开微信,然后不知道怎么想的,居然点开了我的表情包管理界面,对着我那一堆“熊猫头”表情包愣了半天,最后把我最常用的那个“无语”表情给收藏了三遍!我当时就坐在旁边,那个气啊,恨不得给它一拳。
还有更绝的。有次我让它帮我订外卖(虽然我知道它还没法真正支付,就是想试试流程),它倒是挺认真,打开饿了么,搜了“牛肉面”,然后对着屏幕左上角那个“”图标硬生生点了五分钟。点完了还弹出个提示框,写着:“任务已完成:已反复确认按钮功能正常。”我特么……你这哪是AI代理,你这是QC质检员转世吧?
所以说啊,现在的AI代理就像个刚进城的远房表弟,看着挺机灵,让他去村口买包烟,他能给你买回来一袋盐,还觉得自己特别能干。你要是没点心理准备,千万别让它独立操作重要账户,否则它能让你体验到什么叫“智能的绝望”。-2-6

网友“科技圈包工头”问:
“安全性呢?你就不怕它哪天抽风,把你那些珍藏的‘学习资料’自动群发给老板和爸妈?”

我的回答:
哎哟我滴妈,您这话问得我后背一凉。不瞒您说,这事儿我还真经历过一次“惊魂时刻”。
有一次我给它布置任务,让它整理相册里所有带文字的截图。结果这哥们理解错了,差点把我那个名为‘重要备份’(实际上里面全是不可描述的小视频)的文件夹给备份到云盘。我发现的时候,它正在那分析视频封面的每一帧画面,我当时的表情就跟见了鬼一样,手忙脚乱地把网线才保住晚节。
所以我现在学乖了,搞了个“物理隔离”。我在平板上专门开了一个“访客模式”或者叫“工作模式”,里面只登录工作微信、企业微信、钉钉这些要命的App。那些什么银行App、私人相册、聊天记录,全放在另一个加密空间里。
而且我现在部署的时候,会特意开启那种需要人工确认敏感操作的沙盒模式-4。比如涉及到删除文件、群发消息、读取通讯录这种高危动作,它会先弹个窗:“主人,您确定要删吗?删了我可就真删了哦。”这时候我如果不清醒,点了确定,那只能怪我自己比它还智障。
说白了吧,现在的AI代理就像个大力士,你得给它戴上笼头。你不给它设定边界,它真能帮你把家拆了。至于隐私?只要坚持“本地优先、最小授权”的原则,暂时还出不了大事。-10

网友“韭菜盒子最好吃”问:
“你折腾这玩意儿花了多少钱?我一个穷学生,一个月生活费才1500,玩得起吗?”

我的回答:
兄弟,你这问到点子上了!我这种抠门鬼,怎么可能花大价钱养个电子奴才?
听我给你算笔账,丰俭由人
方案A:极致抠门版(适合你这种学生党,也适合我这种月光族)
一分钱不花。就用我前面提到的开源框架AppAgent,但是别用GPT-4V,用国产的通义千问-VL免费版-2-8。这玩意儿虽然反应慢点,有时候还犯傻,但架不住它真不要钱啊!你只要有一台能运行Python的电脑(学校的机房电脑都行)和一部旧安卓手机/平板,成本为0。缺点就是费头发,因为你得不断调试,还得忍受它的各种智障操作。
方案B:小资体验版(每月几十块)
你可以订阅那些集成了多种AI模型的App,比如LM Station这类-3-7。它们通常会送一些免费额度,用完了再按量付费。或者去搞那些云服务商的API接口,按token收费。像我这种轻度使用,一个月下来也就二三十块钱,还不够两杯奶茶钱。用这点钱换来每天晚上不用加班发消息,我觉得血赚。
方案C:极客发烧版(费用未知,但成就感爆棚)
像我后期玩的Claude Code那种远程控制逻辑-1-4,你得有一台24小时开机的电脑或服务器当“大脑”。电费、网费、硬件损耗,这个就不好算了。但那种躺在床上操控一切的快感,确实是用钱买不到的。
这事儿丰俭由人。别被那些卖课的忽悠,说什么几千块买教程。这年头,最值钱的就是动手能力,最不值钱的就是焦虑。花几十块钱买个API密钥,剩下的全凭一双手和一双眼(看报错信息),够你玩一个学期了!

标签:

相关阅读