AI:比我更懂我的旁观者

前段时间,我在网上看到了一个有意思的提示词:
“根据你对我的了解,告诉我几个连我自己可能都没有意识到的问题。”
我把这计划发给了我使用了快三年的ChatGPT,我预想过它会谈论我的时间管理,或者建议我多运动。但我没预料到,这几段回复扎得太准了,生生撕开了我平时用来武装自己的‘理智’表象,毫不留情。

前段时间,我在网上看到了一个有意思的提示词:
“根据你对我的了解,告诉我几个连我自己可能都没有意识到的问题。”
我把这计划发给了我使用了快三年的ChatGPT,我预想过它会谈论我的时间管理,或者建议我多运动。但我没预料到,这几段回复扎得太准了,生生撕开了我平时用来武装自己的‘理智’表象,毫不留情。
上线了!上线了!基于Vibe Coding我终于也能独立开发出一款属于自己的app-安康记,目前终于成功上架App Store啦。
独立开发app这个事情我很早之前就有点念头,但学习Swift过程还挺痛苦的,总觉的各种语法糖很膈应,导致进度缓慢,后面就一直搁置了。ChatGPT出来之后也尝试了一点,但还是觉得当时的AI能力不够,并且纯靠聊天还是不太行,自从Cursor、Windsurf、CC、Codex这一类AI开发工具出来之后,Vibe Coding的概念也随之火热,我想也是时候重启自己的开发计划了,花了接近两个月的晚上和周末时间,终于将其开发完成并上架!
最近试了下 Mineru 解析 PDF,感觉还是挺好的,但为了本地开发方便,就直接在电脑上部署个 API 服务,官网上虽然也有部署教程,但感觉对于 Mac 用户并不算友好,就自己又瞎折腾了好久,现在总算 OK 了,也把我的部署方式分享下,主要还是依靠 ChatGPT 的大力支持 🐶。
本文解读的是 OPPO AI Agent 团队于 2025 年 8 月发布的论文
《Efficient Agents: Building Effective Agents While Reducing Cost》
arXiv: 2508.02694v1
大语言模型驱动的智能体(Agent)近年来在复杂任务上展现了惊人的能力——从多轮推理、跨工具调用,到信息检索与整合。然而,性能的提升往往伴随着成本的飙升:更多的推理步数、更多的工具调用、更复杂的记忆机制,都意味着更多的 token 消耗与 API 调用费用。
LLM 刚开始火热的时候,有个词非常热门,叫做提示词工程,甚至有各种网文声称市面上可能会招聘大量的提示词工程师,当初在一些招聘网站上倒是也的确能搜索到这样的岗位。但随着大模型技术的发展和应用复杂度的激增,单独依赖写一句好的提示词已经不能满足工业级的生产场景。一个新的概念产生了,叫做 Context Engineering(上下文工程) 。
随着大语言模型(LLM)能力的持续扩展,研究者和开发者逐渐意识到,若要真正迈向通用人工智能(AGI),模型不仅需要强大的语言生成能力,更应具备长期一致性、知识演化能力与用户个性化适配能力。因此,越来越多的系统开始尝试将 LLM 作为智能体(Agent)进行封装,并探索其在多轮对话、长期任务、知识积累等真实场景中的表现。