船长的角落 Captain Nook
返回内容目录
公众号文章

你还在问 AI 问题,别人已经让它交付项目了

很多人用 AI,只是打开网页问问题。真正的差距,是有没有让 AI 进入文件、流程和项目,替你把事往前推。

2026-05-17约 8 分钟
<section style="margin: 18px 0 24px 0; padding: 14px 16px; background: #fff8ef; border-left: 4px solid #f29b52; color: #5f5146; font-size: 15px; line-height: 1.8;"> 你一直觉得AI不好用,每次打开豆包,问个问题,得到答案后关掉。下次遇到类似问题,又得重新问。问题可能不在 AI,而在于你一直只让它停在聊天框里。 </section>

网页端问AI问题,得到一个答案。能起到作用,但你会觉得对你的实际工作似乎也帮不上什么大忙。比如要写一个什么东西,材料还是要自己找,就算AI帮你写出一份东西,大概率你也不敢用,还得一个字一个字地改。 我也是深度使用AI好几年了,最近在给一些单位做分享的时候,越来越觉得,你自己觉得很简单的东西,居然有很多人完全不知道。就像你提到工作流,提到harness,不是AI圈子的人,几乎完全没有听过,更别提去用到了。 所以有很多人觉得AI不好用,像是从来没有用过智能手机的人,刚刚拿到新手机,除了打电话,不知道能干嘛。 我感觉现在使用AI的人,大体上有四种类型,欢迎对号入座,你看看你属于哪一类。

第一类,只会网页问问题

第一类人,把 AI 当成一个更聪明的搜索引擎来用。
今天问豆包,周报怎么写?豆包快速输出一套模板,然后自己往里面填入自己本周的实际工作。明天问千问,周三的 PPT 怎么做?可能还会加上一些背景信息,然后千问给一堆建议。后天复制一段文字问 Deepseek,这段话始终有点念不通,怎么改?,Deepseek 快速给出一版润色后的文字。 每一次,AI都是给了你答案,不过答案在网页里,你仍然要自己写周报内容,做PPT,复制粘贴文案。这些答案虽然在模型网页的聊天记录里,要用的时候你不一定想得到,想到了,还得自己翻,自己找,这些一百个、一千个答案,并没有变成你可以复用的东西。 这类人使用AI最大的问题,就是没有让工具介入你的工作系统,你们的交互就是问答,一问,一答,最多你会追问几轮,这件事就结束了。 所以这一类的用法,像是做搜索,每一次使用,都是临时的。 身边有很多人都属于这一类,他们不知道AI还能做什么,也不知道有更好的用法。

问答到搬运的差距

第二类:介入实际工作

第二类人往前走了一步。
他们除了更加会向AI提问,比如,他们知道了上下文的概念,知道要让AI做好事,需要把前因后果、对结果的预期、具体的要求等等都说清楚。还知道有些AI工具是多模态的,可以看图,看文件,这类人知道把必要的材料发给 AI,让 AI 来产出一些成果,比如一张设计图,一个Excel表格,一个静态网页,等等。
参加完公司会议,把手机里的会议录音扔给AI,它很快能给出会议背景、讨论要点、待办事项、负责人。还能按照你要求的文件格式和排版,输出成一份正式的会议纪要。 如果是刚开始用,你会觉得这个东西真省时间。
但很快你会发现,麻烦还在。
AI不是你的同事,并不知道你这2个小时的会议哪句话更重要,它只是把语音转成文字而已,输出的Word格式,可能有很多加粗、悬挂缩进、无序列表,并不符合你们公司的文档规范。 这一层,AI确实给了你一份成果,但这份东西能不能用,敢不敢用,不好说。
但这类比起第一类强多了,AI不仅仅只是回答问题,它开始算是介入了你的工作里面,给你提供结果了。
但它仍然没有改变工作流程。 每次开会、写报告、做总结,你还是要重复同一套动作,上传材料,等 AI 输出,检查结果,继续提出要求,继续等结果,最后还是跑不了手动调整。
这类人已经往前走了,但AI给的东西,还得你自己搬进工作里。人没少干活,只是从提问变成了搬运。

第三类:有项目意识

第三类人的用法,开始不一样了,这一步也是跨越很大的一步,可以说我身边绝大多数人,都没有到这一步。
这类人几乎不再打开网页版的豆包、千问了,他们开始用claude code、codex、trae、openclaw这些agent工具。 这些工具是可以直接对你的电脑上的文件进行操作的,或者说,到这一类人,他们有了项目意识,写会议纪要的时候,他们会把音频传进电脑上的”会议音频”文件夹,然后告诉自己的agent,整理成会议纪要。2分钟后,这份排版符合要求,内容重点分明的markdown格式的会议纪要,不仅仅会进入到你电脑上专门的文件夹,还会自动同步到你们部门的飞书知识库和你主管的邮箱里。 我最早体会到,还是用的gemini cli整理我的obsidian笔记的时候,那会儿的大模型应该还是gemini 2.5,它跑在终端那个黑窗口里,我只发了一句“把inbox文件夹下面全部文件名都加上前缀”,不到1分钟,inbox的几十个markdown文件名全部修改成功,当时真的觉得很神奇。你可能会觉得,以前哪些加班到深夜调文件格式的时间真浪费掉多少美好的人生啊。 Agent可能是通过一个skills来介入你的项目,大模型每一步应该干嘛,遵守什么规范,调用什么工具,我们都不用管,之前都设置好了。 这样,AI算是真正进入了自己的工作内部,每一个事情,都会成为一个项目。

AI 进入工作系统

你不需要再做搬运工了,你得到的是一个已经写回工作系统的成果。
当然,这一层也开始有风险了。这类用法开始,AI开始主动做事,
AI 能改文件,就可能改错文件,它能自动安排节奏一步一步实现一个目标,就可能在你没确认的时候做出一些你不希望出现的事情。 所以最重要的是给它清楚的边界和约束,这也就是最近特别火的harness。 哪些文件可以读,哪些文件不能碰;哪些内容能写进正式稿,哪些只能标成待确认;做到哪一步必须停下来问你,等等。
AI 开始变得能动手,而人的判断会更加的重要。 你用AI到了这一层,很难再回去,你也许已经超过了99%的人。AI终于进了你的工作系统,你不用再做搬运工,代价是,除了设计项目的流程,你还得学会给它设定边界。

第四类:用AI做产品

第四类人,不只是让 AI 完成一个任务,而是让 AI 完整推进一件事情。
这里的差别很大。
第三类虽然说已经算是项目,涉及到简单工作流了,但每一个项目仍然算是单点任务,第四类则是完整的需要多个agent介入的大流程了。
比如做出一个网页,可以发布的那种。 第四类的做法是,你先和claude code沟通,写出需求文档,这个网页要实现什么功能,给谁用。需求定了之后,claude会自动把需求文档放进你的obsidian笔记库,接着你和gemini根据obsidian库里的需求文件来讨论设计界面,页面怎么布局,用什么风格和配色。让gemini生成第一版的网页原型,你能看到整体颜色喜不喜欢,按钮的位置对不对。定了UI之后,你让codex读取需求和设计,制定技术方案,选框架定架构,然后开始写代码实现,前端后端一起推进,跑测试,改bug,最后部署上线。 整个过程中,AI会在几个关键节点停下来问你:需求文档写完了,方向对不对?技术选型是React还是Vue?页面做出来了,配色和布局符合预期吗?测试发现了3个bug,优先级怎么排?每一步推进之前,AI都在等你拍板。 但写代码、调格式、跑测试、生成文档、部署上线这些脏活累活,都是AI自己就做了,根本不用你亲自盯着。以前要盯着每个细节,现在只需要在几个关键决策点出现就行。

多 Agent 协作交付产品

你第一次用这种方式做完一个东西,会有点不真实感。我自己的网站,也就用了三天就部署上线了,还是那种不紧不慢做的,AI的出现让很多以前不敢想的事情很容易就变成了现实。 所以第四类的核心,是人终于可以只管更重要的部分。目标、边界、取舍、审美、验收。AI 负责把过程推下去,把该整理的整理好,把该写回的写回去,把该检查的检查出来。
这一层的 AI,已经不是一个工具窗口。
它更像一个协作者。
你给它的不是帮我写一段,而是帮我完成这件事。它处理的不再是一个片段,而是一串动作。 到这一层,你和AI的关系,已经不是工具和使用者,而是分工协作。

AI 使用的四层能力总览

所以,为什么你觉得AI不好用?
是因为你一直只让它回答问题,或者最多交一版结果。
你完全不要急着换模型,也别焦虑每天又出了什么新工具,就从自己手里最常重复的小事开始。
比如会议纪要、周报、选题整理、资料归档、文章审校。 以前你只会问问题,那现在就尝试让它给你出一个结果,如果你已经会让它出结果,那就试着给它一些再稍微大点的目标。你的小任务每往前推进一层,你对使用AI的体感就会有明显的改变。 未来的工作方式,不是“人做事,AI 帮忙”,而是“人定目标和边界,AI 自己干活”。
这不是 AI 本身能力强弱的问题,是你和它怎么协作的问题。

<section style="margin: 28px 0 14px 0; text-align: center; color: #d46b2c; font-size: 15px; font-weight: 700; line-height: 1.8;"> 扫码直达 </section>

公众号尾图