公众号文章

你还在问 AI 问题，别人已经让它交付项目了

很多人用 AI，只是打开网页问问题。真正的差距，是有没有让 AI 进入文件、流程和项目，替你把事往前推。

2026-05-16约 8 分钟

<section style="margin: 18px 0 24px 0; padding: 14px 16px; background: #fff8ef; border-left: 4px solid #f29b52; color: #5f5146; font-size: 15px; line-height: 1.8;"> 你一直觉得AI不好用，每次打开豆包，问个问题，得到答案后关掉。下次遇到类似问题，又得重新问。问题可能不在 AI，而在于你一直只让它停在聊天框里。 </section>

网页端问AI问题，得到一个答案。能起到作用，但你会觉得对你的实际工作似乎也帮不上什么大忙。比如要写一个什么东西，材料还是要自己找，就算AI帮你写出一份东西，大概率你也不敢用，还得一个字一个字地改。我也是深度使用AI好几年了，最近在给一些单位做分享的时候，越来越觉得，你自己觉得很简单的东西，居然有很多人完全不知道。就像你提到工作流，提到harness，不是AI圈子的人，几乎完全没有听过，更别提去用到了。所以有很多人觉得AI不好用，像是从来没有用过智能手机的人，刚刚拿到新手机，除了打电话，不知道能干嘛。我感觉现在使用AI的人，大体上有四种类型，欢迎对号入座，你看看你属于哪一类。

第一类，只会网页问问题

第一类人，把 AI 当成一个更聪明的搜索引擎来用。
今天问豆包，周报怎么写？豆包快速输出一套模板，然后自己往里面填入自己本周的实际工作。明天问千问，周三的 PPT 怎么做？可能还会加上一些背景信息，然后千问给一堆建议。后天复制一段文字问 Deepseek，这段话始终有点念不通，怎么改？，Deepseek 快速给出一版润色后的文字。每一次，AI都是给了你答案，不过答案在网页里，你仍然要自己写周报内容，做PPT，复制粘贴文案。这些答案虽然在模型网页的聊天记录里，要用的时候你不一定想得到，想到了，还得自己翻，自己找，这些一百个、一千个答案，并没有变成你可以复用的东西。这类人使用AI最大的问题，就是没有让工具介入你的工作系统，你们的交互就是问答，一问，一答，最多你会追问几轮，这件事就结束了。所以这一类的用法，像是做搜索，每一次使用，都是临时的。身边有很多人都属于这一类，他们不知道AI还能做什么，也不知道有更好的用法。

问答到搬运的差距

第二类：介入实际工作

第二类人往前走了一步。
他们除了更加会向AI提问，比如，他们知道了上下文的概念，知道要让AI做好事，需要把前因后果、对结果的预期、具体的要求等等都说清楚。还知道有些AI工具是多模态的，可以看图，看文件，这类人知道把必要的材料发给 AI，让 AI 来产出一些成果，比如一张设计图，一个Excel表格，一个静态网页，等等。
参加完公司会议，把手机里的会议录音扔给AI，它很快能给出会议背景、讨论要点、待办事项、负责人。还能按照你要求的文件格式和排版，输出成一份正式的会议纪要。如果是刚开始用，你会觉得这个东西真省时间。
但很快你会发现，麻烦还在。
AI不是你的同事，并不知道你这2个小时的会议哪句话更重要，它只是把语音转成文字而已，输出的Word格式，可能有很多加粗、悬挂缩进、无序列表，并不符合你们公司的文档规范。这一层，AI确实给了你一份成果，但这份东西能不能用，敢不敢用，不好说。
但这类比起第一类强多了，AI不仅仅只是回答问题，它开始算是介入了你的工作里面，给你提供结果了。
但它仍然没有改变工作流程。每次开会、写报告、做总结，你还是要重复同一套动作，上传材料，等 AI 输出，检查结果，继续提出要求，继续等结果，最后还是跑不了手动调整。
这类人已经往前走了，但AI给的东西，还得你自己搬进工作里。人没少干活，只是从提问变成了搬运。

第三类：有项目意识

第三类人的用法，开始不一样了，这一步也是跨越很大的一步，可以说我身边绝大多数人，都没有到这一步。
这类人几乎不再打开网页版的豆包、千问了，他们开始用claude code、codex、trae、openclaw这些agent工具。这些工具是可以直接对你的电脑上的文件进行操作的，或者说，到这一类人，他们有了项目意识，写会议纪要的时候，他们会把音频传进电脑上的”会议音频”文件夹，然后告诉自己的agent，整理成会议纪要。2分钟后，这份排版符合要求，内容重点分明的markdown格式的会议纪要，不仅仅会进入到你电脑上专门的文件夹，还会自动同步到你们部门的飞书知识库和你主管的邮箱里。我最早体会到，还是用的gemini cli整理我的obsidian笔记的时候，那会儿的大模型应该还是gemini 2.5，它跑在终端那个黑窗口里，我只发了一句“把inbox文件夹下面全部文件名都加上前缀”，不到1分钟，inbox的几十个markdown文件名全部修改成功，当时真的觉得很神奇。你可能会觉得，以前哪些加班到深夜调文件格式的时间真浪费掉多少美好的人生啊。 Agent可能是通过一个skills来介入你的项目，大模型每一步应该干嘛，遵守什么规范，调用什么工具，我们都不用管，之前都设置好了。这样，AI算是真正进入了自己的工作内部，每一个事情，都会成为一个项目。

AI 进入工作系统

你不需要再做搬运工了，你得到的是一个已经写回工作系统的成果。
当然，这一层也开始有风险了。这类用法开始，AI开始主动做事，
AI 能改文件，就可能改错文件，它能自动安排节奏一步一步实现一个目标，就可能在你没确认的时候做出一些你不希望出现的事情。所以最重要的是给它清楚的边界和约束，这也就是最近特别火的harness。哪些文件可以读，哪些文件不能碰；哪些内容能写进正式稿，哪些只能标成待确认；做到哪一步必须停下来问你，等等。
AI 开始变得能动手，而人的判断会更加的重要。你用AI到了这一层，很难再回去，你也许已经超过了99%的人。AI终于进了你的工作系统，你不用再做搬运工，代价是，除了设计项目的流程，你还得学会给它设定边界。

第四类：用AI做产品

第四类人，不只是让 AI 完成一个任务，而是让 AI 完整推进一件事情。
这里的差别很大。
第三类虽然说已经算是项目，涉及到简单工作流了，但每一个项目仍然算是单点任务，第四类则是完整的需要多个agent介入的大流程了。
比如做出一个网页，可以发布的那种。第四类的做法是，你先和claude code沟通，写出需求文档，这个网页要实现什么功能，给谁用。需求定了之后，claude会自动把需求文档放进你的obsidian笔记库，接着你和gemini根据obsidian库里的需求文件来讨论设计界面，页面怎么布局，用什么风格和配色。让gemini生成第一版的网页原型，你能看到整体颜色喜不喜欢，按钮的位置对不对。定了UI之后，你让codex读取需求和设计，制定技术方案，选框架定架构，然后开始写代码实现，前端后端一起推进，跑测试，改bug，最后部署上线。整个过程中，AI会在几个关键节点停下来问你：需求文档写完了，方向对不对？技术选型是React还是Vue？页面做出来了，配色和布局符合预期吗？测试发现了3个bug，优先级怎么排？每一步推进之前，AI都在等你拍板。但写代码、调格式、跑测试、生成文档、部署上线这些脏活累活，都是AI自己就做了，根本不用你亲自盯着。以前要盯着每个细节，现在只需要在几个关键决策点出现就行。

多 Agent 协作交付产品

你第一次用这种方式做完一个东西，会有点不真实感。我自己的网站，也就用了三天就部署上线了，还是那种不紧不慢做的，AI的出现让很多以前不敢想的事情很容易就变成了现实。所以第四类的核心，是人终于可以只管更重要的部分。目标、边界、取舍、审美、验收。AI 负责把过程推下去，把该整理的整理好，把该写回的写回去，把该检查的检查出来。
这一层的 AI，已经不是一个工具窗口。
它更像一个协作者。
你给它的不是帮我写一段，而是帮我完成这件事。它处理的不再是一个片段，而是一串动作。到这一层，你和AI的关系，已经不是工具和使用者，而是分工协作。

AI 使用的四层能力总览

所以，为什么你觉得AI不好用？
是因为你一直只让它回答问题，或者最多交一版结果。
你完全不要急着换模型，也别焦虑每天又出了什么新工具，就从自己手里最常重复的小事开始。
比如会议纪要、周报、选题整理、资料归档、文章审校。以前你只会问问题，那现在就尝试让它给你出一个结果，如果你已经会让它出结果，那就试着给它一些再稍微大点的目标。你的小任务每往前推进一层，你对使用AI的体感就会有明显的改变。未来的工作方式，不是“人做事，AI 帮忙”，而是“人定目标和边界，AI 自己干活”。
这不是 AI 本身能力强弱的问题，是你和它怎么协作的问题。

公众号尾图