关于 AI 应用的一些思考


还记得 22 年那会还在用 Github Copilot 的代码补全,用注释生成思修课大作业,随后 ChatGPT 横空出世让它扮演🐱娘来对话(好吧我们二次元怎么你了),再后来微软 New Bing 稍微支棱了一段时间(应该是最早带网页检索的AI?),以及之后国内模型一系列井喷式的发展 —— 千问、豆包、Deepseek R1(很难想象这玩意才出现一年)、智谱、MiniMax(拒绝了它家 offer 的本科室友现在是有点后悔 hh)······再到现在实习围绕 Agent Runtime Infra 开发高强度做了一段时间,逐渐有了一些比较深刻的感受,在此记录下来,不定时更新。

2025.1.18

  1. LLM 成为技术人员必备的提效工具的趋势不可阻挡,但是使用效果和个人知识广度和深度成正比。借用一句老话:“人的知识面是个圆,圆越大接触到的空白越多。” 只是在 AI 的使用上,知识面的圆越大,能应用 AI 的 Interfaces 越多。

  2. AI CLI 工具不只是终端里的对话界面,它一方面解决了人在文档和网页复制粘贴中转效率低的瓶颈(人类按 Ctrl C+V 的双手作为数据总线太慢了),另一方面直接赋予了 AI 用终端命令操作电脑/服务器的能力,更能模拟人类使用这些设备的工作流程。

  3. CLI 工具+容器是一个比较有意思的做法,通过引入“容器”这个边界,把一个受外界干扰的复杂状态机(宿主机),简化为一个封闭的、确定的黑盒(GPT:很抱歉我搞砸了一切,rm -rf *启动)。Agent 工具在内部运行可以在一定程度上起到熵减的作用。

  4. 只是应用层面的话,我感觉目前各种概念本质上还是在折腾输入的 Prompt。不过也确实,输入质量越高,参数匹配越精确,输出质量越高。有点类似于写 sql,写得好可以查得更快。

  5. 感觉目前大多数大厂 toC 的 AI 落地模式比较接近传统的 IM 系统(毕竟主要是对话)。

  6. 设计 Agent 一定程度上是对现实世界工作流程的逆向,有时候有点像超级智能的脚本,但是得定义好执行边界。(产品经理是最早用 Agent 的人群,只不过我们现在用人工智能,他们很早就把我们当能工智人用。)

2025.3.8

  1. 在某家网安领域的公司日常实习两个月不到内上线了一整个项目,作为日常实习生深度参与后端 + 前端 + Agent 侧容器化 + 生产环境服务部署 + 整体架构调优(不明白为什么公司很重视这个项目但怎么感觉整体 70% 都是我一个日常实习生在干),上线前也通过了公司安防实验室大佬们的测试。

    作为一个对前端技术栈只是粗浅理解,只对后端开发和计算机专业核心课认识深一些的我,显然是在 AI 的帮助下才能实现这种类似特种兵式高强度开发作战,同时在实战中也积累到了 AI 的各种使用技巧,也认识到了 Coding Agent 基于原理的无法逾越的能力边界:

    • 后端:简单的查询很适合 AI 写,但是其他部分要深刻理解任务场景,只有基于需求和现有代码精心编写的 prompt 才能放心让 AI 去完成,其实这种 prompt 已经差不多是自然语言和伪代码之间了。
      • 对于低耦合度的功能模块增加很适合让 AI 写;
      • 高耦合度的屎山,有那精心编 prompt 的时间还不如自己上手边写边测;
      • 让节子的一个学长看了我的 prompt,他觉得这就是 prd 了(笑死 难道说我还挺适合干产品?)
      • 架构是会随着一堆需求加上之后开始腐化的,要是开发的时候没意识到这种,只是库库让 AI 写功能,最后只会成一团 Go 💩,作为项目开发者你要想明白每次改动对后续继续开发有什么影响,这是要上生产环境不断迭代的代码,不是自己本地跑一跑的小工具。开发中,代码本身并不是所有的上下文,从部署环境(性能、网络条件等)到后续开发再到日常维护乃至产品未来的发展方向,以及公司各团队协作、国家相关政策和各种复杂历史遗留问题,这都是真切需要考虑,很吃经验以及个人意识的
    • 前端:我只理解前端一些基本的原理,很多功能上的只能详细描述我想要的结果,这时候反而得考虑为展现产品特色而设计一些效果 + 站在用户的角度去设计各种交互逻辑和显示效果(最产品的一集)
    • 云原生:容器化是真好玩,为任务的生命周期管理和可观测性设计各种方法太爽了,但还是想说个笑话,虽然不是在云原生技术栈领域的:
      • 我们这套 Agent 任务系统其实挺类似于 CI 平台的,但是难点是获取 AI 在容器内执行的状态和结果,之前单任务场景选择让 AI 执行完报销掉容器之后再读取文件夹获取产物,前不久提了个容器内执行多任务并实时反馈给用户的需求,我说这个后端作为控制平面很难处理,于是 Agent 侧让我轮询对应文件夹内的产物
      • 显然,直接提这种需求让 AI 写,它肯定是能直接写出来的,但是做出这种决策显然缺乏各种 IO 消耗、文件读取竞态、反模式的上下文,以至于不会觉得这是问题,都不会去 AI 问解决方式;
      • 解决方式:我看了 Agent 侧的代码,本质上是 Python 脚本定义的 workflow,让 AI 分阶段干活,在对应任务结束后再处理各种产出再进行下一步,于是我再设计了个 callback 接口,直接让他们在阶段任务结束后按约定好的发包,这个流程还有一系列鉴权和幂等性、重传需求、容器间通信等问题就不一一赘述了。总之它很好得解决了可观测性问题。

待更新...

声明:AweiP Cache|版权所有,违者必究|如未注明,均为原创|本网站采用BY-NC-SA协议进行授权

转载:转载请注明原文链接 - 关于 AI 应用的一些思考


且愿饮冰而热血不凉