工具
产品、应用、开发工具与工作流
护栏:在 LLM 周围过滤输入与输出
光有模型并不是一个安全的产品。护栏就是那些输入与输出的过滤器,把 LLM 约束在你真正需要的边界之内。
面向 AI 的文档解析:PDF、表格,以及那些乱糟糟的剩余部分
在模型能对你的文档进行推理之前,必须有什么东西先把它们变成干净的文本。这个不起眼的步骤悄悄决定了下游的一切。
流式响应:它为何能改善体验,又是如何做到的
流式不会让模型变快——它让等待感觉更短。本文讲清这为何重要,以及把它构建出来要付出什么代价。
为你的项目选择嵌入模型
挑选嵌入模型,与其说关乎排行榜,不如说关乎契合。这是真正决定检索能否在你的数据和预算下奏效的东西。
选择 AI 编程助手:一套冷静的对比框架
AI 编程助手的演示个个都很漂亮。这是一套框架,帮你按那些真正影响日常工作的东西来评判它们。
现代 AI 应用技术栈,端到端全览
一张清晰的地图,画出构成一个真实 AI 应用的各层——模型、编排、检索、评估,以及那把它们黏在一起、毫不起眼的胶水。
在调用 API 与自托管 LLM 之间抉择
调用托管 API,还是自己运行模型?老实说,答案取决于用量、控制权,以及你能消化多少运维工作。
结构化输出:从模型拿到可靠的 JSON
当你的代码需要的是数据而非散文时,模型必须返回干净、可解析的结构。本文讲如何拿到可靠的 JSON,而不是只能靠祈祷。
抛开炒作看向量数据库:它到底做什么,以及你何时真正需要它
向量数据库一夜之间成了流行词。本文谈它到底做什么、它解决什么问题,以及那些诚实的信号——告诉你究竟需不需要一个。
LLM 应用的可观测性:记录真正要紧的东西
当 LLM 应用出岔子时,"它给了个糟糕的答案"并不是一个可调试的事实。本文讲清该记录什么,好让你真能查出原因。
提示词管理:让提示词不再埋在代码里
硬编码的提示词在你只有一两个时感觉良好,直到散落在文件各处的有了十几个。下面教你把提示词当作受管理的资产,而非埋藏的字符串。
在本地运行 LLM:单台笔记本的实用入门
如今,你可以在一台笔记本上运行一个能干的开源权重模型。这里讲清楚真正决定它能否跑起来的因素——内存、量化、工具链——以及对每一项的诚实预期。
函数调用与工具:把模型连接到行动
函数调用让模型能够决定使用你的代码——却从不真正运行它。本文讲清楚到底发生了什么,以及它会在哪里出错。
缓存 LLM 响应:何时与如何
缓存能大幅削减 LLM 的成本与延迟——也可能悄悄端出陈旧、错误的答案。本文教你如何分辨,并安全地做好它。
评估 AI 工具:一份能挺过演示的清单
AI 工具被设计成在演示里令人眼花缭乱。这份清单帮你用那些经久不变的问题来评判它们——它们决定了工具能否在真实使用中站住脚。
自建还是采购:何时该用 AI 平台
自己拼装一套 AI 技术栈,还是采用一个把它们打包好的平台?答案取决于你真正的优势在哪里——以及不在哪里。
速率限制与重试:构建有韧性的 LLM 调用
托管 LLM 会以寻常的方式失败——限制、超时、瞬时错误。一点点重试纪律,就能把一个脆弱的集成变成一个可靠的。
















