模型
新模型、版本与基准解读
嵌入对比生成:模型做的两件不同的事
嵌入和生成是两份不同的工作。搞清楚你的问题需要哪一个,是通往真正可用系统的最快路径。
token 的成本:模型定价是怎么运作的
"模型账单以 token 计量,而非单词或请求。弄清 token 是什么、以及你为哪些 token 付费,是让成本保持可预测的方式。"
上下文窗口详解:token、注意力,以及长上下文在哪里失灵
更大的上下文窗口并不等同于更好的记忆。这是上下文窗口究竟是什么、长输入为何会劣化,以及如何围绕它来设计。
“前沿模型”到底意味着什么——以及为什么基准测试会误导你
“前沿模型”是一个会移动的标签,不是一项规格。本文谈它真正指向什么、排行榜分数为何很少告诉你真正需要知道的东西,以及如何依然做出好的选择。
大语言模型是如何训练出来的,用大白话讲
训练一个语言模型是分阶段进行的,而不是一步登天的魔法。本文用大白话讲清楚每个阶段做什么,以及顺序为何重要。
开放权重模型与开源模型:真正的区别
"这两个术语常被当作同义词,但它们并不是。你能下载、检视、复用的东西差别极大——而这会影响你被允许做什么。"
为什么模型会有知识截止
模型的知识停在某个日期,是因为它的知识在训练时就被冻结了。本文讲清楚这为何发生,以及工具如何绕过它。
多模态模型:"它能看见"究竟意味着什么
当一个模型"看见"一张图像时,它并不是在像你那样看。本文讲清多模态模型实际如何运作、它能带来什么,以及它在哪里悄悄失手。
token 与分词:为什么模型看文本的方式很奇怪
模型不读字母也不读词语——它们读的是 token。弄懂这一个事实,就能解释拼写出错、奇怪的成本,以及上下文限制为何这样运作。
开放对封闭模型:真实项目里该如何抉择
开放权重还是托管 API?正确答案取决于控制、成本和风险——而非立场。这是一套能经受住生产环境检验的框架。
推理模型:“思考”token到底做了什么
"推理模型会先把问题想清楚再作答。那段隐藏的思考过程要花时间、耗token——而且只有在合适的任务上才划算。"
模型的“参数”到底是什么
“数十亿参数”被人像念马力一样挂在嘴边。本文谈参数究竟是什么、它的数量为何重要,以及为什么更大并不自动意味着更好。
量化与蒸馏:把模型变小
"两种把模型缩小的不同方式——一种改变它的数字,另一种训练一个更小的副本。下面讲清楚各自如何运作、以及何时该用哪一个。"
专家混合模型,简单讲清
专家混合让一个模型既能巨大、又能廉价地运行,办法是每次输入只用上自身的一小片。本文把这个想法讲清,以及它为何重要。
温度、top-p 与采样:掌控模型输出
温度和 top-p 决定了模型如何挑选下一个词。弄懂它们各自真正在做什么,你就能有意识地把输出从刻板调到富有创意。
为什么同一条提示词跑两次结果会不同
同一条提示词发两次,你常会得到两个不同的答案。这是设计使然,不是 bug——而懂得为什么,能告诉你何时该去控制它。
小模型,大用场:端侧何时胜过云端
最大的模型很少是最合适的那一个。本文讲清小型端侧模型为何能拿下一整类工作,以及如何判断你的任务是否属于这一类。
















