welclaiAI·TREND·DIGEST

模型

新模型、版本与基准解读

models

嵌入对比生成:模型做的两件不同的事

嵌入和生成是两份不同的工作。搞清楚你的问题需要哪一个,是通往真正可用系统的最快路径。

#embeddings#generation#retrieval
06-15 11:41·7 分钟
models

token 的成本:模型定价是怎么运作的

"模型账单以 token 计量,而非单词或请求。弄清 token 是什么、以及你为哪些 token 付费,是让成本保持可预测的方式。"

#tokens#pricing#cost-management
06-12 15:45·7 分钟
models

上下文窗口详解:token、注意力,以及长上下文在哪里失灵

更大的上下文窗口并不等同于更好的记忆。这是上下文窗口究竟是什么、长输入为何会劣化,以及如何围绕它来设计。

#context-window#tokens#attention
06-02 10:06·7 分钟
models

“前沿模型”到底意味着什么——以及为什么基准测试会误导你

“前沿模型”是一个会移动的标签,不是一项规格。本文谈它真正指向什么、排行榜分数为何很少告诉你真正需要知道的东西,以及如何依然做出好的选择。

#frontier-models#benchmarks#evaluation
06-01 19:11·7 分钟
models

大语言模型是如何训练出来的,用大白话讲

训练一个语言模型是分阶段进行的,而不是一步登天的魔法。本文用大白话讲清楚每个阶段做什么,以及顺序为何重要。

#training#pretraining#fine-tuning
06-01 12:06·7 分钟
models

开放权重模型与开源模型:真正的区别

"这两个术语常被当作同义词,但它们并不是。你能下载、检视、复用的东西差别极大——而这会影响你被允许做什么。"

#open-weight#open-source#licensing
05-29 16:50·7 分钟
models

为什么模型会有知识截止

模型的知识停在某个日期,是因为它的知识在训练时就被冻结了。本文讲清楚这为何发生,以及工具如何绕过它。

#knowledge-cutoff#training-data#retrieval
05-25 16:26·7 分钟
models

多模态模型:"它能看见"究竟意味着什么

当一个模型"看见"一张图像时,它并不是在像你那样看。本文讲清多模态模型实际如何运作、它能带来什么,以及它在哪里悄悄失手。

#multimodal#vision#image-understanding
05-22 12:04·7 分钟
models

token 与分词:为什么模型看文本的方式很奇怪

模型不读字母也不读词语——它们读的是 token。弄懂这一个事实,就能解释拼写出错、奇怪的成本,以及上下文限制为何这样运作。

#tokens#tokenization#context-window
05-14 16:37·7 分钟
models

开放对封闭模型:真实项目里该如何抉择

开放权重还是托管 API?正确答案取决于控制、成本和风险——而非立场。这是一套能经受住生产环境检验的框架。

#open-weights#model-selection#deployment
05-11 14:31·7 分钟
models

推理模型:“思考”token到底做了什么

"推理模型会先把问题想清楚再作答。那段隐藏的思考过程要花时间、耗token——而且只有在合适的任务上才划算。"

#reasoning-models#thinking-tokens#inference
04-29 14:40·7 分钟
models

模型的“参数”到底是什么

“数十亿参数”被人像念马力一样挂在嘴边。本文谈参数究竟是什么、它的数量为何重要,以及为什么更大并不自动意味着更好。

#parameters#model-size#weights
04-21 18:59·7 分钟
models

量化与蒸馏:把模型变小

"两种把模型缩小的不同方式——一种改变它的数字,另一种训练一个更小的副本。下面讲清楚各自如何运作、以及何时该用哪一个。"

#quantization#distillation#model-compression
04-12 16:37·7 分钟
models

专家混合模型,简单讲清

专家混合让一个模型既能巨大、又能廉价地运行,办法是每次输入只用上自身的一小片。本文把这个想法讲清,以及它为何重要。

#mixture-of-experts#architecture#efficiency
04-11 13:35·7 分钟
models

温度、top-p 与采样:掌控模型输出

温度和 top-p 决定了模型如何挑选下一个词。弄懂它们各自真正在做什么,你就能有意识地把输出从刻板调到富有创意。

#sampling#temperature#top-p
04-06 09:43·7 分钟
models

为什么同一条提示词跑两次结果会不同

同一条提示词发两次,你常会得到两个不同的答案。这是设计使然,不是 bug——而懂得为什么,能告诉你何时该去控制它。

#sampling#temperature#determinism
04-04 15:31·7 分钟
models

小模型,大用场:端侧何时胜过云端

最大的模型很少是最合适的那一个。本文讲清小型端侧模型为何能拿下一整类工作,以及如何判断你的任务是否属于这一类。

#small-models#on-device#edge-ai
04-01 12:28·7 分钟