welclaiAI·TREND·DIGEST

한국어·EN·日本語·中文·Español

全部模型工具研究应用案例政策教程

模型

新模型、版本与基准解读

嵌入对比生成：模型做的两件不同的事

嵌入和生成是两份不同的工作。搞清楚你的问题需要哪一个，是通往真正可用系统的最快路径。

#embeddings#generation#retrieval

06-15 11:41·7 分钟

token 的成本：模型定价是怎么运作的

"模型账单以 token 计量，而非单词或请求。弄清 token 是什么、以及你为哪些 token 付费，是让成本保持可预测的方式。"

#tokens#pricing#cost-management

06-12 15:45·7 分钟

上下文窗口详解：token、注意力，以及长上下文在哪里失灵

更大的上下文窗口并不等同于更好的记忆。这是上下文窗口究竟是什么、长输入为何会劣化，以及如何围绕它来设计。

#context-window#tokens#attention

06-02 10:06·7 分钟

“前沿模型”到底意味着什么——以及为什么基准测试会误导你

“前沿模型”是一个会移动的标签，不是一项规格。本文谈它真正指向什么、排行榜分数为何很少告诉你真正需要知道的东西，以及如何依然做出好的选择。

#frontier-models#benchmarks#evaluation

06-01 19:11·7 分钟

大语言模型是如何训练出来的，用大白话讲

训练一个语言模型是分阶段进行的，而不是一步登天的魔法。本文用大白话讲清楚每个阶段做什么，以及顺序为何重要。

#training#pretraining#fine-tuning

06-01 12:06·7 分钟

开放权重模型与开源模型：真正的区别

"这两个术语常被当作同义词，但它们并不是。你能下载、检视、复用的东西差别极大——而这会影响你被允许做什么。"

#open-weight#open-source#licensing

05-29 16:50·7 分钟

为什么模型会有知识截止

模型的知识停在某个日期，是因为它的知识在训练时就被冻结了。本文讲清楚这为何发生，以及工具如何绕过它。

#knowledge-cutoff#training-data#retrieval

05-25 16:26·7 分钟

多模态模型："它能看见"究竟意味着什么

当一个模型"看见"一张图像时，它并不是在像你那样看。本文讲清多模态模型实际如何运作、它能带来什么，以及它在哪里悄悄失手。

#multimodal#vision#image-understanding

05-22 12:04·7 分钟

token 与分词:为什么模型看文本的方式很奇怪

模型不读字母也不读词语——它们读的是 token。弄懂这一个事实,就能解释拼写出错、奇怪的成本,以及上下文限制为何这样运作。

#tokens#tokenization#context-window

05-14 16:37·7 分钟

开放对封闭模型：真实项目里该如何抉择

开放权重还是托管 API？正确答案取决于控制、成本和风险——而非立场。这是一套能经受住生产环境检验的框架。

#open-weights#model-selection#deployment

05-11 14:31·7 分钟

推理模型：“思考”token到底做了什么

"推理模型会先把问题想清楚再作答。那段隐藏的思考过程要花时间、耗token——而且只有在合适的任务上才划算。"

#reasoning-models#thinking-tokens#inference

04-29 14:40·7 分钟

模型的“参数”到底是什么

“数十亿参数”被人像念马力一样挂在嘴边。本文谈参数究竟是什么、它的数量为何重要，以及为什么更大并不自动意味着更好。

#parameters#model-size#weights

04-21 18:59·7 分钟

量化与蒸馏：把模型变小

"两种把模型缩小的不同方式——一种改变它的数字，另一种训练一个更小的副本。下面讲清楚各自如何运作、以及何时该用哪一个。"

#quantization#distillation#model-compression

04-12 16:37·7 分钟

专家混合模型，简单讲清

专家混合让一个模型既能巨大、又能廉价地运行，办法是每次输入只用上自身的一小片。本文把这个想法讲清，以及它为何重要。

#mixture-of-experts#architecture#efficiency

04-11 13:35·7 分钟

温度、top-p 与采样：掌控模型输出

温度和 top-p 决定了模型如何挑选下一个词。弄懂它们各自真正在做什么，你就能有意识地把输出从刻板调到富有创意。

#sampling#temperature#top-p

04-06 09:43·7 分钟

为什么同一条提示词跑两次结果会不同

同一条提示词发两次，你常会得到两个不同的答案。这是设计使然，不是 bug——而懂得为什么，能告诉你何时该去控制它。

#sampling#temperature#determinism

04-04 15:31·7 分钟

小模型，大用场：端侧何时胜过云端

最大的模型很少是最合适的那一个。本文讲清小型端侧模型为何能拿下一整类工作，以及如何判断你的任务是否属于这一类。

#small-models#on-device#edge-ai

04-01 12:28·7 分钟