モデル
新モデル・バージョン・ベンチマーク解説
埋め込み対生成:モデルがこなす二つの仕事
埋め込みと生成は別々の仕事です。自分の課題がどちらを必要としているかを知ることが、本当に機能するシステムへの最短ルートです。
トークンのコスト:モデルの価格設定の仕組み
モデルの請求は、単語やリクエストではなくトークンで測られます。トークンが何で、どれに支払うかを理解することが、コストを予測可能に保つ鍵です。
コンテキストウィンドウを理解する:トークン、アテンション、そして長文脈が崩れる場所
コンテキストウィンドウが大きいことは、記憶が良いことと同じではありません。それが本当は何で、なぜ長い入力が劣化し、どう設計すべきかを解説します。
「フロンティアモデル」が本当に意味するもの——そしてベンチマークが誤解を招く理由
「フロンティアモデル」は仕様ではなく、動き続けるラベルです。それが本当は何を指すのか、リーダーボードのスコアがなぜ必要な情報を語らないのか、それでもうまく選ぶ方法を解説します。
大規模言語モデルはどう訓練されるのか、平易な言葉で
言語モデルの訓練は1つの魔法のステップではなく、段階を踏んで進みます。各段階が何をするのか、なぜ順番が重要なのかを平易な言葉で解説します。
オープンウェイト対オープンソースのモデル:本当の違い
この二つの用語は同義語のように使われますが、そうではありません。ダウンロード・検査・再利用できるものは大きく異なり、それは何をしてよいかを左右します。
なぜモデルには知識カットオフがあるのか
モデルの知識がある日付で止まるのは、知識が訓練時に凍結されるからです。なぜそうなるのか、ツールがどう回避するのかを解説します。
マルチモーダルモデル:「見える」とは本当はどういうことか
モデルが画像を「見る」とき、それはあなたの見方とは違います。マルチモーダルモデルが実際にどう動き、何を可能にし、どこで静かに失敗するかを解説します。
トークンとトークン化:なぜモデルはテキストを奇妙に見るのか
モデルは文字も単語も読みません——トークンを読みます。その一つの事実を理解すれば、綴りのつまずき、奇妙なコスト、コンテキスト制限の挙動が説明できます。
オープン対クローズドモデル:実際のプロジェクトでどう選ぶか
オープンウェイトか、ホスト型APIか。正しい答えはイデオロギーではなく、制御・コスト・リスクで決まります。本番に耐える判断の枠組みを示します。
推論モデル:「思考」トークンが果たす役割
"推論モデルは答える前に問題を考え抜きます。その隠れた作業には時間とトークンがかかり、適切なタスクでのみ報われます。"
モデルの「パラメータ」とは実際には何なのか
「数十億のパラメータ」は馬力のように引用されます。パラメータとは本当は何か、その数がなぜ重要で、なぜ大きいほど自動的に良いわけではないのかを解説します。
量子化と蒸留:モデルを小さくする
モデルを縮める二つの異なる方法。一方は数値を変え、もう一方は小さな複製を学習させます。それぞれの仕組みと、どちらに手を伸ばすべきかを解説します。
Mixture-of-Expertsモデルを、シンプルに解説する
Mixture-of-Expertsは、入力ごとに自身の一部だけを使うことで、巨大でありながら安価に動くモデルを可能にします。その考え方を平易に、そしてなぜ重要かを解説します。
temperature、top-p、サンプリング:モデルの出力を制御する
temperatureとtop-pは、モデルが次の単語をどう選ぶかを決めます。各々の実際の働きを知れば、出力を硬いものから創造的なものへ意図的に調節できます。
なぜ同じプロンプトを二度実行すると結果が異なるのか
同じプロンプトを二度送ると、しばしば二つの異なる答えが返ってきます。これはバグではなく設計です——その理由を知れば、いつそれを制御すべきかが分かります。
小さなモデル、大きな仕事:オンデバイスがクラウドに勝るとき
最大のモデルが正解であることはめったにありません。小さなオンデバイスモデルがまるごとの仕事を制する理由と、あなたの仕事がそれに当てはまるかの見分け方を解説します。
















