| Up | 誤差 (得失) | 作成: 2025-06-03 更新: 2025-06-20 |
[ x_i ] を指すとは,つぎのこと: ・p_LEN(S) は, <EOS>のトークンID 番目の値が「ほぼ1」 one-hot で [ x_i ] を指す [ p_i ] を, [ true_i ] で表す。 ── one-hot とは,「要素が1つだけ1で他は0」。 ここからは,いまの [ p_i ] を [ true_i ] に近づける行程に入る。 方法は, TV と W の調整: true_i は,p_i の 「正解ラベル」の位置づけになる。 この正解ラベル true_i に対する p_i の「誤差」を,先ず表現する。 これは,「クロスエントロピー損失関数(Cross-Entropy Loss)」を使って,つぎのように定義する: = - log( p_i (true_i)^T ) Python コード
|