这里的 e 是自然常数,约等于 2.71828。对向量中的每个元素取指数函数,这样做的目的是将原始数值转换为非负实数,并且通过指数函数的性质,使得较大的元素对应的值在经过指数运算后会变得更大,较小的 对应的值会变得更小,从而放大了原始数值之间的差异。 softmax()函数就是利用这个。
这里的 e 是自然常数,约等于 2.71828。对向量中的每个元素取指数函数,这样做的目的是将原始数值转换为非负实数,并且通过指数函数的性质,使得较大的元素对应的值在经过指数运算后会变得更大,较小的 对应的值会变得更小,从而放大了原始数值之间的差异。 softmax()函数就是利用这个。