这个动画还挺不错的,可视化的讲解神经网络是如何工作的。
1 个赞
这个讲的是多层感知机(MLP),放在15年前还算先进…… 而且这些连线看起来太混乱了,我建议看这个:
实际上更加有用的是梯度下降算法和反向传播。从MLP到transformer,模型结构一直在变,但这两套算法几乎完全没变过。
果然是3Blue1Brown的…感觉比较费脑还没看,只看了7分钟的那个:【【官方双语】大语言模型的简要解释-哔哩哔哩】 https://b23.tv/nsnDhDY
可视化交互的,个人也推荐一篇神经网络的科普:
大模型如何识别猫