深度学习中的计算图整理与总结

2024-02-20 14:02:22

动态计算图

采用运算法的优势是令梯度的计算更加方便，y对w求导的过程如下：

y对w求导一共包含两项内容，分别是y对a求导和y对b求导。

根据计算图搭建方式的不同，可将计算图分为动态图和静态图。

先创建原始数据，之后执行第一个乘法操作，然后再执行另一个乘法操作，之后执行加法操作，接着执行一个激活函数，最后计算一个loss，有了loss之后，执行梯度反向传播。

PyTorch使用自动微分变量实现动态计算图。在PyTorch0.4中自动微分变量已经与张量完全合并。即，任意一个张量都是一个自动微分变量。

采用自动微分计算时，系统自动构建计算图，即，存储计算路径。可通过访问自动微分变量的grad_fn来获得计算图中的上一个节点，可知哪个运算导致此自动微分变量出现。每个节点的grad_fn就是计算图中的箭头。可使用grad_fn回溯来重构整个计算图。

最后进行反向传播算法时，需要计算计算图中每个变量节点的梯度值（grandient,即该变量需要被更新的增量）。我们只需要调用.backward（）函数即可算出所有变量的梯度信息，并将叶节点的导数值存储在.grad中。