checkpoint = torch.load(args.state_dict) ->RuntimeError: CUDA error: out of memory

进行eval,加载模型到gpu时,出现错误:RuntimeError: CUDA error: out of memory

疑似原因:有一个相似的模型(网络结构名相同,通道数不同)在另一块gpu上训练着,导致加载错误

解决办法:先停止相似模型的训练

上一篇:RuntimeError: Input, output and indices must be on the current device


下一篇:RuntimeError: “softmax_lastdim_kernel_impl“ not implemented for ‘Long‘