训练时，loss全是nan，请问是什么原因呢？ #4

cuglaiyp · 2022-11-17T13:27:14Z

No description provided.

An-Yuhang-ace · 2022-11-24T09:23:54Z

您好，应该是梯度爆炸的问题，建议先把seq2seq模型的encoder_length和decoder_length调小，预训练之后把参数存下来后继续训练长步长的模型。

cuglaiyp · 2022-11-27T05:04:02Z

您好，应该是梯度爆炸的问题，建议先把seq2seq模型的encoder_length和decoder_length调小，预训练之后把参数存下来后继续训练长步长的模型。

明白了，谢谢您！

cuglaiyp · 2022-11-27T13:00:43Z

您好，应该是梯度爆炸的问题，建议先把seq2seq模型的encoder_length和decoder_length调小，预训练之后把参数存下来后继续训练长步长的模型。

还有一个问题想请教一下，在TestVisual中，预测完，对预测值进行反差分时，lng0和lat0用lng_source[len(lng_source) - 1] 和 lat_source[len(lat_source) - 1]是否要合理一些？如下所示：

    # delta_lng, delta_lat to lng, lat
    lng0 = lng_source[len(lng_source) - 1]
    lat0 = lat_source[len(lat_source) - 1]

Provide feedback