TensorFlow で、次のコスト関数を使用してロジスティック回帰モデルを作成したいと考えています:
使用したデータセットのスクリーンショットは次のとおりです:
私のコードは次のとおりです:
実行結果のスクリーンショットは次のとおりです:
ご覧のとおり、2 回の反復の後、取得された W と b は nan になりました。何が問題なのでしょうか?
W
b
nan
いくつか検索した結果、問題が見つかりました。
反復方法の選択に関する文:
ここでは通常のトレーニングが可能です0.1的学习率过大,导致不知什么原因在损失函数中出现了log(0)的情况,结果导致了损失函数的值为nan,解决方法是减小学习率,比如降到1e-5或者1e-6。私は自分の状況に応じて学習速度を 1e-3 に調整しました。プログラムは完璧に実行されます。
0.1
log(0)
1e-5
1e-6
最終的なフィッティング結果を添付します:
いくつか検索した結果、問題が見つかりました。
反復方法の選択に関する文:
リーリーここでは通常のトレーニングが可能です
0.1
的学习率过大,导致不知什么原因在损失函数中出现了log(0)
的情况,结果导致了损失函数的值为nan
,解决方法是减小学习率,比如降到1e-5
或者1e-6
。私は自分の状況に応じて学習速度を 1e-3 に調整しました。プログラムは完璧に実行されます。最終的なフィッティング結果を添付します: