TensorFlow에서 다음 비용 함수를 사용하여 로지스틱 회귀 모델을 만들고 싶습니다.
사용된 데이터 세트의 스크린샷은 다음과 같습니다.
제 코드는 다음과 같습니다:
실행 결과 스크린샷은 다음과 같습니다.
두 번의 반복 후에 W和b都变成了nan라는 결과를 얻었음을 알 수 있습니다. 문제는 무엇입니까?
W
b
nan
몇번의 검색 끝에 문제를 발견했습니다.
반복 방법 선택에 관한 문장에서:
여기서 정상적으로 훈련할 수 있습니다0.1的学习率过大,导致不知什么原因在损失函数中出现了log(0)的情况,结果导致了损失函数的值为nan,解决方法是减小学习率,比如降到1e-5或者1e-6. 제 상황에 맞게 학습률을 1e-3으로 조정했더니 프로그램이 완벽하게 실행됩니다.
0.1
log(0)
1e-5
1e-6
최종 피팅 결과를 첨부합니다:
몇번의 검색 끝에 문제를 발견했습니다.
반복 방법 선택에 관한 문장에서:
으아악여기서 정상적으로 훈련할 수 있습니다
0.1
的学习率过大,导致不知什么原因在损失函数中出现了log(0)
的情况,结果导致了损失函数的值为nan
,解决方法是减小学习率,比如降到1e-5
或者1e-6
. 제 상황에 맞게 학습률을 1e-3으로 조정했더니 프로그램이 완벽하게 실행됩니다.최종 피팅 결과를 첨부합니다: