TensorFlow를 사용하여 로지스틱 회귀 모델을 생성하면 학습 결과가 nan이 됩니다.

Question

TensorFlow에서 다음 비용 함수를 사용하여 로지스틱 회귀 모델을 만들고 싶습니다.

사용된 데이터 세트의 스크린샷은 다음과 같습니다.

제 코드는 다음과 같습니다:

으아악

실행 결과 스크린샷은 다음과 같습니다.

두 번의 반복 후에 W和b都变成了nan라는 결과를 얻었음을 알 수 있습니다. 문제는 무엇입니까?

大家讲道理 · Answer

몇번의 검색 끝에 문제를 발견했습니다.

반복 방법 선택에 관한 문장에서:

으아악

여기서 정상적으로 훈련할 수 있습니다0.1的学习率过大，导致不知什么原因在损失函数中出现了log(0)的情况，结果导致了损失函数的值为nan，解决方法是减小学习率，比如降到1e-5或者1e-6. 제 상황에 맞게 학습률을 1e-3으로 조정했더니 프로그램이 완벽하게 실행됩니다.

최종 피팅 결과를 첨부합니다: