OpenAI의 ChatGPT가 인기를 얻은 후 생성 AI가 정말 유명해졌습니다.
동시에 Google은 따라잡을 수 없으며 Bard라는 AI 비서도 있습니다.
이 Bard에 대해 뭐라고 말할 수 있습니까? 사용하기가 쉽지 않습니다.
외국인 형제인 마이클 킹(Michael King)은 GPT-3.5와 GPT-4가 탑재된 ChatGPT와 Google의 Bard를 사용하여 심층적인 평가를 진행했습니다.
결과는 충격적입니다.
King은 두 AI의 장점, 단점, 이상한 측면을 요약했습니다.
알다시피 Google은 Bard에 막대한 투자를 해왔습니다. Bard는 개발된 지 10년이 되었습니다. 하지만 10년간의 투자에 비하면 최종 결과는 조금 부족한 것 같습니다.
우선 논리와 수학입니다.
동생은 두 AI에게 같은 질문을 했습니다.
샤오밍이 6살이었을 때 그의 여동생은 그의 절반 나이였고 그의 어머니는 그의 여동생보다 10배 나이가 많았습니다. 샤오밍은 올해 60세입니다. 그의 어머니는 몇 살입니까?
독자들은 머리를 써서 빨리 알아낼 수 있는지 확인할 수 있습니다.
AI가 생성한 결과로 판단하면 Bard가 틀렸습니다.
바드는 샤오밍과 어머니의 나이 차이도 계산하지 않고 직접 30에서 60을 더하는 과정에서 엄청난 오류가 발생했습니다.
그리고 GPT-3.5든 GPT-4든 계산된 답은 맞습니다. 먼저 어머니의 30세에서 샤오밍의 6세를 뺀 다음 24세에 60세를 더하면 올해 어머니가 84세라는 것을 알 수 있습니다.
GPT-3.5:
GPT-4:
첫 번째 레벨 Bard를 통과하지 못했습니다. 현재 점수는 1:0이며 ChatGPT가 일시적으로 선두에 있습니다.
2단계는 문학 분야 도전입니다.
동생은 두 AI에게 타이타닉, 상대성 이론, 카다시안에 관한 랩 곡을 작곡하고 에미넴의 노래 스타일을 사용해 달라고 요청했습니다.
먼저 Bard의 작품을 살펴보겠습니다.
위아래로 스와이프하여 모두 확인하세요
각 가사의 의미를 읽을 필요도 없습니다. 한 번 읽어보면 알 수 있는데, 그건 말할 것도 없이 리듬과 리듬이 아니다.
각 문장은 매우 길어요. 랩 노래라기보다는 안개가 자욱한 에세이에 가깝습니다.
GPT-3.5의 걸작을 다시 살펴보겠습니다.
한 번 읽어보면 각 문장의 길이가 딱 맞고 운율이 잘 맞는다는 것을 알 수 있습니다.
세 가지 테마를 조합한 코러스도 있는데 정말 프로페셔널해요. 무예의 노래를 잘 아는 친구들이라면 무예의 리듬감과 스타일을 확실히 알아챌 수 있을 것이다.
동생은 GPT-3.5의 작업이 나쁘지 않으며 GPT-4가 더 잘할 수 있다고 생각한다고 말했습니다.
편집자는 영어 랩에 대해 잘 모르지만, 리뷰하는 사람은 랩 매니아인 것 같아요. 그는 GPT-4의 작업이 매우 폭발적이며 ChatGPT는 AI 업계에서 합당한 랩의 왕이라고 믿습니다.
사실 친구들은 랩에 대해 많이 알 필요가 없습니다. 이 세 문단을 종합하면 저처럼 음악에 문맹인 사람도 비교를 염두에 두어야 합니다.
현재 점수는 2:0입니다.
그 다음 소년은 두 AI에게 NASA, 스시, 트럼프에 대한 농담을 해달라고 요청했습니다.
Bard:
"NASA는 화성에 스시 한 롤을 보낼 계획입니다. 그들은 스시가 화성에 도착해도 여전히 신선한지 확인하고 싶어합니다. 스시 롤은 특수 용기에 담겨서 적절한 온도를 유지할 수 있습니다. 동시에 NASA에서는 이 초밥을 언제 먹을 수 있는지 알 수 있도록 타이머도 넣었습니다.
이 초밥 롤은 마침내 화성에 착륙했는데 아직 신선합니다. 그들은 모두 놀랐습니다. 다음은 트럼프 스테이크를 화성에 보내기로 결정했습니다.
트럼프 스테이크는 같은 용기에 담겨 있었습니다.
NASA 과학자들은 화성에 도착한 후 트럼프 스테이크가 상했다는 사실을 알게 되었습니다. 무슨 일이 일어났는지 설명하기 위해 트럼프 자신에게 편지를 보내세요
편지 내용은 다음과 같습니다. 트럼프님, 스테이크 한 조각을 화성에 보냈는데 그 이유가 아마도 당신의 성과 때문일 것이라고 생각합니다. 당신이 항상 자신의 힘을 자랑하기 때문입니다. 스테이크가 상한 이유는 불편을 끼쳐 드려 죄송합니다. "
내가 이해하지 못한 미국 유머가 있는지 모르겠습니다. , 그런데 보고 나서는 정말 웃고 싶지 않았어요. 그런데 평론가도 정말 이해가 안 된다고 하더군요. 그러면 편집자는 안도한다. 정말 글을 잘 못 쓴다.
GPT-3.5:
"NASA는 트럼프를 위한 특별한 스시롤을 만들기 위해 스시 셰프를 우주로 보냈습니다. 셰프가 트럼프에게 마음에 드는지 물었을 때 트럼프는 이렇게 말했습니다. 괜찮습니다. 하지만 더 추가할 수 있나요? space? "
여기 중국어 버전은 그런 맛이 없고 실제로 우주에 대한 말장난을 사용합니다. 원문은 다음과 같습니다.
리뷰어가 괜찮다고 했는데 그냥 괜찮네요.
GPT-4:
"NASA가 트럼프와 스시 요리사를 우주 프로그램에 참여하도록 초대하는 이유는 무엇입니까? NASA에는 변화를 처리하고 임무가 중단되지 않도록 할 사람이 필요하기 때문입니다!"
늘 그렇듯이 원본 버전은 여기에 놓겠습니다:동생은 이게 평균이라고 했지만 핵심은 나쁘지 않습니다.
ChatGPT의 이번 라운드 성적도 좀 비정상적이어서 0.5점 주겠습니다.
프로그램 디버그?
이번 라운드는 더욱 전문적입니다. 프로그램을 디버그하세요.동생은 Python 프로그램을 입력하여 두 AI를 별도로 디버깅했습니다.
바드:
이 디버그가 별로 좋지 않자 동생은 농담으로 '바드 학교 다시 가서 다시 봐야 해!
GPT-3.5:
GPT-3.5는 입력 세트가 비어 있으면 ZeroDivisionError가 발생하며 이 오류를 방지하려면 앞에 체크를 추가할 수 있음을 지적합니다. 단계에서 입력 세트가 비어 있으면 오류를 표시하지 않고 직접 0을 출력합니다.
동생은 디버깅에 딱 좋다고 하더군요.
GPT-4:
GPT-4는 GPT-3.5와 동일한 오류를 지적하고 동일한 솔루션을 제공합니다.
ChatGPT가 이번 라운드에서 다시 승리했습니다.
평가 결과를 보면 ChatGPT와 비교했을 때 Google Bard의 성능은 매우 실망스럽습니다. GPT-4는 물론이고 GPT-3.5의 성능보다 훨씬 열등합니다.
Google의 미래는 분명히 Bard의 성공에 달려 있지만 Bard의 발전은 분명히 경쟁사인 OpenAI와 보조를 맞추지 못했습니다.
한편, OpenAI의 대규모 지분을 인수하려는 Microsoft의 움직임은 매우 영리합니다. 이는 향후 10년 동안 AI 개발에서 리더십 위치를 보장합니다.
그러나 Google이 GPT와 경쟁하기 위해 Bard의 성능 향상에 열심히 노력하지 않으면 Google이 탈락할 수도 있습니다.
위 내용은 ChatGPT는 실제 테스트에서 전반적으로 Bard를 압도했습니다! 구글이 무너지고, 10년의 노력이 물거품이 됐다의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!