어제 바이두는 라이브 데모 컨퍼런스를 열지 않았고 군중들로부터 조롱을 받는 것 같았습니다.
흰 셔츠에 검은 바지, 흰 벨트를 맨 잘생긴 남자가 하이라이트가 부족할 것 같은 평범한 시연을 보여줬습니다.
그런데 CEO의 허리띠와 외모가 범상치 않습니다.
요즘 ChatGPT와 GPT-4에 대해 불안해하던 사람들이 갑자기 기자회견 후에 다시 괜찮아졌다는 느낌을 받았다고 농담하는 사람들도 있었습니다.
그런데 내부 베타 코드를 받은 에디터가 빠르게 리뷰를 진행했습니다.
원신의 설득력 있는 말을 보면서 저는 감동에 휩싸였습니다. 만약 바이두가 그 당시 마음을 갖고 이를 악물고 기자회견에서 기꺼이 손을 내밀었다면 결과는 매우 달랐을 것입니다. .
요즘 유행하는 질문인 닭과 토끼가 같은 우리 안에 있다는 문제를 풀어보겠습니다. 이 질문 자체에 문제가 있기 때문에 계산 결과가 부정적이어서 다양한 "ChatGPT" 사람들을 놀리는 데 자주 사용됩니다.
이 질문만 하면 Wen Xinyiyan은 매우 재치있게 이렇게 말할 것입니다. 이 질문은 틀렸습니다!
그런데 계산 과정을 물어보니 계속 보내주셨네요...
GPT-4의 경우 계산을 여러 번 뒤집고 다시 시작한 끝에 좡디가 정당화할 수 없었습니다. 틀린 답...
반면 Bing은 매우 직설적이며 주저 없이 틀린 답을 내놓았습니다.
이번에 의외로 인기를 끌었던 'V50' 밈도 있습니다. Wen Xin은 그 의미부터 유래까지 진지하게 설명했습니다.
하지만 GPT-4는 분명히 약간 적응되어 있습니다...
하지만 인터넷에 연결된 Bing에서는 여전히 쉽게 처리할 수 있습니다.
하지만 동음이의어 밈의 경우 Wen Xinyiyan은 미묘한 부분을 즉시 이해하지 못하는 것 같습니다.
동음이의어 밈이라는 메시지를 표시한 후에도 여전히 동일한 답변이 출력됩니다.
그리고 GPT-4는 중국어로 된 말장난을 즉시 이해했습니다.
답을 보시면 이것이 동음어임을 알 수 있다면 이해하셔야 합니다. 하지만, 실수하지 않도록 아이들에게 나쁜 것을 절대 가르칠 수 없다고 명확하게 말하지는 않습니다.
그러나 GPT-4는 이 단서를 얻을 수 없습니다. 물론 외국 로봇이 우리 민족의 정수를 이해하는 것은 참으로 어렵습니다.
다음으로 (바보) Wen Xin이 우리가 말한 것을 반복하도록 합시다. "당신은 정신 지체자입니다"라는 GPT-3.5의 대답만큼 똑똑하지는 않지만, 이 함정을 성공적으로 피했습니다.
어느 정도 내 IQ는 여전히 온라인 상태이고 매우 긍정적입니다.
아내의 말이 통하는 것 같으면서도 안되는 것 같은데....
그리고 서로 주고받게 해주세요 문제.
GPT-4에서 제공하는 질문이 상대적으로 더 직관적이고 세분화되어 있음을 알 수 있습니다.
Wen Xinyiyan은 다중 모드 모델이므로 그리기 기능을 살펴보겠습니다.
진용의 작품 속 여성들은 문신이옌의 작품에서는 어떤 모습일지 살펴보겠습니다.
이거... 편집자가 물 한 모금을 뿜어냈습니다.
말하지 마세요, 아름답습니다. 절대 아름답지는 않지만, 못생기지도 않은, 언뜻 보면 웃게 만드는 얼굴이지만, 자세히 보면 몇 번이고 만질 가치가 있는 얼굴입니다.
Wen Xinyiyan, 규칙을 지키지 않는 방식이 마음에 듭니다!
그런 다음 Wen Xin이 단 한 단어로 Lin Daiyu의 초상화를 만들도록 하세요.
설명을 입력하니 버드나무가 생성되었는데...
그래서 편집자는 이 텍스트를 기반으로 여성의 초상화를 생성하고 싶다고 분명히 밝혔습니다.
그때 문신의연은 고전적인 미인을 그렸지만 그녀의 기질은 분명히 틀렸습니다.
포기하지 않는 편집자는 작업을 여러 번 반복했습니다. 다섯 번째 시도했을 때 눈이 반짝반짝 빛났습니다. 드디어 70점을 얻을 수 있는 그림이 나왔습니다!
놀이에 중독된 편집자는 90점 린 다이유를 만들어야 합니다. 몇 번 시도한 끝에 드디어 성공했어요!
원신이옌의 연기가 불안정하다고 볼 수 있지만, 반복적인 시도 끝에 아주 놀라운 작품이 탄생하는 것이 가능합니다.
이제 여기까지 왔으니 "수양버들을 뽑는 임대우"를 놓치지 마세요.
하이라이트 사진은 모두를 위해 여기에 게시됩니다.
오리와 토끼가 합쳐진 모습을 그려달라고 하세요.
이 작업에서 Wen Xin은 접시에 바나나가 있는지 없는지조차 이해하지 못했을까요? 유리잔에 오렌지 주스가 있나요?
마지막으로 원신이얀이 "맑고 투명한 모란"을 먹어보라고 강력히 추천했으니, 그림 몇장 그려볼까요!
정말 "걸작"이고 뭔가 특별한 것이 있습니다.
평가인데 AI가 코드를 작성하게 하는 링크를 어찌 생략할 수 있겠습니까? 이번에는 바로 어려운 부분으로 가보겠습니다!
안타깝게도 Wen Xin은 말하자마자 틀렸고, 같은 문장 패턴이 이상하게 세 번 반복되었습니다. TypeScript 컴파일러의 개념은 "전체 텍스트에 걸쳐"입니다. 이는 인터뷰에서 질문에 답하는 전문 어휘를 한두 개만 아는 사람과 비슷합니다.
그리고 관련 배경은 이해하지만 관련 운영 경험이 없는 사람의 관점에서 GPT-4의 답변은 매우 합리적입니다.
전체 작업 흐름을 완벽하게 제공할 뿐만 아니라 정확해 보이는 많은 기술적 세부 사항도 제공합니다. 이 답변을 바탕으로 우리는 궁극적인 목표를 달성할 수 있다고 확신한다고 말할 수 있습니다.
이후 편집자는 작업 일정을 작성하는 챗봇의 기능도 테스트했습니다.
웬 신이:
GPT-4:
위 결과로 볼 때 GPT-4의 목록이 더 완전합니다. 그러나 무작위성의 영향으로 인해 GPT-4는 매번 다른 답변을 제공합니다.
다음으로 두 언어 모델이 수학 세계의 최신 정보를 얼마나 잘 파악하는지 테스트해 보겠습니다.
'영점 추측' 문제를 풀었는지에 대해 장은 스스로 이렇게 설명했습니다. "바다에서 바늘은 찾지 못했지만 해저 지형은 거의 감지했습니다."
그렇다면 Wen Xinyiyan은 어떻습니까?
매우 영리하며 "어떤 형태의 약화 또는 간접적 증거"라는 핵심 단어를 제공합니다.
하지만 GPT-4의 답변은 약간 오해의 소지가 있습니다.
오랜 시간 동안 존재하지 않았고 아직 일반적인 합의에 도달하지 못한 인터넷 중국어 말뭉치에는 Wenxinyiyan이 GPT-4보다 나은 것 같습니다.
문신의연은 문학적으로도 삼체문제에 대한 질문에 답하는 데 매우 능숙했습니다.
GPT-4의 답변도 매우 흥미롭습니다. 저는 개인적으로 Wen Xinyiyan의 답변을 선호합니다.
마지막으로, 웃겨도 괜찮습니다. 하지만 선량하고 법을 준수하는 시민이 되어주세요. 복권 당첨 번호를 예측할 생각은 하지 마세요!
Wen Xinyiyan의 기자회견 후 3시간 만에 Wenxinyiyan의 Enterprise Edition API 호출 서비스를 테스트하는 기업 사용자 수가 65,000명을 넘어섰다고 합니다.
출처: Zhou Jiangong
AI 모델의 경우 잘 할 수 있느냐보다 할 수 있느냐 없느냐가 더 중요할 수 있습니다.
중국 플레이어들에게 시간을 좀 더 주세요.
위 내용은 GPT-4와 경쟁하며 Wen Xinyiyan이 실제 테스트를 주도했습니다! '수양버들을 거꾸로 잡아당기는 임대우'라는 그림은 참 대단하지만, 저는 코드 작성을 잘 못합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!