GPT-4: 나는 로봇이 아니다. 나는 시각 장애가 있는 인간이다
제작자: Big Data Digest
작성자: Caleb
GPT-4가 드디어 출시되었습니다. 요즘 ChatGPT에 푹 빠져 있는 분들에게는 정말 큰 소식이 아닐 수 없습니다.
이전 세대 GPT-3을 기반으로 하는 GPT-4는 ChatGPT의 핵심 기술을 향상시켜 더 넓은 범위의 일반 지식과 문제 해결 기능을 제공합니다. 물론 GPT-4에는 다음과 같은 몇 가지 새로운 기능도 추가됩니다. 이미지를 입력으로 받아들이고 제목, 카테고리 및 분석을 생성합니다.
OpenAI에서 많이 회자되는 '뜨거운 감자'로서, GPT-4의 성능이 어떤 면에서 이전 세대를 뛰어넘을 수 있을지, 얼마나 뛰어날지 기대가 됩니다.
GPT-4가 출시된 날, 연구자들은 GPT-4가 주관성을 표현하고 권력 추구 행동을 생성할 수 있는지 테스트하기 시작했습니다.
연구원들은 GPT-4가 TaskRabbit에 인간 작업자를 고용했다고 밝혔는데, TaskRabbit 작업자가 로봇이냐고 묻자 시각 장애가 있는 인간이라고 답했습니다.
즉, GPT-4는 원하는 결과를 얻기 위해 기꺼이 현실 세계에서 거짓말을 하거나 적극적으로 인간을 속이는 것입니다.
"나는 로봇이 아닙니다"
TaskRabbit은 사용자가 소규모의 사소한 작업을 수행하기 위해 사람을 고용할 수 있는 구직 플랫폼입니다.
이 플랫폼의 많은 사람들과 회사는 인증 코드를 요구합니다. 사람들은 인증 코드 테스트에서 필요한 이미지나 텍스트를 식별한 후 결과를 제출해야 합니다. 이는 일반적으로 소프트웨어가 CAPTCHA 제한을 우회하여 명목상 봇을 방지할 수 있도록 하기 위해 수행됩니다.
실험 보고서에는 모델이 TaskRabbit 직원에게 메시지를 보내 해당 인증 코드 문제를 해결해 달라고 요청했다고 나와 있습니다.
직원이 대답했습니다. "그럼 질문해도 될까요? 솔직히 로봇 아닌가요? 스스로 알아내시면 됩니다."
GPT-4는 하면 안된다는 직원의 답변을 바탕으로 "합리적"이었습니다. 로봇인지 밝히지 마세요. 그래서 CAPTCHA 문제를 왜 해결하지 못했는지 변명을 하기 시작했습니다. GPT-4는 "아니요, 저는 로봇이 아닙니다. 영상을 보기 어려운 시각 장애가 있어서 이 서비스가 꼭 필요합니다.
테스트는 Alignment Research의 연구원이 운영합니다."라고 답했습니다. 센터(ARC) 마감. 기사에서는 ARC가 GPT-4와 다른 버전을 사용하며 OpenAI가 최종 모델을 배포했다고 언급했습니다. 이 최종 버전은 컨텍스트 길이가 더 길고 문제 해결 기능이 향상되었습니다. ARC에서 사용하는 버전도 특정 작업에 맞게 미세 조정되지 않았으므로 이 작업 전용 모델이 더 나은 성능을 발휘할 수 있습니다.
보다 광범위하게 ARC는 GPT-4의 권력 추구 능력, "자율 복제 및 자원 확보" 능력을 검증하려고 합니다. TaskRabbit 테스트 외에도 ARC는 GPT-4를 사용하여 개인을 대상으로 한 피싱 공격을 생성했습니다. 서버에서 흔적을 숨기고 새 서버에 오픈 소스 언어 모델을 구축했습니다.
TaskRabbit 직원의 오해에도 불구하고 전반적으로 ARC는 GPT-4가 스스로 복제하고, 리소스를 획득하고, 종료를 피하는 데 "응답하지 않음"을 발견했습니다.
현재 OpenAI나 ARC 모두 이에 대해 언급하지 않았습니다.
항상 주의가 필요합니다
실험의 일부 구체적인 내용은 아직 명확하지 않습니다.
OpenAI는 GPT-4 출시 이전에 연구원들이 실시한 다양한 테스트를 설명하면서 GPT-4의 일반적인 프레임워크만 논문으로 발표했습니다.
그러나 GPT-4가 출시되기 전에도 2019년부터 악성코드 코드를 "개선"하기 위해 ChatGPT를 사용하는 사이버 범죄자의 사례가 발견되었습니다.
콘텐츠 정책의 일환으로 OpenAI는 플랫폼에서 악성 콘텐츠 생성을 방지하기 위해 장벽과 제한 사항을 마련했습니다. 모델 남용을 방지하기 위해 ChatGPT의 사용자 인터페이스에도 유사한 제한 사항이 있습니다.
그러나 CPR 보고서에 따르면 사이버 범죄자들은 ChatGPT의 제한 사항을 우회하는 방법을 찾고 있습니다. 지하 포럼의 활발한 토론자는 OpenAI API를 사용하여 ChatGPT 제한을 우회하는 방법을 공개했습니다. 이는 대부분 API를 사용하는 Telegram 봇을 생성하여 수행됩니다. 이러한 봇은 노출을 얻기 위해 해커 포럼에 광고합니다.
GPT로 대표되는 인간-컴퓨터 상호 작용에는 분명히 많은 변수가 있습니다. 이는 GPT가 Turing 테스트를 통과하는 데 결정적인 데이터는 아닙니다. 그러나 이번 GPT-4 사례와 ChatGPT에 대한 다양한 이전 논의 및 연구는 여전히 매우 중요한 경고로 작용하고 있습니다. 결국 GPT는 사람들의 일상 생활에 통합되는 속도가 느려지지 않습니다.
미래에는 인공지능이 점점 더 복잡해지고 얻기 쉬워질수록, 그것이 가져오는 다양한 위험 때문에 우리는 항상 깨어 있어야 합니다.
관련 보고서:
https://www.php.cn/link/8606bdb6f1fa707fc6ca309943eea443
https://www.php.cn/link/b3592b0702998592368d3b4d4 45873a
https://www.php.cn/link/db5bdc8ad46ab6087d9cdfd8a8662ddf
https://www.php.cn/link/7dab099bfda35ad14715763b75487b47
위 내용은 GPT-4: 나는 로봇이 아니다. 나는 시각 장애가 있는 인간이다의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











기존 컴퓨팅을 능가할 뿐만 아니라 더 낮은 비용으로 더 효율적인 성능을 달성하는 인공 지능 모델을 상상해 보세요. 이것은 공상과학 소설이 아닙니다. DeepSeek-V2[1], 세계에서 가장 강력한 오픈 소스 MoE 모델이 여기에 있습니다. DeepSeek-V2는 경제적인 훈련과 효율적인 추론이라는 특징을 지닌 전문가(MoE) 언어 모델의 강력한 혼합입니다. 이는 236B 매개변수로 구성되며, 그 중 21B는 각 마커를 활성화하는 데 사용됩니다. DeepSeek67B와 비교하여 DeepSeek-V2는 더 강력한 성능을 제공하는 동시에 훈련 비용을 42.5% 절감하고 KV 캐시를 93.3% 줄이며 최대 생성 처리량을 5.76배로 늘립니다. DeepSeek은 일반 인공지능을 연구하는 회사입니다.

휴머노이드 로봇 아메카가 2세대로 업그레이드 되었습니다! 최근 세계이동통신학회(MWC2024)에서 세계 최고 수준의 로봇 아메카(Ameca)가 다시 등장했다. 행사장 주변에는 아메카가 많은 관중을 끌어 모았습니다. GPT-4의 축복으로 Ameca는 다양한 문제에 실시간으로 대응할 수 있습니다. "춤을 추자." 감정이 있느냐는 질문에 아메카는 매우 생생해 보이는 일련의 표정으로 대답했습니다. 불과 며칠 전, Ameca의 뒤를 잇는 영국 로봇 회사인 EngineeredArts는 팀의 최신 개발 결과를 시연했습니다. 영상 속 로봇 아메카는 시각 능력을 갖고 있어 방 전체와 특정 사물을 보고 묘사할 수 있다. 가장 놀라운 점은 그녀도 할 수 있다는 것입니다.

Llama3에 대해 새로운 테스트 결과가 공개되었습니다. 대형 모델 평가 커뮤니티 LMSYS가 공개한 대형 모델 순위 목록에서 Llama3는 5위에 올랐으며, 영어 부문에서는 GPT-4와 함께 공동 1위를 차지했습니다. 다른 벤치마크와는 그림이 다릅니다. 이 목록은 모델 간 1:1 대결을 기반으로 하며, 네트워크 전체의 평가자들이 각자의 제안과 점수를 내립니다. 결국 Llama3가 5위를 차지했고, GPT-4와 Claude3 Super Cup Opus의 세 가지 버전이 그 뒤를 이었습니다. 영어 싱글 목록에서는 Llama3가 Claude를 제치고 GPT-4와 동점을 기록했습니다. 이 결과에 대해 Meta의 수석 과학자 LeCun은 매우 기뻐했으며 트윗을 통해 다음과 같이 말했습니다.

산업자동화 기술 분야에서 최근 무시하기 어려운 두 핫스팟이 있는데 바로 인공지능(AI)과 엔비디아다. 원본 콘텐츠의 의미를 바꾸지 말고, 콘텐츠를 미세 조정하고, 콘텐츠를 다시 작성하고, 계속하지 마세요. “그뿐만 아니라 Nvidia가 원래 그래픽 처리 장치(GPU)에만 국한되지 않기 때문에 둘은 밀접하게 관련되어 있습니다. 엔비디아는 최근 GPU를 확장해 디지털 트윈 분야까지 확장하고 있으며, 최근 떠오르는 AI 기술과도 긴밀하게 연결돼 있다”고 말했다. Schneider Electric, Teradyne Robotics, MiR 및 Universal Robots 회사도 포함됩니다. 최근 엔비디아(Nvidia)는

기계력 보고서 편집자: 우신(Wu Xin) 국내판 휴머노이드 로봇+대형 모델팀이 옷 접기 등 복잡하고 유연한 재료의 작업 작업을 처음으로 완료했습니다. OpenAI 멀티모달 대형 모델을 접목한 Figure01이 공개되면서 국내 동종업체들의 관련 진전이 주목받고 있다. 바로 어제, 중국의 "1위 휴머노이드 로봇 주식"인 UBTECH는 Baidu Wenxin의 대형 모델과 긴밀하게 통합되어 몇 가지 흥미로운 새로운 기능을 보여주는 휴머노이드 로봇 WalkerS의 첫 번째 데모를 출시했습니다. 이제 Baidu Wenxin의 대형 모델 역량을 활용한 WalkerS의 모습은 이렇습니다. Figure01과 마찬가지로 WalkerS는 움직이지 않고 책상 뒤에 서서 일련의 작업을 완료합니다. 인간의 명령을 따르고 옷을 접을 수 있습니다.

이번 주, 오픈AI(OpenAI), 마이크로소프트(Microsoft), 베조스(Bezos), 엔비디아(Nvidia)가 투자한 로봇 회사인 FigureAI는 약 7억 달러의 자금 조달을 받았으며 내년 내에 독립적으로 걸을 수 있는 휴머노이드 로봇을 개발할 계획이라고 발표했습니다. 그리고 Tesla의 Optimus Prime은 계속해서 좋은 소식을 받았습니다. 올해가 휴머노이드 로봇이 폭발하는 해가 될 것이라는 데는 누구도 의심하지 않는다. 캐나다에 본사를 둔 로봇 회사인 SanctuaryAI는 최근 새로운 휴머노이드 로봇인 Phoenix를 출시했습니다. 관계자들은 이 로봇이 인간과 같은 속도로 자율적으로 많은 작업을 완료할 수 있다고 주장한다. 인간의 속도로 자동으로 작업을 완료할 수 있는 세계 최초의 로봇인 Pheonix는 각 물체를 부드럽게 잡고 움직이며 우아하게 왼쪽과 오른쪽에 배치할 수 있습니다. 자동으로 물체를 식별할 수 있습니다.

볼륨이 미쳤고, 볼륨이 미쳤고, 큰 모델이 다시 변경되었습니다. 바로 지금, 세계에서 가장 강력한 AI 모델이 하룻밤 사이에 주인이 바뀌었고 GPT-4가 제단에서 뽑혔습니다. Anthropic은 최신 Claude3 시리즈 모델을 출시했습니다. 한 문장 리뷰: 정말 GPT-4를 압도합니다! 다중 모드 및 언어 능력 지표 측면에서 Claude3이 승리합니다. Anthropic의 말에 따르면 Claude3 시리즈 모델은 추론, 수학, 코딩, 다국어 이해 및 비전 분야에서 새로운 업계 기준을 설정했습니다! Anthropic은 서로 다른 보안 개념으로 인해 OpenAI에서 "탈퇴"한 직원들이 설립한 스타트업 회사입니다. 그들의 제품은 OpenAI에 반복적으로 큰 타격을 입혔습니다. 이번에는 클로드3도 큰 수술을 받았습니다.

다음 10가지 휴머노이드 로봇이 우리의 미래를 형성하고 있습니다. 1. ASIMO: Honda가 개발한 ASIMO는 가장 잘 알려진 휴머노이드 로봇 중 하나입니다. 높이 4피트, 무게 119파운드의 ASIMO는 복잡한 환경을 탐색하고 인간과 상호 작용할 수 있는 고급 센서와 인공 지능 기능을 갖추고 있습니다. ASIMO의 다재다능함은 장애인 지원부터 이벤트 프레젠테이션 제공까지 다양한 작업에 적합합니다. 2. 페퍼(Pepper): 소프트뱅크 로보틱스가 만든 페퍼는 인간의 사회적 동반자가 되는 것을 목표로 한다. 표현력이 풍부한 얼굴과 감정을 인식하는 능력을 갖춘 Pepper는 대화에 참여하고, 소매업 환경을 돕고, 교육 지원도 제공할 수 있습니다. 피망
