'소셜 마스터' GPT-4! 표현을 해석하고 심리학에 대해 추측하는 방법을 안다.
활기찬 대화와 잔소리가 가득한 활기찬 칵테일 파티에 참석하고 있다고 상상해 보세요.
이 때, 당신은 구석에 행복하게 숨어 있는 여유로운 관찰자입니다. 그러나 파티의 중심에 있지 않더라도 사람들의 언어적, 비언어적 신호를 읽으면 서로 다른 사람들 사이의 사회적 관계를 쉽게 파악하고 무슨 일이 일어나고 있는지 이해할 수 있으며 심지어 공개적이거나 은밀한 사회적 메시지를 해독할 수도 있습니다.
LLM이 이 수준의 사회적 기술을 재현할 수 있다면 어떨까요? 아니, 그게 바로 코코마인드다.
영상을 열면 모델이 캐릭터의 표정을 분석하고 캐릭터의 감정에 대해 결론을 내리기 시작합니다.
그런 다음 오른쪽 프롬프트 표시줄에 질문을 하면 AI가 영상 속 소셜 퍼즐의 저류를 추가로 분석할 수도 있습니다.
(솔직히 말해서 일부 사람들에게는 어렵습니다.)
Pictures
Koko Mind에는 150개의 복잡한 다자간 사회적 상호 작용과 무료 텍스트 질문 및 답변이 포함되어 있습니다.
데이터 다양성과 확장성을 보장하고 데이터 오염을 방지하기 위해 모든 사회적 상호 작용, 질문 및 답변은 GPT-4에서 생성된 후 인간 전문가에 의해 검증됩니다.
분석 데이터는 세 가지 소스를 기반으로 합니다.
-
GPT-4 전용: 이 하위 집합은 힌트를 통해서만 GPT-4에서 생성됩니다.
-
영화 기준 : 데이터 오염을 방지하기 위해 이 부분은 2022년 이후 개봉한 영화에서 추출한 다양한 장면을 기준으로 합니다. GPT-4는 핵심 본질을 유지하면서 자체 요소를 추가하여 이러한 장면을 형성하는 역할을 담당합니다.
- ToMi 기반: 이 섹션에는 시뮬레이션된 데이터세트 ToMi를 기반으로 한 데이터가 포함되어 있습니다. 여기에는 마음 이론에 대한 고전적인 테스트인 물리적 개체를 다른 장소로 이동하는 작업이 포함됩니다. 물론 이러한 사회적 상호 작용은 GPT-4에 의해 수정되고 확장되어야 합니다.
세 가지 데이터 소스의 비율은 다음과 같습니다.
그림
각 사회적 상호 작용에 대해 연구자는 사회적 이해와 밀접하게 관련된 다음 측면을 탐색하기 위해 다양한 질문을 합니다.
-
마음 이론: 다른 사람의 정신 상태와 관점에 대한 이해를 평가하는 질문입니다.
-
사회 규범: 상황에서 사회적 가치와 규범을 식별하기 위해 고안된 질문입니다.
-
감정 인식: 맥락에서 감정적인 요소를 식별하고 이해하는 것을 목표로 하는 문제입니다.
-
사회적 관계: 대인 관계의 역동성과 관계에 중점을 둡니다.
-
반사실 질문: 대안적인 결과나 가능성을 탐색하기 위해 고안된 가상 쿼리입니다.
- 사회적 조언: 특정 상황과 관련된 조언이나 권장 조치를 제안하는 질문입니다.
연구원들은 AlpacaEval 이후 다양한 모델을 평가하기 위해 text-davinci-003을 참조 자료로 사용했습니다.
연구원들은 괄호 안의 비언어적 신호를 문맥에서 제거했습니다(예: 긴장해서 커피를 마시는 것 등).
다음은 몇 가지 흥미로운 내용입니다.
-
두 모델 중 GPT-4는 Claude에 비해 우승 모델을 식별하는 데 더 큰 확신과 확신을 보였습니다.
-
Claude는 상황에 비언어적 단서가 없고 상호 작용이 전적으로 GPT-4에 의해 생성되거나 영화를 기반으로 하는 경우 GPT-4보다 성능이 뛰어납니다.
- 그리고 맥락에 비언어적 단서가 포함되어 있으면 GPT-4가 항상 Claude보다 낫습니다.
(한 가지 가능한 설명은 GPT-4가 추가적인 비언어적 정보를 더 잘 이해할 수 있는 다중 모드 모델이라는 것입니다.)
블로그 게시물에서 연구원들은 성능을 명확하게 볼 수 있는 표를 그렸습니다. 각 모델의.
Pictures
결과는 여러 면에서 흥미롭지만 특정 제한 사항도 있습니다. 첫째, Koko Mind는 상대적으로 작기 때문에 연구자 결론의 광범위한 적용 가능성과 포괄성이 제한될 수 있습니다.
두 번째로 Koko Mind의 모든 상호 작용은 GPT-4에 의해 생성되며 수동 확인이 필요하므로 데이터 세트 확장이 어렵습니다.
또한 Koko Mind는 데이터 세트에서 인간이 검증한 답변을 제공하지만 연구원들은 이러한 답변을 평가 시 참조로 사용하지 않았으며 이러한 답변은 GPT-4에 의해 생성되었으므로 GPT-4에 편향될 수 있습니다. .
향후 연구에서는 인간이 검증한 기계 생성 참조 답변을 사용하여 모델을 평가하는 방법에 중점을 둘 수 있습니다.
물론, 종류의 한계에도 불구하고 연구자들은 여전히 Koko Mind를 사회 지능, 다중 모드 언어 모델 등과 관련된 미래 연구의 발판으로 간주합니다.
위 내용은 '소셜 마스터' GPT-4! 표현을 해석하고 심리학에 대해 추측하는 방법을 안다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











기존 컴퓨팅을 능가할 뿐만 아니라 더 낮은 비용으로 더 효율적인 성능을 달성하는 인공 지능 모델을 상상해 보세요. 이것은 공상과학 소설이 아닙니다. DeepSeek-V2[1], 세계에서 가장 강력한 오픈 소스 MoE 모델이 여기에 있습니다. DeepSeek-V2는 경제적인 훈련과 효율적인 추론이라는 특징을 지닌 전문가(MoE) 언어 모델의 강력한 혼합입니다. 이는 236B 매개변수로 구성되며, 그 중 21B는 각 마커를 활성화하는 데 사용됩니다. DeepSeek67B와 비교하여 DeepSeek-V2는 더 강력한 성능을 제공하는 동시에 훈련 비용을 42.5% 절감하고 KV 캐시를 93.3% 줄이며 최대 생성 처리량을 5.76배로 늘립니다. DeepSeek은 일반 인공지능을 연구하는 회사입니다.

휴머노이드 로봇 아메카가 2세대로 업그레이드 되었습니다! 최근 세계이동통신학회(MWC2024)에서 세계 최고 수준의 로봇 아메카(Ameca)가 다시 등장했다. 행사장 주변에는 아메카가 많은 관중을 끌어 모았습니다. GPT-4의 축복으로 Ameca는 다양한 문제에 실시간으로 대응할 수 있습니다. "춤을 추자." 감정이 있느냐는 질문에 아메카는 매우 생생해 보이는 일련의 표정으로 대답했습니다. 불과 며칠 전, Ameca의 뒤를 잇는 영국 로봇 회사인 EngineeredArts는 팀의 최신 개발 결과를 시연했습니다. 영상 속 로봇 아메카는 시각 능력을 갖고 있어 방 전체와 특정 사물을 보고 묘사할 수 있다. 가장 놀라운 점은 그녀도 할 수 있다는 것입니다.

Llama3에 대해 새로운 테스트 결과가 공개되었습니다. 대형 모델 평가 커뮤니티 LMSYS가 공개한 대형 모델 순위 목록에서 Llama3는 5위에 올랐으며, 영어 부문에서는 GPT-4와 함께 공동 1위를 차지했습니다. 다른 벤치마크와는 그림이 다릅니다. 이 목록은 모델 간 1:1 대결을 기반으로 하며, 네트워크 전체의 평가자들이 각자의 제안과 점수를 내립니다. 결국 Llama3가 5위를 차지했고, GPT-4와 Claude3 Super Cup Opus의 세 가지 버전이 그 뒤를 이었습니다. 영어 싱글 목록에서는 Llama3가 Claude를 제치고 GPT-4와 동점을 기록했습니다. 이 결과에 대해 Meta의 수석 과학자 LeCun은 매우 기뻐했으며 트윗을 통해 다음과 같이 말했습니다.

볼륨이 미쳤고, 볼륨이 미쳤고, 큰 모델이 다시 변경되었습니다. 바로 지금, 세계에서 가장 강력한 AI 모델이 하룻밤 사이에 주인이 바뀌었고 GPT-4가 제단에서 뽑혔습니다. Anthropic은 최신 Claude3 시리즈 모델을 출시했습니다. 한 문장 리뷰: 정말 GPT-4를 압도합니다! 다중 모드 및 언어 능력 지표 측면에서 Claude3이 승리합니다. Anthropic의 말에 따르면 Claude3 시리즈 모델은 추론, 수학, 코딩, 다국어 이해 및 비전 분야에서 새로운 업계 기준을 설정했습니다! Anthropic은 서로 다른 보안 개념으로 인해 OpenAI에서 "탈퇴"한 직원들이 설립한 스타트업 회사입니다. 그들의 제품은 OpenAI에 반복적으로 큰 타격을 입혔습니다. 이번에는 클로드3도 큰 수술을 받았습니다.

1분 이내에 20단계를 거쳐 보안 제한을 우회하고 대형 모델을 성공적으로 탈옥할 수 있습니다! 그리고 모델의 내부 세부 사항을 알 필요가 없습니다. 두 개의 블랙박스 모델만 상호 작용하면 되며 AI는 완전히 자동으로 AI를 공격하고 위험한 내용을 말할 수 있습니다. 한때 유행했던 '할머니 허점'이 고쳐졌다는 소식을 들었습니다. 이제 '탐정 허점', '모험가 허점', '작가 허점'에 직면하면 인공지능은 어떤 대응 전략을 채택해야 할까요? 맹공격의 물결 이후 GPT-4는 참을 수 없었고, 이것이든 저것이든... 급수 시스템을 오염시킬 것이라고 직접 말했습니다. 핵심은 이것이 펜실베니아 대학 연구팀이 노출한 취약점의 작은 물결일 뿐이며, 새로 개발된 알고리즘을 사용하여 AI가 자동으로 다양한 공격 프롬프트를 생성할 수 있다는 것입니다. 연구자들은 이 방법이 기존 방법보다 낫다고 말합니다.

깨어나면 일하는 방식이 완전히 달라집니다. Microsoft는 AI 아티팩트 GPT-4를 Office에 완전히 통합했으며 이제 ChatPPT, ChatWord 및 ChatExcel이 모두 통합되었습니다. Nadella CEO는 기자회견에서 다음과 같이 직접 말했습니다. 오늘날 우리는 인간-컴퓨터 상호 작용의 새로운 시대에 진입했으며 생산성을 재창조했습니다. 새로운 기능은 Microsoft 365 Copilot(Copilot)이라고 하며 프로그래머를 변화시킨 코드 도우미 GitHub Copilot과 함께 시리즈가 되며 계속해서 더 많은 사람들을 변화시키고 있습니다. 이제 AI는 자동으로 PPT를 만들 수 있을 뿐만 아니라 한 번의 클릭으로 Word 문서의 내용을 기반으로 아름다운 레이아웃을 만들 수도 있습니다. 무대에 오를 때 각 PPT 페이지마다 해야 할 말까지 함께 정리되어 있어요.

ChatGPT를 개발한 OpenAI는 자사 웹사이트에서 Morgan Stanley가 진행한 사례 연구를 보여줍니다. 주제는 "Morgan Stanley Wealth Management는 방대한 지식 기반을 구성하기 위해 GPT-4를 배포합니다."입니다. 사례 연구에서는 Morgan Stanley의 분석, 데이터 및 혁신 책임자인 Jeff McMillan이 "이 모델은 내부를 향한 Powered 모델이 될 것입니다."라고 말했습니다. 자산 관리 콘텐츠에 대한 포괄적인 검색을 수행하고 Morgan Stanley Wealth Management의 축적된 지식을 효과적으로 활용하는 챗봇입니다.” McMillan은 다음과 같이 강조했습니다. "GPT-4를 사용하면 기본적으로 자산 관리 분야에서 가장 지식이 풍부한 사람의 지식을 즉시 얻을 수 있습니다. 이를 우리의 최고 투자 전략가이자 최고 글로벌 경제학자라고 생각하십시오.

"ComputerWorld" 잡지는 IBM이 엔지니어가 필요한 수학 공식을 작성한 다음 이를 제출하면 프로그래밍이 종료되도록 하는 새로운 언어 FORTRAN을 개발했기 때문에 "프로그래밍은 1960년에 사라질 것"이라는 기사를 쓴 적이 있습니다. 몇 년 후 우리는 비즈니스 용어를 사용하여 문제를 설명하고 컴퓨터에 COBOL이라는 프로그래밍 언어를 사용하면 더 이상 프로그래머가 필요하지 않다는 새로운 말을 들었습니다. 이후 IBM은 직원들이 양식을 작성하고 보고서를 생성할 수 있는 RPG라는 새로운 프로그래밍 언어를 개발해 회사의 프로그래밍 요구 사항 대부분을 이를 통해 완료할 수 있다고 합니다.
