ChatGPT 출시 이후 신경망 작성, 스마트 스피커 제작 등 ChatGPT의 기능은 사람들에 의해 지속적으로 잠금 해제되었습니다. 시험 기간 동안 사람들은 수학적 능력이 ChatGPT의 주요 단점이며 단순한 "같은 우리 안에 있는 닭과 토끼" 문제라도 잘못 계산될 수 있다는 사실을 점차적으로 발견했습니다.
아마도 이를 염두에 두고 ChatGPT는 "진정성"과 "수학적 능력" 향상이라는 중요한 업데이트를 방금 발표했습니다.
이번 ChatGPT는 작년 11월 출시 이후 세 번째 업데이트입니다. 하지만 "업데이트 설명"이 너무 모호하기 때문에 여전히 새로운 기능을 탐색하는 과정을 거쳐야 합니다.
얼마 전, 컴퓨터 과학자이자 Wolfram 언어의 아버지인 Stephen Wolfram은 과학 및 엔지니어링 인공물인 Wolfram|Alpha를 ChatGPT와 결합하여 ChatGPT에 슈퍼 컴퓨팅 지식을 주입하여 서로를 보완했는데 효과가 꽤 좋습니다.
이 업데이트 이후 ChatGPT의 수학 능력이 ChatGPT와 경쟁할 수 있을까요?
... 비교 결과가 만족스럽지 않은 것 같습니다.
"신경망은 여기에 사용되지 않는다고밖에 말할 수 없습니다", Sebastian Raschka는 무력감을 느꼈습니다.
어떤 사람들은 업그레이드된 ChatGPT가 "점점 심술궂어졌다"는 사실도 발견했습니다.
"어떤 선생님이 수학을 가르쳤나요?" 마치 부모가 자녀의 숙제를 도와주는 것과 같습니다.
이건 '우연한 현상'이 아닐까요? 수학은 정말 어려운 것 같아요.
어쨌든 앞으로도 흥미로운 데모가 많이 나올 것으로 기대하겠습니다.
“기업이 OpenAI의 API를 사용하여 ChatGPT를 기반으로 구축할 수 있게 되면 향후 6~12개월 동안 폭발적인 실험이 이루어질 것입니다. 지식 관리에 대한 생성 AI의 영향 Nicola Morini Bianzino.
최근 공개 행사에서 Ernst & Young의 글로벌 CTO인 Nicola Morini Bianzino는 현재 기업에서 ChatGPT를 사용하는 "킬러" 사용 사례가 없다고 말했습니다. 그러나 이는 곧 바뀔 수 있으며, 특히 기업이 OpenAI의 API를 사용하여 ChatGPT를 구축할 수 있게 되면 향후 6~12개월 동안 많은 실험이 이루어질 것이라고 예측합니다.Bianzino는 생성 AI가 지식 관리에 미치는 영향을 "AI의 변증법"이라고 설명합니다. "지식 기업은 지식을 매우 평면적이고 2차원적인 방식으로 저장하는 경향이 있어 접근, 상호 작용 및 대화가 어렵습니다. 우리는 20년, 30년, 40년 전에 전문가 시스템을 구축하려고 시도했습니다. 잘 진행되지 않았습니다. 나는 이 기술이 전문가 시스템의 많은 문제를 극복할 수 있는 잠재력을 가지고 있다고 생각합니다.”라고 Nicola Morini Bianzino는 말했습니다.
동시에 ChatGPT 경쟁자도 등장하고 있으며 트랙은 점점 더 "볼륨"이 커지고 있습니다. Anthropic의 Claude, DeepMind의 Sparrow, Google의 LaMDA부터 Character AI까지 매일매일 새로운 경쟁자들이 등장하는 것 같습니다.
Anthropic 은 OpenAI를 떠난 여러 연구자들이 2021년에 설립한 샌프란시스코 스타트업입니다. 회사는 창립된 지 1년이 채 안 되어 무려 5억 8천만 달러의 자금 조달을 발표했으며, 금요일에는 추가로 3억 달러의 자금 조달을 앞두고 있는 것으로 알려졌습니다.
이 회사는 현재 Slack 통합을 통해 비공개 베타 버전으로 제공되는 "Claude"라는 AI 챗봇을 개발했으며 ChatGPT와 유사하고 일부 개선된 것으로 알려졌습니다. Anthropic은 자사의 사명을 "신뢰할 수 있고 설명 가능하며 제어 가능한 AI 시스템을 구축하는 데 전념"한다고 설명합니다.
DeepMind 역시 이 트랙에서는 무시할 수 없는 힘입니다. 이 회사는 지난 9월 논문에서 "Sparrow"를 소개했는데, 이는 "더 안전하고 편견이 덜한 기계 학습 시스템을 만드는 중요한 단계"라고 환영했습니다. Sparrow는 "안전하지 않고 부적절한 답변의 위험을 줄이는 유용한 대화 에이전트"이며 "사용자와 대화하고, 질문에 답변하고, 증거를 찾는 데 도움을 주도록" 설계되었습니다.
그러나 DeepMind의 보안 연구원이자 Sparrow 논문의 주요 저자인 Geoffrey Irving은 DeepMind가 Sparrow를 아직 배포할 준비가 되지 않은 연구 기반 개념 증명 모델로 간주한다고 말했습니다.
2주 전 TIME 기사에서 회사의 CEO이자 공동 창립자인 Demis Hassabis는 DeepMind가 2023년 언젠가 챗봇 Sparrow의 "비공개 베타" 출시를 고려하고 있다고 말했습니다. 이를 통해 회사는 ChatGPT에는 없는 기능인 출처 인용과 같은 강화 학습 기반 기능을 개발할 수 있습니다.
Google의 LaMDA에 대해 말하자면, 이 모델은 지난 여름 열띤 토론을 불러일으켰습니다. Google 엔지니어 Blake Lemoine은 LaMDA에 지각 능력이 있다고 주장했다는 이유로 해고되었습니다.
Lemoine이 생각하는 것처럼은 아니더라도 LaMDA는 여전히 ChatGPT의 가장 큰 경쟁자 중 하나로 간주됩니다. Google은 2021년 블로그 게시물에서 LaMDA의 대화 기술이 "만드는 데 수년이 걸렸다"고 말했습니다. ChatGPT와 마찬가지로 LaMDA는 Transformer 아키텍처를 기반으로 구축되었으며 대화에 대한 교육도 받았습니다.
Google에 따르면, "LaMDA는 훈련 중에 열린 대화를 다른 형태의 언어와 구별하는 몇 가지 뉘앙스를 발견했습니다."
New York Times는 1월 20일에 보도했습니다. 보고서에 따르면 Google 창립자 Larry Page는 Sergey Brin은 지난 달 회사 경영진과 만나 ChatGPT가 Google의 1,490억 달러 규모 검색 사업에 미칠 수 있는 위협에 대해 논의했습니다. 구글 대변인은 성명을 통해 "우리는 AI 기술이 유용하고 안전한지 확인하기 위해 내부적으로 계속 테스트하고 있으며 조만간 외부 세계와 더 많은 경험을 공유할 수 있기를 기대한다"고 말했다.
Character AI는 Transformer paper의 저자 중 한 명인 Noam Shazeer가 설립한 회사로 점차 유명해졌습니다. 회사의 AI 챗봇 기술을 통해 사용자는 엘리자베스 여왕, 셰익스피어와 같은 역사적 인물을 모방하여 누구와도 채팅하거나 역할극을 할 수 있습니다. 이 기술은 현재 무료로 사용할 수 있으며, 캐릭터는 "사용자가 어떻게 상호 작용하는지 연구하고 구체적인 수익 창출 계획을 수립"하고 있습니다.
바이두가 ChatGPT와 유사한 챗봇을 출시할 것이라는 소문이 있습니다. 더욱이 로이터, 블룸버그 등 외신의 보도에 따르면 바이두는 오픈AI의 ChatGPT와 유사한 인공지능 챗봇 서비스를 3월 출시할 계획이다.
소식통에 따르면 Baidu는 사용자가 검색을 요청할 때 링크뿐 아니라 챗봇이 생성한 결과도 통합할 계획이라고 합니다. "아직 이름이 지정되지 않은 이 도구는 기본 검색 서비스에 포함되어 사용자에게 대화형 검색 결과를 반환합니다."
지난해 12월 내부 토론에서 Baidu CEO Robin Li는 ChatGPT에 대한 자신의 견해를 다음과 같이 밝혔습니다. "이런 멋진 기술을 모든 사람이 필요로 하는 제품으로 바꾸는 것"이 가장 어려운 일입니다. Baidu가 밝은 미래를 누릴 수 있기를 바랍니다. 새해에는 "적어도 기대 이상의 고성장, 혁신 사업을 할 수 있을 것입니다."
1월 30일 과학기술혁신위원회 데일리 보고서에 따르면 바이두는 ChatGPT와 유사한 챗봇을 출시할 내부 계획을 갖고 있지만 구체적인 시기는 정확하지 않습니다. Baidu CEO인 Robin Li는 이 프로젝트를 "검색 경험의 세대 간 변화를 주도하는 것"으로 평가합니다. 그는 내부적으로 관련 기술이 임계점에 도달했고 바이두는 그 안에서 더 큰 기회를 갖고 있다고 지적했다.
ChatGPT는 강력하지만 학교 과제, 종이 출판 및 기타 분야에서의 남용으로 인해 광범위한 우려가 제기되었습니다. 따라서 학계에서는 ChatGPT와 같은 LLM(대형 언어 모델)에서 생성된 텍스트를 감지하는 방법과 도구를 탐색하기 시작했습니다.
메릴랜드 대학의 몇몇 연구원들은 ChatGPT와 같은 언어 모델에서 출력되는 워터마크를 연구했습니다. "대규모 언어 모델을 위한 워터마크"라는 논문에서 워터마크 삽입은 텍스트 품질에 미미한 영향을 미치며 언어 모델의 API나 매개변수에 액세스하지 않고도 효율적인 오픈 소스 알고리즘을 사용하여 감지할 수 있는 효율적인 워터마크 프레임워크를 제안했습니다.
우리의 방법은 상대적으로 짧은 합성 텍스트(최소 25개 토큰)를 감지할 수 있지만 인간 텍스트를 기계 생성 텍스트로 분류하는 것은 통계적으로 불가능합니다.
논문 주소: https://arxiv.org/pdf/2301.10226v1.pdf
Stanford University여러 연구자들이 "DetectGPT: Zero-Shot Machine-Generated"라는 논문을 발표했습니다. 확률 곡률을 이용한 텍스트 탐지"에서는 LLM에서 샘플링된 텍스트가 모델 로그 확률 함수의 음의 곡률 영역을 차지하는 경향이 있음이 입증되었습니다. 이 관찰을 활용하여 그들은 주어진 LLM에 의해 통로가 생성되었는지 여부를 결정하기 위해 새로운 곡률 기반 기준을 정의했습니다.
연구원들은 별도의 분류기를 훈련하고, 실제 또는 생성된 구절의 데이터 세트를 수집하고, 생성된 텍스트에 명시적으로 워터마킹할 필요가 없는 그들의 방법을 DetectGPT라고 부릅니다. DetectGPT는 관심 모델과 사전 훈련된 다른 범용 언어 모델(예: T5)로 계산된 로그 확률만을 사용하여 단락의 무작위 섭동을 생성합니다.
결과에 따르면 DetectGPT는 현재 모델 샘플 탐지의 제로 샘플 방식보다 더 식별력이 뛰어나며, 특히 20B 매개변수 GPT-NeoX에서 생성된 가짜 뉴스 보고서 탐지가 가장 강력한 제로 샘플의 0.81 AUROC에서 향상되었습니다. 샘플 기준선을 0.95 AUROC로 설정합니다. 코드와 데이터는 향후 공개될 예정입니다.
DetectGPT GPT-3 생성 텍스트를 감지하는 회로도.
논문 주소: https://arxiv.org/abs/2301.11305
논문 형태로 제시된 탐지 솔루션 외에도 강력한 탐지 도구를 출시한 개인도 있습니다. 예를 들어, ChatGPT 감지기 작업을 하는 Hive AI의 ML 엔지니어는 ChatGPT, GPT-3 및 기타 널리 사용되는 AI 엔진에서 생성된 텍스트를 인식할 수 있는 솔루션을 보유하고 있습니다.
내부 벤치마크 테스트 결과에 따르면 이 솔루션은 GPTZero 및 OpenAI GPT2 Output Detector와 같은 유사한 방법보다 훨씬 낫습니다. 내부 데이터 세트에서 모델 균형 정확도는 GPTZero의 최대 60% 정확도와 OpenAI GPT2 출력 감지기의 84% 정확도에 비해 >99%입니다.
데모 주소: https://hivemoderation.com/ai-generated-content-Detection
마지막으로 GPTZero도 업데이트를 받았습니다 - GPTZeroX, A 교육자를 위해 특별히 제작된 새로운 AI 감지 모델입니다. 이 모델은 AI가 생성한 텍스트와 인간 텍스트를 혼합하여 처리하고 AI가 생성했을 가능성이 가장 높은 텍스트 부분을 강조 표시할 수 있습니다. 여러 파일을 쉽게 실행할 수 있도록 PDF, Word 및 .txt 형식의 파일 일괄 업로드를 처리하는 파이프라인도 구축되었습니다.
데모 주소: https://gptzero.substack.com/p/gptzerox
요컨대, AI 생성 텍스트 감지 도구의 풍부함과 개선으로 인해 대규모 언어 ChatGPT 모델과 같은 모델은 적용되면 점점 더 형식화되어 사람들이 AI 기능을 보다 효율적으로 출시하는 데 도움이 됩니다.
위 내용은 방금 ChatGPT는 수학 능력이 다시 업그레이드되었다고 공식적으로 발표했습니다. 네티즌: 드디어 10개 이내의 덧셈과 뺄셈에 능숙해졌습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!