제너레이티브 AI는 알고리즘을 사용하여 일반적으로 이미지 또는 사람이 읽을 수 있는 텍스트 형식의 데이터를 생성, 조작 또는 합성하는 자동화된 프로세스를 가리키는 일반적인 용어입니다. AI가 이전에 존재하지 않았던 것을 생성하기 때문에 이를 생성적이라고 부릅니다. 이것이 서로 다른 유형의 입력을 구별하는 차별적 AI와 다른 점입니다. 즉, 차별적 AI는 “이 사진은 토끼인가요, 사자인가요?”라는 질문에 답하려고 하는 반면, 생성적 AI는 “사자와 토끼가 함께 앉아 있는 사진을 그려주세요.”라는 질문에 답합니다.
생성 AI와 ChatGPT, DALL-E 등 인기 모델에서의 사용을 주로 소개합니다. 또한 "너무 많은 손가락"이 생성 예술의 치명적인 단점이 된 이유를 포함하여 기술의 한계를 고려할 것입니다.
제너레이티브 AI는 1966년 MIT(매사추세츠 공과대학)에서 치료사와의 대화를 시뮬레이션하는 챗봇인 ELIZA가 개발된 이후 수년 동안 존재해 왔습니다. 그러나 인공지능과 머신러닝 분야에서 수년간의 노력이 최근 새로운 생성 AI 시스템의 출시로 결실을 맺었습니다. 사람들은 매우 인간과 유사한 산문을 생성하는 텍스트 기반 AI 챗봇인 ChatGPT에 대해 들어본 적이 있을 것입니다. DALL-E와 StableDiffusion도 텍스트 단서를 기반으로 생생하고 사실적인 이미지를 생성하는 능력으로 주목을 받았습니다. 정보의 하위 집합(때로는 매우 큰 하위 집합)을 기반으로 실제 세계의 일부 측면을 시뮬레이션하거나 모델링하려는 시도를 나타내기 때문에 이러한 시스템 및 이와 유사한 다른 시스템을 모델이라고 부르는 경우가 많습니다.
이 시스템의 결과는 너무나 놀라워서 많은 사람들이 의식의 본질에 대한 철학적 질문을 제기하고 생성 AI가 인간 작업에 미치는 경제적 영향에 대해 걱정하고 있습니다. 그러나 이러한 모든 AI 창작물은 부인할 수 없는 큰 뉴스이지만 일부 사람들이 생각하는 것보다 표면 아래에서 진행되는 일은 적을 수 있습니다. 우리는 나중에 이러한 큰 질문에 대해 논의할 것입니다. 먼저 ChatGPT 및 DALL-E와 같은 모델에서 무슨 일이 일어나고 있는지 살펴보겠습니다.
제너레이티브 AI는 기계 학습을 사용하여 대량의 시각적 또는 텍스트 데이터(대부분 인터넷에서 스크랩)를 처리한 다음 근처의 다른 무언가에 나타날 가능성이 가장 높은 항목을 결정합니다. 생성 AI의 프로그래밍 노력의 대부분은 AI 제작자가 관심을 갖는 "사물"(ChatGPT와 같은 챗봇의 단어 및 문장 또는 DALL-E의 시각적 요소)을 구별할 수 있는 알고리즘을 만드는 것입니다. 그러나 기본적으로 생성 AI는 대규모 데이터 코퍼스를 평가하여 출력을 생성한 다음 코퍼스에 의해 결정된 확률 범위 내에서 프롬프트에 응답합니다.
자동완성 — 휴대전화나 Gmail에서 사용자가 입력하고 있는 단어나 문장의 나머지 부분이 무엇인지 묻는 메시지를 표시하는 경우는 낮은 수준의 생성 인공 지능 형태입니다. ChatGPT 및 DALL-E와 같은 모델은 이 아이디어를 더욱 발전된 수준으로 끌어올립니다.
이 모든 데이터에 적합한 모델을 개발하는 과정을 교육이라고 합니다. 다양한 유형의 모델에 대해 여기에는 몇 가지 기본 기술이 사용됩니다. ChatGPT는 소위 변환기(T가 의미하는 바)를 사용합니다. 변환기는 긴 텍스트 시퀀스에서 의미를 도출하여 서로 다른 단어 또는 의미 구성 요소 간의 관계를 이해한 다음 두 단어가 서로 가까이 나타날 가능성을 결정합니다. 이러한 디포머는 사전 훈련(PinChatGPT)이라는 프로세스를 통해 대규모 자연어 텍스트 모음에서 감독 없이 실행된 다음 모델과 상호 작용하는 인간에 의해 미세 조정됩니다.
모델 학습에 사용되는 또 다른 기술은 생성적 적대 신경망(GAN)입니다. 이 기술에서는 두 개의 알고리즘이 서로 경쟁합니다. 하나는 대규모 데이터 세트에서 얻은 확률을 기반으로 텍스트나 이미지를 생성하는 것이고, 다른 하나는 출력이 실제인지 AI에서 생성되었는지 평가하도록 인간이 훈련한 차별적 AI입니다. 생성적 AI는 식별하는 AI를 반복적으로 "속이려고" 시도하여 성공적인 결과에 자동으로 적응합니다. 생성적 AI가 이 경쟁에서 계속 "승리"하면 차별적 AI는 인간에 의해 미세 조정되고 프로세스가 다시 시작됩니다.
여기서 기억해야 할 가장 중요한 것 중 하나는 훈련 중에 인간의 개입이 있음에도 불구하고 대부분의 학습과 적응이 자동으로 일어난다는 것입니다. 모델이 흥미로운 결과를 생성하기 위해서는 많은 반복이 필요하므로 자동화가 필수적입니다. 이 과정에는 많은 계산이 필요합니다.
생성 AI 모델을 만들고 훈련하는 데 사용되는 수학과 코딩은 상당히 복잡하며 이 기사의 범위를 훨씬 벗어납니다. 하지만 이 프로세스의 최종 결과 모델과 상호 작용하면 확실히 놀라운 경험을 할 수 있습니다. Dell-e가 실제 예술 작품처럼 보이는 것을 제작하도록 할 수 있습니다. 다른 사람과 대화하는 것처럼 ChatGPT와 대화할 수 있습니다. 연구자들은 정말로 생각하는 기계를 만들었나요?
Chris Phipps는 전 IBM 자연어 처리 이사였으며 Watson 인공지능 제품 개발에 참여했습니다. 그는 ChatGPT를 "매우 훌륭한 예측 기계"라고 설명했습니다.
인간이 일관성을 찾을 것인지 예측하는 데 매우 능숙합니다. 항상 일관적인 것은 아니지만(대부분의 경우), ChatGPT가 이를 "이해"하기 때문에 그런 것은 아닙니다. 그 반대는 사실입니다. 출력을 소비하는 사람들은 출력을 의미있게 만드는 데 필요한 암묵적인 가정을 만드는 데 정말 능숙합니다.
코미디언이기도 한 Phipps는 이를 MindMeld라는 일반적인 즉흥 게임에 비유했습니다.
두 사람이 각각 단어를 생각한 다음 동시에 큰 소리로 말합니다. "부팅"이라고 말하면 저는 "나무"라고 합니다. 우리는 완전히 독립적으로 단어를 생각해 냈고 처음에는 서로 아무런 관계가 없었습니다. 다음 두 참가자는 두 단어를 가져와 큰 소리로 말하면서 공통점이 무엇인지 찾으려고 노력합니다. 두 참가자가 같은 단어를 말할 때까지 게임은 계속됩니다.
둘 다 "나무꾼"이라고 말했을 수도 있습니다. 이것은 마술처럼 보일 수도 있지만 실제로 인간의 두뇌를 사용하여 입력("부팅" 및 "트리")에 대해 추론하고 연결을 찾는 것입니다. 우리는 기계가 아닌 이해의 사업을 하고 있습니다. ChatGPT와 DALL-E에는 사람들이 인정하는 것보다 더 많은 일이 벌어지고 있습니다. ChatGPT는 이야기를 작성할 수 있지만 우리 인간이 이야기를 의미있게 만들려면 많은 작업이 필요합니다.
사람들은 이러한 AI 모델에 Phipps의 주장을 매우 분명하게 만드는 몇 가지 힌트를 줄 수 있습니다. 예를 들어, "1파운드의 납과 1파운드의 깃털 중 어느 것이 더 무겁습니까?"라는 질문을 생각해 보십시오. 물론 우리의 본능이나 상식이 말해 주더라도 대답은 두 무게가 동일하다는 것입니다(1파운드). 깃털이 더 가볍다는 것.
ChatGPT는 이 퍼즐에 정확하게 답할 것이며, 어떤 "상식"도 걸림돌이 되지 않는 냉정하고 논리적인 컴퓨터이기 때문에 그렇게 생각할 수도 있습니다. 그러나 그것은 뒤에서 일어나는 일이 아닙니다. ChatGPT는 답변을 논리적으로 추론하지 않고 단순히 깃털 1파운드와 납 1파운드에 대한 질문의 예측을 기반으로 출력을 생성합니다. 훈련 세트에는 퍼즐을 설명하는 많은 텍스트가 포함되어 있기 때문에 정답 버전을 조합합니다. 그러나 ChatGPT에 깃털 2파운드의 무게가 납 1파운드보다 더 나가는지 물어보면 훈련 세트를 기준으로 볼 때 이것이 여전히 프롬프트에 출력할 가능성이 가장 높은 결과이기 때문에 무게가 같다고 자신 있게 말할 것입니다. 깃털과 납.
위 내용은 재진술: 생성 인공지능이란 무엇이며, 어떻게 진화하고 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!