"역사를 통해 배우는 것은 기복을 이해하는 데 도움이 될 수 있습니다." 인류 진보의 역사는 끊임없이 과거 경험을 바탕으로 역량의 한계를 넓혀가는 자기 진화 과정입니다. 우리는 과거의 실패로부터 배우고 실수를 바로잡으며, 성공적인 경험을 통해 효율성과 효율성을 향상시킵니다. 이러한 자기 진화는 삶의 모든 측면을 통해 진행됩니다. 경험을 요약하여 업무 문제를 해결하고, 패턴을 사용하여 날씨를 예측하며, 우리는 과거로부터 계속 배우고 진화합니다.
과거 경험에서 지식을 성공적으로 추출하고 이를 미래의 과제에 적용하는 것은 인류 진화의 길에서 중요한 이정표입니다. 그렇다면 인공지능 시대에 AI 에이전트도 같은 일을 할 수 있을까?
최근 몇 년 동안 GPT 및 LLaMA와 같은 언어 모델은 복잡한 작업을 해결하는 데 놀라운 능력을 보여주었습니다. 그러나 특정 작업을 해결하기 위해 도구를 사용할 수는 있지만 본질적으로 과거의 성공과 실패로부터 얻은 통찰력과 교훈이 부족합니다. 이는 특정 작업만 수행할 수 있는 로봇과 같습니다. 현재 작업에서는 잘 수행되지만 새로운 도전에 직면했을 때 과거의 경험을 활용하여 도움을 줄 수는 없습니다. 따라서 이러한 모델이 지식과 경험을 축적하고 새로운 상황에 적용할 수 있도록 더욱 발전시켜야 합니다. 기억과 학습 메커니즘을 도입함으로써 우리는 이러한 모델을 지능 측면에서 더욱 포괄적으로 만들고 다양한 작업과 상황에 유연하게 대응할 수 있으며 과거 경험에서 영감을 얻을 수 있습니다. 이는 언어 모델을 더욱 강력하고 안정적으로 만들고 인공 지능 개발을 발전시키는 데 도움이 될 것입니다.
이 문제에 대응하여 Tsinghua University, Hong Kong University, Renmin University 및 Wall-Facing Intelligence의 공동 팀은 최근 새로운 지능형 에이전트 자체 진화 전략: 조사-통합-공격, ICE)를 제안했습니다. 업무 전반에 걸쳐 자기진화를 통해 AI 에이전트의 적응성과 유연성을 향상시키는 것을 목표로 한다. 새로운 작업을 처리하는 데 있어 에이전트의 효율성과 효율성을 향상시킬 수 있을 뿐만 아니라 에이전트 기본 모델의 기능에 대한 요구도 크게 줄일 수 있습니다.
이 전략의 출현은 실제로 지능형 에이전트의 자체 진화에 새로운 장을 열었으며 완전히 자율적인 에이전트를 달성하기 위한 또 다른 단계를 의미합니다.
자기 진화를 달성하기 위한 에이전트 작업 간의 경험 전달 개요
현재 복잡한 에이전트는 주로 작업으로 나눌 수 있습니다. 및 작업 실행 측면. 작업 계획 측면에서는 에이전트가 사용자의 요구를 분해하고 논리적 추론을 통해 세부적인 목표 전략을 개발합니다. 작업 실행 측면에서 에이전트는 다양한 도구를 사용하여 환경과 상호 작용하여 해당 하위 목표를 완료합니다.
과거 경험의 재사용을 더 잘 촉진하기 위해 저자는 먼저 이 논문에서 진화 전략을 두 가지 측면으로 분리합니다. 구체적으로 저자는 XAgent 에이전트 아키텍처에서의 트리 작업 계획 구조와 ReACT 체인 도구 실행을 예로 들어 ICE 전략의 구현 방법을 자세히 소개합니다.
에이전트 임무 계획을 위한 ICE 자기 진화 전략
임무 계획에서 자기 진화는 ICE에 따라 다음 세 단계로 구분됩니다.
에이전트 작업 실행을 위한 ICE 자기 진화 전략
작업 실행을 위한 자기 진화 전략은 여전히 ICE의 세 단계로 나누어져 있으며, 그 중
ICE 전략에 따라 저장된 경험은 재사용률이 높아 ICE의 효율성이 입증됩니다.
다양한 경험 저장량에 따른 테스트 세트 작업 성능의 절제 실험 결과 통계
결론
모든 사람이 에이전트를 배포할 수 있는 세상에서 성공적인 경험의 수는 개인으로서 다음과 같습니다. 에이전트의 작업이 계속 누적되므로 사용자는 이러한 경험을 클라우드와 커뮤니티에서 공유할 수도 있습니다. 이러한 경험은 지능형 에이전트가 지속적으로 기능을 획득하고 스스로 진화하며 점진적으로 완전한 자율성을 달성하도록 유도합니다. 우리는 그러한 시대에 한발 더 다가섰습니다.
위 내용은 완전한 자율성에 한발 더 다가가는 Tsinghua University와 HKU의 새로운 교차 작업 자체 진화 전략을 통해 상담원은 '경험을 통해 학습'하는 방법을 배울 수 있습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!