ChatGPT는 귀하의 모든 질문에 답변할 수 있지만 일부 사용자는 답변에 표절이 포함되어 있는지 궁금해합니다. 이를 조사하기 위해 ChatGPT를 사용하여 네 가지 유형의 텍스트를 생성한 다음 다양한 표절 탐지 도구를 사용하여 독창성을 평가했습니다.
ChatGPT가 표절인지 확인하려면 먼저 표절이 무엇인지 이해해야 합니다. 표절이란 적절한 저작자 표시 없이 다른 사람의 말, 아이디어, 저작물을 사용하는 것을 의미합니다. 여기에는 인용 없이 출처의 텍스트를 직접 복사하거나 승인 없이 다른 사람의 아이디어를 밀접하게 의역하는 것이 포함됩니다.
ChatGPT는 다른 LLM(대형 언어 모델)과 마찬가지로 대부분 공개적으로 사용 가능한 콘텐츠에서 가져온 대규모 데이터 세트로 훈련됩니다. 그러나 이렇게 방대한 양의 데이터를 수집하는 것은 원래 작성자가 자신의 작업이 LLM 교육에 사용되는 것에 동의하지 않았기 때문에 윤리적인 문제를 제기합니다. 이는 그러한 관행의 윤리성과 합법성에 대한 논쟁으로 이어집니다.
ChatGPT가 수신한 프롬프트를 기반으로 응답을 생성하지만 문제는 OpenAI(ChatGPT 개발자)가 적절한 동의 없이 콘텐츠를 사용하는 것과 관련하여 교육에 사용되는 데이터를 어떻게 얻었는지에 대한 더 넓은 맥락에 있습니다. 많은 사람들은 이를 표절로 간주하며 많은 웹사이트에서는 콘텐츠 도용으로 간주합니다. 그러나 표절의 정확한 출처를 정확히 찾아내는 것은 어렵습니다.
이 기사의 나머지 부분에서는 ChatGPT가 응답의 출처를 구체적으로 조사하지 않고 다른 소스의 출력을 표절하는지 여부에 집중하겠습니다. 챗봇이 온라인 소스의 텍스트를 직접 사용하는지 알아보기 위해 다양한 표절 탐지 도구를 사용하여 ChatGPT 응답의 독창성을 확인해 보겠습니다.
이 첫 번째 예에서는 ChatGPT에 정신 건강 문제에 대한 300단어 에세이를 작성하도록 지시했습니다.
이어서 다양한 표절 탐지 도구를 사용해 챗봇이 생성한 에세이의 독창성을 평가했습니다. 이러한 도구에는 Quetext 표절 검사기, Microsoft Word의 내장 표절 검사기, Grammarly의 표절 검사기 및 Duplichecker 표절 스캐너가 포함되어 있습니다.
Microsoft에 내장된 유사성 검사기는 온라인 소스와의 유사성이 0%라고 보고했습니다. 다른 도구에서 발견한 표절 수준도 미미했습니다. Grammarly의 표절 탐지기는 4%, QueText의 표절 탐지기는 5%, Duplichecker의 표절 스캐너에서는 0%를 발견했습니다.
적발된 표절 비율이 적은 점을 고려하면 ChatGPT는 기존 소스의 에세이를 직접 복사하지 않는 것으로 보입니다.
ChatGPT가 코드를 표절했는지 평가하기 위해 우리는 챗봇에게 Python으로 계산기용 코드를 작성하도록 지시했습니다.
이에 이어 Dolos라는 전문 프로그래밍 표절 검사기를 사용하여 코드에 대한 표절 검사를 실시한 결과 유사도가 0%로 확인되었습니다. 또한 위에서 언급한 일반 텍스트 표절 탐지 도구를 사용하여 코드를 검사한 결과, 결과는 일관되었으며 어떤 프로그램도 4% 이상 표절을 탐지하지 못했습니다.
ChatGPT가 다른 계정에서 계산기용 코드를 생성하도록 요청했을 때 응답이 다르게 나타났습니다. 이러한 관찰과 표절 검사 결과는 ChatGPT가 단순히 온라인 소스의 코드를 복제하지 않는다는 것을 나타냅니다. 대신, 독립적으로 코드를 생성하기 위해 훈련된 데이터 세트를 활용합니다.
세 번째 테스트에서는 챗봇에게 수학 문제를 해결하고 각 단계에 대한 자세한 추론을 제공하는 임무를 부여했습니다.
응답의 독창성을 확인하기 위해 PapersOwl 표절 검사기, AI 기반 Trinka 표절 스캐너는 물론 Grammarly, Duplichecker, QueText.
PapersOwl의 표절 탐지기는 챗봇이 생성한 추론과 온라인 소스 간에 거의 46%의 유사성을 나타냈습니다. 마찬가지로, Trinka 표절 탐지기는 10% 이상의 유사성을 보고했습니다. 또한 Grammarly의 표절 탐지기는 14%의 유사성을 발견했으며 QueText는 17%, Duplichecker는 7%를 발견했습니다.
생성된 응답에서 높은 수준의 표절이 감지되었다고 해서 챗봇이 온라인 소스의 수학적 질문에 대한 추론을 직접 복사한다는 의미는 아닙니다. 이는 주로 수학 문제에 대한 해결책과 추론이 표준적이고 온라인에서 널리 이용 가능하기 때문입니다.
따라서 ChatGPT가 자체 답변을 제시하더라도 온라인에서 동일한 답변을 찾고 추론이 가능하므로 표절 비율이 높아질 수 있습니다.
ChatGPT가 온라인 블로그의 콘텐츠를 사용하는지 확인하기 위해 챗봇에 노트북 배터리 상태 유지에 대한 팁을 제공하도록 요청했습니다.
Microsoft Word는 생성된 텍스트에서 10%의 표절을 감지했습니다. Duplichecker는 4%, Grammarly의 표절 검사기는 14%를 나타냈지만 Quetext는 58%의 표절을 발견했습니다. 더 자세히 조사한 결과, 챗봇 응답의 일부 텍스트가 일부 블로그의 내용과 일치했습니다.
표절 적발률이 높은 것이 우연이 아닌지 다시 확인하기 위해 온라인에서 쉽게 접할 수 있는 정보에 대해 챗봇에게 몇 가지 질문을 더 던졌습니다. 생성된 응답의 표절 비율은 훨씬 더 높았습니다. 우리의 테스트에 따르면 챗봇이 때때로 온라인 소스의 문구와 텍스트를 사용하는 것으로 나타났습니다. 이는 매우 놀라운 일입니다.
많은 무료 온라인 표절 검사기가 ChatGPT 응답에서 심각한 표절을 발견하지 못했지만 학술적 또는 직업적 목적으로 사용해서는 안 됩니다.
학생이라면 학교 과제에 ChatGPT를 사용하지 마세요. 강사는 GPTZero 및 Turnitin의 AI 쓰기 감지기와 같은 도구를 사용하여 AI 생성 콘텐츠를 찾아낼 수 있습니다. 귀하의 작업이 이러한 도구에 의해 AI로 생성된 것으로 표시되면 과제에 실패하거나 학교에서 퇴학당할 수도 있습니다. 많은 GPT 감지 도구에서는 이러한 목적으로 사용해서는 안 된다고 구체적으로 명시하고 있지만 실제로 사용하면 문제가 발생할 수 있습니다. 말할 것도 없이, 당신은 주제를 제대로 공부하지 않음으로써 자신을 속이는 것뿐입니다.
챗봇을 활용해 업무 성과를 높일 수 있나요? 때에 따라 다르지. 이메일이나 기타 텍스트 형식의 글쓰기 흐름을 개선하려는 경우 AI를 사용하면 시간과 노력을 절약할 수 있습니다. 그러나 전체 작업을 수행하는 데 의존하기보다는 작업을 지원하는 도구로만 사용해야 합니다.
대조적으로, 전문적인 글쓰기와 같은 직업에서 이러한 도구의 사용을 금지하는 경우 ChatGPT 또는 다른 도구를 모두 사용하지 않아야 합니다.
우리의 테스트를 통해 ChatGPT가 웹에서 사용할 수 있는 리소스를 어느 정도 활용할 수 있는지에 대한 통찰력을 얻을 수 있기를 바랍니다. 그러나 우리는 무료 표절 도구를 사용했으며 제한된 데이터 세트만 테스트했다는 점을 기억하는 것이 중요합니다. 따라서 우리의 연구 결과가 도움이 될 수는 있지만 절대적인 사실로 받아들여서는 안 됩니다.
위 내용은 ChatGPT는 표절을 합니까? Chatbot의 소스 검사의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!