새로운 Apple 연구에 따르면 AI 추론에 심각한 결함이 있음이 밝혀졌습니다.-일체 포함-php.cn

Apple의 연구에서는 AI의 신뢰성에 큰 문제가 있음을 시사합니다.

Meta 및 OpenAI 모델 모두 문제가 있음

집

기술 주변기기

일체 포함

새로운 Apple 연구에 따르면 AI 추론에 심각한 결함이 있음이 밝혀졌습니다.

DDD

Oct 25, 2024 am 11:04 AM

AI가 항상 일을 제대로 처리하지 못한다는 것은 놀라운 일이 아닙니다. 때로는 환각을 일으키기도 합니다. 그러나 Apple 연구진의 최근 연구에 따르면 AI가 형식적 추론에 사용하는 수학적 모델에 훨씬 더 심각한 결함이 있는 것으로 나타났습니다.

✕ 광고 제거

연구의 일환으로 Apple 과학자들은 AI 대형 언어 모델에 (LLM) 약간씩 다른 방식으로 여러 번 질문을 던졌으며 LLM이 답변에 예상치 못한 변화를 제공한다는 사실을 알고 놀랐습니다. 이러한 변형은 숫자가 포함될 때 가장 두드러졌습니다.

Apple의 연구에서는 AI의 신뢰성에 큰 문제가 있음을 시사합니다.

A New Apple Study Shows AI Reasoning Has Critical Flaws

arxiv.org에서 발표한 연구에서는 "전체적으로 상당한 성능 변동성이 있다"고 결론지었습니다. 동일한 질문에 대한 다른 인스턴스화로 인해 단일 지점 정확도 측정 기준에 의존하는 현재 GSM8K 결과의 신뢰성에 도전하고 있습니다." GSM8K는 8000개가 넘는 다양한 초등학교 수학 문제와 답변이 포함된 데이터 세트입니다.

✕ 광고 제거

Apple 연구진은 이 성능의 차이가 최대 10%에 이를 수 있음을 확인했습니다. 프롬프트에 약간의 변화가 있어도 LLM 답변의 신뢰성에 큰 문제가 발생할 수 있습니다.

즉, ChatGPT와 같은 도구를 사용할 때마다 답변의 사실 여부를 확인하고 싶을 수도 있습니다. 그 이유는 때때로 AI가 논리를 사용하여 문의에 대한 답변을 제공하는 것처럼 보일 수 있지만 실제로는 논리가 사용되지 않기 때문입니다.

대신 AI는 패턴 인식을 사용하여 프롬프트에 응답합니다. 그러나 Apple 연구는 중요하지 않은 단어 몇 개만 바꾸면 패턴 인식이 어떻게 바뀔 수 있는지 보여줍니다.

제시된 중요한 차이의 한 예는 며칠에 걸쳐 키위를 수집하는 문제에서 나타났습니다. Apple 연구진은 대조 실험을 수행한 후 키위 크기에 대한 몇 가지 중요하지 않은 정보를 추가했습니다.

✕ 광고 제거

Meta 및 OpenAI 모델 모두 문제가 있음

Meta의 Llama 및 OpenAI의 o1, 그런 다음 키위 크기 데이터가 문제 결과에 실질적인 영향을 미치지 않음에도 불구하고 통제에서 문제에 대한 답변을 변경했습니다. OpenAI의 GPT-4o도 LLM에 제공되는 데이터에 작은 변화를 도입할 때 성능에 문제가 있었습니다.

LLM이 우리 문화에서 점점 더 두드러지고 있기 때문에 이 소식은 우리가 AI를 신뢰할 수 있는지에 대한 엄청난 우려를 불러일으킵니다. 문의사항에 대한 정확한 답변을 제공하기 위해 특히 재정 조언과 같은 문제의 경우. 또한 대규모 언어 모델을 사용할 때 수신한 정보를 정확하게 검증해야 할 필요성도 강화됩니다.

즉, AI에 맹목적으로 의존하기보다는 비판적 사고와 실사를 수행해야 한다는 뜻입니다. 그리고 AI를 정기적으로 사용하는 사람이라면 이미 알고 있었을 것입니다.

✕ 광고 제거

위 내용은 새로운 Apple 연구에 따르면 AI 추론에 심각한 결함이 있음이 밝혀졌습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7887

자바 튜토리얼

1649

Cakephp 튜토리얼

1410

라라벨 튜토리얼

1301

PHP 튜토리얼

1246

Related knowledge

창의적인 프로젝트를위한 최고의 AI 아트 발전기 (무료 & amp; 유료) Apr 02, 2025 pm 06:10 PM

이 기사는 최고의 AI 아트 생성기를 검토하여 자신의 기능, 창의적인 프로젝트에 대한 적합성 및 가치에 대해 논의합니다. Midjourney를 전문가에게 최고의 가치로 강조하고 고품질의 사용자 정의 가능한 예술에 Dall-E 2를 추천합니다.

Meta Llama 3.2- 분석 Vidhya를 시작합니다 Apr 11, 2025 pm 12:04 PM

메타의 라마 3.2 : 멀티 모달 및 모바일 AI의 도약 Meta는 최근 AI에서 강력한 비전 기능과 모바일 장치에 최적화 된 가벼운 텍스트 모델을 특징으로하는 AI의 상당한 발전 인 Llama 3.2를 공개했습니다. 성공을 바탕으로 o

최고의 AI 챗봇 비교 (Chatgpt, Gemini, Claude & amp; more) Apr 02, 2025 pm 06:09 PM

이 기사는 Chatgpt, Gemini 및 Claude와 같은 최고의 AI 챗봇을 비교하여 고유 한 기능, 사용자 정의 옵션 및 자연어 처리 및 신뢰성의 성능에 중점을 둡니다.

컨텐츠 생성을 향상시키기 위해 AI를 쓰는 최고 AI 작문 Apr 02, 2025 pm 06:11 PM

이 기사는 Grammarly, Jasper, Copy.ai, Writesonic 및 Rytr와 같은 최고의 AI 작문 조수에 대해 논의하여 콘텐츠 제작을위한 독특한 기능에 중점을 둡니다. Jasper는 SEO 최적화가 뛰어나고 AI 도구는 톤 구성을 유지하는 데 도움이된다고 주장합니다.