AI 대형 모델 시대의 발전은 안정적인 진행을 위해 고급 스토리지 기술이 필요합니다.-일체 포함-php.cn

집

기술 주변기기

일체 포함

AI 대형 모델 시대의 발전은 안정적인 진행을 위해 고급 스토리지 기술이 필요합니다.

王林

Sep 19, 2023 am 09:05 AM

AI 대형 모델 꾸준한 발전 빨리감기

인공지능이라는 학문은 1956년에 시작되어 이후 반세기 동안 컴퓨팅 능력과 데이터의 발전은 알고리즘에 비해 훨씬 뒤쳐졌습니다. 그러나 2000년 인터넷 시대가 도래하면서 컴퓨팅 파워의 한계가 무너지고, 인공지능이 점차 사회 각계에 침투하며 대형 모델 시대가 열렸다. 하지만 고품질 데이터가 인공지능 발전의 마지막 '병목'이 된 것 같다

Huawei OceanStor Pacific은 최근 개최된 전국 고성능 컴퓨팅 학술 연례 회의에서 "AI 스토리지 기반 부문 최고 혁신상"을 수상했습니다(CCF HPC China 2는 023으로 다시 작성해야 함)

AI 대형 모델 시대의 발전은 안정적인 진행을 위해 고급 스토리지 기술이 필요합니다.

AI 리텐션 개념의 등장은 실제로 AI에 대한 데이터 가치의 지속적인 향상을 반영합니다

다시 작성해야 하는 콘텐츠는 01

입니다.

데이터가 인공지능의 지능 수준을 결정합니다

인공지능의 발전은 지속적인 데이터 수집과 분석의 과정입니다. 정보의 전달체인 데이터는 인공지능이 세상을 학습하고 이해하는 기반이다. 일반지능은 인공지능 개발의 궁극적인 목표이며, 자율적으로 학습하고, 이해하고, 추론하고, 문제를 해결할 수 있으며, 데이터는 인공지능 개발의 가장 큰 원동력입니다

그럼 데이터가 많아질수록 AI는 더욱 똑똑해진다는 건가요? 데이터가 많은 만큼 AI가 전문가의 역할을 뛰어넘을 수 있을까?

의료 분야의 인공지능 시스템을 예로 들면, 실제로 많은 진단 사례에는 정답이 하나도 없습니다. 의료 진단에서 각 증상 세트에는 다양한 확률의 가능한 원인이 있으므로 AI 지원 의사 결정은 임상의가 해결책을 찾을 때까지 가능한 원인을 좁히는 데 도움이 될 수 있습니다. 이 경우 의료 인공지능은 대량의 데이터가 아닌 정확하고 고품질의 데이터에 의존해야 합니다. 그래야만 "검진" 중에 실제 가능한 원인을 놓치지 않을 수 있습니다

AI 지능에 대한 데이터 품질의 중요성이 이 일반적인 시연에 반영되어 있습니다

인공지능 업계에서는 늘 '쓰레기가 들어오면 쓰레기가 나온다'는 공감대가 있어왔습니다. 즉, 고품질의 데이터 입력이 없으면 알고리즘이 아무리 발전하고 컴퓨팅 성능이 아무리 강력해도 고품질의 결과를 생성할 수 없다는 의미입니다

AI 대형 모델 시대의 발전은 안정적인 진행을 위해 고급 스토리지 기술이 필요합니다.

이 시대에 우리는 대형 모델의 정점에 있습니다. 인공지능의 대형 모델이 비가 내린 뒤 버섯처럼 솟아오르고 있다. Huawei의 Pangu, iFlytek의 Spark, Zidong의 Taichu 등 중국의 여러 대형 모델이 빠르게 발전하고 있으며 모든 계층의 디지털 변혁을 위한 힘을 제공하기 위해 산업 간 범용 인공 지능 기능 플랫폼을 구축하는 데 전념하고 있습니다

중국 과학기술부 신세대 인공지능 개발 연구센터가 지난 5월 말 발표한 '중국 인공지능 대형 모델 지도 연구 보고서'에 따르면, 규모가 10억 개가 넘는 대형 모델이 79개에 이른다. 매개 변수가 중국에서 출시되었습니다. '100개 모델 대결'이라는 패턴이 형성됐지만, 이는 대형 모델 개발에 대한 심도 있는 고민을 촉발하기도 했습니다

소규모 데이터를 기반으로 한 모델의 표현 능력은 데이터 크기에 따라 제한되며, 대략적인 시뮬레이션과 예측만 수행할 수 있으며 정확도 요구 사항이 상대적으로 높은 상황에서는 더 이상 적용할 수 없습니다. 모델의 정확도를 더욱 높이려면 방대한 데이터를 사용하여 관련 모델을 생성해야 합니다

다시 쓴 내용은 다음과 같습니다. 즉, 데이터의 양이 AI 지능의 정도를 결정한다는 의미입니다. 데이터의 질과 상관없이 데이터의 양은 'AI 저장 용량' 구축에 집중해야 하는 초점 영역입니다

다시 작성해야 할 내용은 다음과 같습니다: 02

빅데이터 시대, 데이터가 직면한 과제

인공지능이 대형 모델과 다중 양식으로 발전함에 따라 기업은 대형 모델 애플리케이션을 개발하거나 구현할 때 많은 어려움에 직면합니다

AI 대형 모델 시대의 발전은 안정적인 진행을 위해 고급 스토리지 기술이 필요합니다.

우선, 데이터 전처리 주기가 매우 깁니다. 데이터가 서로 다른 데이터 센터, 서로 다른 애플리케이션, 서로 다른 시스템에 분산되어 있기 때문에 수집 속도가 느린 등의 문제가 있으며, 이로 인해 100TB의 데이터를 전처리하는 데 약 10일이 소요됩니다.

시작합니다.

두 번째로, 훈련 세트 로딩 효율성이 낮은 문제를 해결해야 합니다. 오늘날 대규모 모델의 규모는 점점 더 커지고 있으며, 매개변수 수준은 수천억, 심지어는 수조에 달합니다. 학습 프로세스에는 많은 양의 컴퓨팅 리소스와 저장 공간이 필요합니다. 예를 들어 다중 모드 대규모 모델은 대용량 텍스트와 이미지를 학습 세트로 사용하지만 현재 대용량 작은 파일의 로딩 속도가 느려 학습 세트 로딩이 비효율적입니다

또한 우리는 대규모 모델 매개변수를 자주 조정하고 훈련 플랫폼이 불안정하여 평균 이틀에 한 번씩 훈련 중단이 발생하는 문제에 직면해 있습니다. 훈련을 재개하려면 체크포인트 메커니즘을 사용해야 하며, 장애 복구에 걸리는 시간이 하루 이상이므로 비즈니스 연속성에 많은 어려움이 따릅니다

AI 빅모델 시대에 성공하려면 데이터의 질과 양 모두에 주목하고 대용량, 고성능 스토리지 인프라를 구축해야 합니다. 이것이 승리의 핵심 요소가 되었습니다

다시 작성해야 하는 콘텐츠는 03

입니다.

AI시대의 핵심은 전력저장기지

빅데이터, 인공지능 등의 기술과 고성능 컴퓨팅이 결합되면서 고성능 데이터 분석(HPDA)은 데이터 가치를 실현하는 새로운 형태로 자리 잡았습니다. HPDA는 더 많은 과거 데이터, 다양한 이기종 컴퓨팅 성능 및 분석 방법을 활용하여 분석 정확도를 향상시킬 수 있습니다. 이는 과학 연구에서 지능형 연구의 새로운 단계를 의미하며, 인공지능 기술은 최첨단 결과의 적용을 가속화할 것입니다

오늘날 과학 연구 분야에서는 '데이터 집약적 과학'을 기반으로 한 새로운 패러다임이 등장하고 있습니다. 이 패러다임은 빅데이터 지식 마이닝과 인공지능 훈련 및 추론 기술을 결합하여 계산과 분석을 통해 새로운 지식과 발견을 얻는 데 더 중점을 두고 있습니다. 이는 또한 기본 데이터 인프라에 대한 요구 사항이 근본적으로 변경된다는 것을 의미합니다. 고성능 컴퓨팅이든 향후 인공지능의 발전이든 데이터 문제를 해결하려면 고급 스토리지 인프라를 구축해야 합니다

AI 대형 모델 시대의 발전은 안정적인 진행을 위해 고급 스토리지 기술이 필요합니다.

데이터 문제를 해결하려면 데이터 저장 혁신부터 시작해야 합니다. 속담처럼 종을 푼 사람이 종을 묶어야 합니다

AI 스토리지 기반은 OceanStor Pacific 분산 스토리지를 기반으로 개발되었으며 AI의 모든 측면에 대한 스토리지 요구 사항을 충족하기 위해 AI 네이티브 설계 개념을 준수합니다. AI 시스템은 데이터 컴퓨팅 가속화, 데이터 스토리지 관리, 데이터 스토리지와 컴퓨팅 간의 효율적인 순환을 포함하여 스토리지에 대한 포괄적인 과제를 제기합니다. "대용량 스토리지 + 고성능 스토리지"의 조합을 사용하여 스토리지 리소스의 스케줄링 및 조정을 보장하여 모든 링크가 효율적으로 작동할 수 있도록 하여 AI 시스템의 가치를 최대한 발휘할 수 있습니다

OceanStor Pacific 분산 스토리지는 핵심 기능을 어떻게 보여주나요?

우선, 기술 아키텍처가 업계에서 독특합니다. 이 스토리지 시스템은 무제한 수평 확장을 지원하고 혼합 로드를 처리할 수 있으며 작은 파일의 IOPS와 큰 파일의 고속 읽기 및 쓰기 대역폭을 효율적으로 처리할 수 있습니다. 성능 계층과 용량 계층에서 지능적인 계층적 데이터 흐름 기능을 갖추고 있으며, 대용량 데이터의 수집, 전처리, 훈련, 추론 등 전체 프로세스 AI 데이터 관리를 실현할 수 있습니다. 게다가 HPC, 빅데이터와 동일한 데이터 분석 기능도 갖췄습니다

다시 쓴 내용은 다음과 같습니다. 둘째, 업계에서 효율성을 향상시키는 가장 좋은 방법은 스토리지 혁신을 통해서입니다. 첫 번째는 데이터 위빙입니다. 이는 GFS 글로벌 파일 시스템을 통해 여러 지역에 분산된 원시 데이터에 액세스하여 시스템, 지역 및 여러 클라우드 전반에 걸쳐 글로벌 통합 데이터 보기 및 예약을 달성하고 데이터 수집 프로세스를 단순화하는 것을 의미합니다. 두 번째는 Near-Memory 컴퓨팅으로, 임베디드 컴퓨팅 파워를 저장하여 Near-Data의 전처리를 구현하고, 유효하지 않은 데이터 전송을 줄이고, 전처리 서버의 대기 시간을 줄여 전처리 효율성을 대폭 향상시킵니다

사실 '수백 모델 대결'은 대형 AI 모델 개발의 '신호'가 아니다. 미래에는 각계각층이 AI 대형 모델의 역량을 활용해 디지털 변혁의 심층적 발전을 촉진하고, 데이터 인프라 구축도 가속화될 것이다. OceanStor Pacific 분산 스토리지의 기술 아키텍처 혁신과 고효율은 업계 최고의 선택임이 입증되었습니다

우리는 데이터가 토지, 노동, 자본, 기술과 함께 새로운 생산요소가 되었음을 이해합니다. 과거 디지털 시장의 많은 전통적인 정의와 운영 모델이 다시 작성될 것입니다. 기존 역량만이 데이터 기반 인공지능 대형 모델 시대의 꾸준한 발전을 보장할 수 있습니다

위 내용은 AI 대형 모델 시대의 발전은 안정적인 진행을 위해 고급 스토리지 기술이 필요합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7488

Cakephp 튜토리얼

1377

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

Related knowledge

대형 AI 모델은 매우 비싸며 대기업과 슈퍼 부자만이 성공적으로 플레이할 수 있습니다. Apr 15, 2023 pm 07:34 PM

ChatGPT 화재는 또 다른 AI 열풍을 불러일으켰습니다. 그러나 업계에서는 일반적으로 AI가 대형 모델 시대에 진입하면 대형 AI 모델을 만드는 데 비용이 많이 들기 때문에 대기업과 슈퍼 부자만이 AI를 감당할 수 있다고 생각합니다. . 첫 번째는 계산 비용이 많이 든다는 것입니다. 토론토 대학교 마케팅 교수인 Avi Goldfarb는 "회사를 시작하고 대규모 언어 모델을 직접 개발하고 직접 계산하려면 비용이 너무 높습니다. OpenAI는 매우 비싸서 수십억 달러의 비용이 듭니다." ." 렌탈 컴퓨팅은 확실히 그럴 것입니다. 훨씬 저렴하지만 기업은 여전히 AWS와 다른 기업에 비싼 수수료를 지불해야 합니다. 둘째, 데이터 비용이 비싸다. 훈련 모델에는 엄청난 양의 데이터가 필요하며, 데이터를 쉽게 사용할 수 있는 경우도 있고 그렇지 않은 경우도 있습니다. CommonCrawl 및 LAION과 같은 데이터는 무료입니다.

AI 중심의 데이터 거버넌스 시스템을 구축하는 방법은 무엇입니까? Apr 12, 2024 pm 02:31 PM

최근에는 신기술 모델의 등장과 다양한 산업에서의 응용 시나리오의 가치가 연마되고, 대용량 데이터의 축적으로 인한 제품 효과가 향상되면서 소비, 인터넷 등의 분야에서 인공지능 응용이 방사되고 있습니다. 제조업, 에너지, 전기 등 전통산업에 설계, 조달, 생산, 관리, 판매 등 경제 생산 활동의 주요 연결고리에서 다양한 산업 분야 기업의 인공지능 기술 및 적용 성숙도가 지속적으로 향상되고 있으며, 모든 연결고리에서 인공지능의 구현 및 적용 범위가 가속화되고 있습니다. 산업 상태를 개선하거나 운영 효율성을 최적화하고 자체 장점을 더욱 확장하기 위해 점차적으로 주요 사업과 통합합니다. 인공 지능 기술의 혁신적인 응용 프로그램의 대규모 구현은 빅 데이터 지능 시장의 활발한 발전을 촉진했으며 기본 데이터 거버넌스 서비스에 시장 활력을 불어넣었습니다. 빅데이터, 클라우드 컴퓨팅, 컴퓨팅으로

대중 과학: AI 대형 모델이란 무엇입니까? Jun 29, 2023 am 08:37 AM

AI 대형 모델은 대규모 데이터와 강력한 컴퓨팅 능력을 활용해 훈련한 인공지능 모델을 말한다. 이러한 모델은 일반적으로 높은 정확도와 일반화 능력을 갖고 있어 자연어 처리, 이미지 인식, 음성 인식 등 다양한 분야에 적용될 수 있습니다. 대규모 AI 모델을 훈련하려면 많은 양의 데이터와 컴퓨팅 리소스가 필요하며 일반적으로 훈련 프로세스를 가속화하려면 분산 컴퓨팅 프레임워크를 사용해야 합니다. 이러한 모델의 훈련 과정은 매우 복잡하며 데이터 분포, 기능 선택, 모델 구조 등에 대한 심층적인 연구와 최적화가 필요합니다. AI 대형 모델은 광범위한 응용 분야를 갖추고 있으며 스마트 고객 서비스, 스마트 홈, 자율 주행 등 다양한 시나리오에서 사용할 수 있습니다. 이러한 애플리케이션에서 AI 대형 모델은 사람들이 다양한 작업을 보다 빠르고 정확하게 완료하고 작업 효율성을 향상시키는 데 도움이 될 수 있습니다.

대규모 AI 모델 시대, 새로운 데이터 저장 기반으로 교육, 과학 연구의 디지털 지능 전환 촉진 Jul 21, 2023 pm 09:53 PM

AIGC(Generative AI)는 일반 인공지능(AI)의 새로운 시대를 열었습니다. 대형 모델을 중심으로 한 경쟁은 더욱 치열해졌습니다. 컴퓨팅 인프라가 경쟁의 주요 초점이 되었으며, 권력의 각성은 점점 더 업계의 합의가 되었습니다. 새로운 시대에는 대규모 모델이 단일 양식에서 다중 양식으로 이동하고 매개변수 및 교육 데이터 세트의 크기가 기하급수적으로 증가하며 동시에 대규모 비정형 데이터에는 고성능 혼합 로드 기능의 지원이 필요합니다. 데이터 집약적 새로운 패러다임이 인기를 얻고 있으며, 슈퍼컴퓨팅, 고성능 컴퓨팅(HPC)과 같은 애플리케이션 시나리오가 점점 더 심화되고 있습니다. 기존 데이터 스토리지 기반은 계속해서 업그레이드되는 요구 사항을 더 이상 충족할 수 없습니다. 컴퓨팅 파워, 알고리즘, 데이터가 인공지능 발전을 이끄는 '트로이카'라면, 외부 환경의 거대한 변화 속에서 이 세 가지가 시급히 역동성을 되찾아야 한다.

Vivo, 자체 개발한 범용 AI 모델 '블루 하트 모델' 출시 Nov 01, 2023 pm 02:37 PM

Vivo는 11월 1일 2023 개발자 컨퍼런스에서 자체 개발한 일반 인공지능 대형 모델 매트릭스인 Blue Heart 모델을 공개했습니다. Vivo는 Blue Heart 모델이 각각 서로 다른 매개변수 수준을 가진 5개 모델을 출시할 것이라고 발표했습니다. 여기에는 세 가지 수준의 매개변수가 포함되어 있습니다. : 10억, 수백억, 수천억의 핵심 시나리오를 다루며, 모델 역량은 업계 선두 위치에 있습니다. Vivo는 좋은 자체 개발 대형 모델은 대규모, 포괄적인 기능, 강력한 알고리즘, 안전하고 신뢰할 수 있는, 독립적인 진화라는 다섯 가지 요구 사항을 충족해야 하며 널리 오픈 소스여야 한다고 믿습니다. 그 중 내용은 다음과 같습니다. 첫 번째는 블루하트 모델인 모델 7B로, 이는 휴대폰과 클라우드의 듀얼 서비스를 제공하도록 설계된 70억대 모델이다. Vivo는 이 모델이 언어 이해, 텍스트 생성 등의 분야에 사용될 수 있다고 말했습니다.

인간의 두뇌와 관련하여, 망각하는 법을 배우면 대형 AI 모델이 더 좋아질까요? Mar 12, 2024 pm 02:43 PM

최근 컴퓨터 과학자 팀은 기존의 대규모 언어 모델에서는 볼 수 없는 기능인 알려진 정보를 주기적으로 잊어버리는 기능을 갖춘 보다 유연하고 탄력적인 기계 학습 모델을 개발했습니다. 실제 측정에 따르면 많은 경우 "망각 방법"이 훈련에 매우 효율적이며 망각 모델이 더 잘 수행되는 것으로 나타났습니다. 기초과학연구원의 권재아 AI 엔지니어는 “이번 연구는 AI 분야에서 상당한 진전을 의미한다”고 말했다. '망각법' 훈련 효율은 현재 주류 AI 언어 엔진의 대부분이 인공 신경망 기술을 사용하고 있다. 이 네트워크 구조의 각 "뉴런"은 실제로 수학적 기능으로 서로 연결되어 정보를 수신하고 전송합니다.

AI 대형모델이 인기! 거대 기술 기업들이 동참했고, 여러 곳의 정책 시행이 가속화되었습니다.

최근 인공지능은 다시 한번 인간 혁신의 화두가 되었고, 인공지능을 둘러싼 군비 경쟁은 그 어느 때보다 치열해졌다. 새로운 트렌드를 놓칠까 봐 기술 대기업들이 대형 모델 전쟁에 동참하고 있을 뿐만 아니라, 베이징, 상하이, 선전 등지에서도 대형 모델 혁신 알고리즘과 핵심 기술에 대한 연구를 수행하기 위한 정책과 조치를 도입했습니다. 인공지능 혁신의 고지를 만드는 기술. AI 대형 모델이 호황을 누리고 있으며, 주요 기술 대기업도 대거 합류했습니다. 최근 2023년 중관촌 포럼에서 발표된 '중국 인공지능 대형 모델 지도 연구 보고서'에서는 중국의 인공지능 대형 모델이 호황을 누리는 발전 추세를 보이고 있으며, 업계의 많은 회사에서 영향력 있는 대형 모델. Baidu의 창립자이자 회장이자 CEO인 Robin Li는 우리가 새로운 출발점에 있다고 직설적으로 말했습니다.

강의예약│5명의 전문가 토론: 신기술의 물결 속에서 AI 대형 모델이 신약 연구개발에 어떤 영향을 미칠까? Jun 08, 2023 am 11:27 AM

1978년에 스튜어트 마슨(Stuart Marson)과 캘리포니아 대학의 다른 사람들은 세계 최초의 CADD 상업 회사를 설립하고 화학 반응 및 데이터베이스 검색 시스템 개발을 개척했습니다. 이후 CADD(Computer-Aided Drug Design)는 급속한 발전 시대에 접어들었고 제약회사가 약물 연구 및 개발을 수행하는 중요한 수단 중 하나가 되어 이 분야에 혁명적인 업그레이드를 가져왔습니다. 1981년 10월 5일 포춘(Fortune)지는 "차세대 산업 혁명: 머크가 컴퓨터를 통해 약을 설계하다"라는 제목의 표지 기사를 게재하여 공식적으로 CADD 기술의 출현을 알렸습니다. 1996년에는 SBDD(구조 기반 약물 설계)를 기반으로 개발된 최초의 약물 탄산탈수효소 억제제가 성공적으로 시장에 출시되었으며, CADD는 약물 연구 및 개발에 널리 사용되었습니다.

See all articles

AI 대형 모델 시대의 발전은 안정적인 진행을 위해 고급 스토리지 기술이 필요합니다.

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제