기술 주변기기 일체 포함 대형모델의 '골든파트너'가 여기 있다! Tencent Cloud, 10억 개 수준의 벡터 검색 기능을 제공하는 AI 기본 벡터 데이터베이스 공식 출시

대형모델의 '골든파트너'가 여기 있다! Tencent Cloud, 10억 개 수준의 벡터 검색 기능을 제공하는 AI 기본 벡터 데이터베이스 공식 출시

Jul 06, 2023 am 08:37 AM
대형 모델 아이 원주민 벡터 데이터베이스

7월 4일, Tencent Cloud는 AI 네이티브(AI Native) 벡터 데이터베이스 Tencent Cloud VectorDB를 공식 출시했습니다. 이 데이터베이스는 대규모 모델 훈련, 추론, 지식 기반 보완과 같은 시나리오에서 널리 사용될 수 있습니다. 이는 액세스 계층, 컴퓨팅 계층에서 스토리지 계층까지 전체 수명 주기 AI를 제공하는 중국 최초의 벡터 데이터베이스입니다.

업계에서는 대형 모델의 "해마"라고 불리는 벡터 데이터베이스는 벡터 데이터를 저장하고 쿼리하도록 특별히 설계되었습니다. 보고서에 따르면 Tencent Cloud의 벡터 데이터베이스는 최대 10억 개의 벡터 검색 규모를 지원하며 대기 시간은 밀리초 수준으로 제어됩니다. 기존 독립형 플러그인 데이터베이스에 비해 검색 규모가 10배 증가했으며, 최대 쿼리 용량은 초당 백만 레벨(QPS)입니다.

Tencent Cloud는 AI 기본 벡터 데이터베이스를 정의합니다

대형 모델 시대가 도래하면서 기업의 대형 모델 수용은 필수가 되었습니다.

벡터 데이터베이스는 데이터를 벡터화하여 효율성을 크게 향상시키고 비용을 절감할 수 있습니다. 대형 모델의 높은 사전 훈련 비용, "장기 기억" 없음, 지식 업데이트 부족, 복잡한 프롬프트 단어 엔지니어링 문제를 해결하고 대형 모델의 시간 및 공간 제한을 극복하고 대형 모델의 구현을 가속화할 수 있습니다. 산업 시나리오의 모델.

통계에 따르면 Tencent Cloud 벡터 데이터베이스를 사용하여 대규모 모델 사전 훈련 데이터를 분류, 중복 제거 및 정리하면 벡터 데이터베이스를 모델 추론을 위한 외부 지식 기반으로 사용하는 경우 효율성이 10배 향상될 수 있습니다. 비용을 2~4배 정도 줄일 수 있습니다.

Tencent Cloud는 AI 네이티브의 개발 패러다임을 재정의하고 액세스 레이어, 컴퓨팅 레이어, 스토리지 레이어에 대한 포괄적인 AI 솔루션을 제공하여 사용자가 이를 벡터 AI 사용의 전체 라이프사이클에 적용할 수 있게 했다는 점에 주목할 필요가 있습니다. 능력.

구체적으로 액세스 계층에서 Tencent Cloud 벡터 데이터베이스는 자연어 텍스트 입력을 지원하고 "스칼라 + 벡터" 쿼리 방법을 채택하며 전체 메모리 인덱싱을 지원하고 초당 최대 100만 쿼리(QPS)를 지원합니다. 컴퓨팅 계층인 AI 네이티브 개발 패러다임은 기업이 스토리지 계층인 Tencent Cloud에서 개인 도메인 지식 기반을 구축할 때 전체 데이터 AI 계산을 실현하고 텍스트 분할(세분화) 및 벡터화(임베딩)와 같은 문제를 원스톱으로 해결할 수 있습니다. Vector 데이터베이스는 데이터의 지능형 스토리지 배포를 지원하여 기업이 스토리지 비용을 50% 절감할 수 있도록 지원합니다.

대형모델의 골든파트너가 여기 있다! Tencent Cloud, 10억 개 수준의 벡터 검색 기능을 제공하는 AI 기본 벡터 데이터베이스 공식 출시

예전에는 기업이 대규모 모델에 액세스하는 데 약 한 달이 걸렸습니다. Tencent Cloud 벡터 데이터베이스를 사용하면 3일 만에 완료할 수 있어 기업의 액세스 비용이 크게 절감됩니다.

Tencent Cloud 벡터 데이터베이스의 벡터화 기능(임베딩)은 권위 있는 기관에서 여러 차례 인정을 받은 것으로 알려져 있으며, 2021년에는 MS MARCO 목록에서 1위를 차지했으며 관련 결과가 NLP Summit ACL에 게시되었습니다.

Tencent Cloud Database의 Luo Yun 부사장은 AI 네이티브 시대가 도래했다고 말했습니다. "벡터 데이터베이스 + 대형 모델 + 데이터"는 '플라이휠 효과'를 생성하여 기업이 AI 네이티브 시대로 진입하는 데 공동으로 도움이 될 것입니다. )연대.

Tencent Cloud 벡터 데이터베이스는 데이터 액세스 효율성을 10배 향상시킵니다.

Tencent Cloud 벡터 데이터베이스는 매일 수천억 건의 검색을 처리하는 Tencent Group의 벡터 엔진(OLAMA)을 기반으로 합니다. Tencent 내부의 대규모 시나리오에서 실습한 결과 AI에 대한 데이터 액세스 효율성도 기존 솔루션보다 10배 더 높습니다. , 작동 안정성은 99.99%에 달하며 Tencent Video, QQ Browser, QQ Music 등 30개 이상의 국가급 제품에 사용되었습니다.

Tencent Cloud 벡터 데이터베이스는 제품의 운영 효율성을 향상시키는 데 효과적으로 도움을 줄 수 있습니다. 데이터에 따르면 Tencent Cloud 벡터 데이터베이스를 사용한 후 QQ Music의 1인당 청취 시간은 3.2% 증가했고 Tencent Video의 1인당 유효 노출 시간은 1.74% 증가했으며 QQ 브라우저 비용은 37.9% 감소했습니다.

Tencent Video 애플리케이션을 예로 들면, 동영상 라이브러리의 이미지, 오디오, 제목 텍스트 및 기타 콘텐츠는 Tencent Cloud 벡터 데이터베이스를 사용하여 월 평균 검색 및 계산량이 200억 회에 달하며 이는 저작권 요구 사항을 효과적으로 충족합니다. 보호, 원본 식별, 유사성 등 성적 검색과 같은 시나리오 요구 사항.

대형 모델 가속 벡터 데이터베이스는 급속한 발전기에 접어들었습니다. 동북증권에 따르면, 글로벌 벡터 데이터베이스 시장은 2030년까지 500억 달러에 이를 것으로 예상되며, 국내 벡터 데이터베이스 시장은 600억 위안을 초과할 것으로 예상됩니다.

벡터 데이터베이스는 기업이 대형 모델을 보다 효율적이고 편리하게 사용할 수 있도록 지원하여 데이터의 가치를 극대화합니다. 대형 모델의 지속적인 개발과 대중화로 AI 네이티브 벡터 데이터베이스는 기업 데이터 처리의 표준이 될 것입니다.

위 내용은 대형모델의 '골든파트너'가 여기 있다! Tencent Cloud, 10억 개 수준의 벡터 검색 기능을 제공하는 AI 기본 벡터 데이터베이스 공식 출시의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25 : Myrise에서 모든 것을 잠금 해제하는 방법
4 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

대형 모델 앱 Tencent Yuanbao가 온라인에 출시되었습니다! Hunyuan은 어디서나 휴대할 수 있는 만능 AI 비서로 업그레이드되었습니다. 대형 모델 앱 Tencent Yuanbao가 온라인에 출시되었습니다! Hunyuan은 어디서나 휴대할 수 있는 만능 AI 비서로 업그레이드되었습니다. Jun 09, 2024 pm 10:38 PM

5월 30일, Tencent는 Hunyuan 모델의 포괄적인 업그레이드를 발표했습니다. Hunyuan 모델을 기반으로 하는 앱 "Tencent Yuanbao"가 공식 출시되었으며 Apple 및 Android 앱 스토어에서 다운로드할 수 있습니다. 이전 테스트 단계의 Hunyuan 애플릿 버전과 비교하여 Tencent Yuanbao는 일상 생활 시나리오를 위한 작업 효율성 시나리오를 위한 AI 검색, AI 요약 및 AI 작성과 같은 핵심 기능을 제공하며 Yuanbao의 게임 플레이도 더욱 풍부해지고 다양한 기능을 제공합니다. , 개인 에이전트 생성과 같은 새로운 게임 플레이 방법이 추가됩니다. Tencent Cloud 부사장이자 Tencent Hunyuan 대형 모델 책임자인 Liu Yuhong은 "Tencent는 먼저 대형 모델을 만들기 위해 노력하지 않을 것입니다."라고 말했습니다. Tencent Hunyuan 대형 모델 비즈니스 시나리오에서 풍부하고 방대한 폴란드 기술을 활용하면서 사용자의 실제 요구 사항에 대한 통찰력을 얻습니다.

Bytedance Beanbao 대형 모델 출시, Volcano Engine 풀스택 AI 서비스로 기업의 지능적 혁신 지원 Bytedance Beanbao 대형 모델 출시, Volcano Engine 풀스택 AI 서비스로 기업의 지능적 혁신 지원 Jun 05, 2024 pm 07:59 PM

Volcano Engine의 Tan Dai 사장은 대형 모델을 구현하려는 기업은 모델 효율성, 추론 비용, 구현 어려움이라는 세 가지 주요 과제에 직면하게 된다고 말했습니다. 복잡한 문제를 해결하기 위한 지원으로 좋은 기본 대형 모델이 있어야 하며, 서비스를 통해 대규모 모델을 널리 사용할 수 있으며 기업이 시나리오를 구현하는 데 더 많은 도구, 플랫폼 및 애플리케이션이 필요합니다. ——Tan Dai, Huoshan Engine 01 사장. 대형 빈백 모델이 출시되어 많이 사용되고 있습니다. 모델 효과를 연마하는 것은 AI 구현에 있어 가장 중요한 과제입니다. Tan Dai는 좋은 모델은 많은 양의 사용을 통해서만 연마될 수 있다고 지적했습니다. 현재 Doubao 모델은 매일 1,200억 개의 텍스트 토큰을 처리하고 3,000만 개의 이미지를 생성합니다. 기업이 대규모 모델 시나리오를 구현하는 데 도움을 주기 위해 ByteDance가 독자적으로 개발한 beanbao 대규모 모델이 화산을 통해 출시됩니다.

Shengteng AI 기술을 사용한 Qinling·Qinchuan 교통 모델은 Xi'an이 스마트 교통 혁신 센터를 구축하는 데 도움이 됩니다. Shengteng AI 기술을 사용한 Qinling·Qinchuan 교통 모델은 Xi'an이 스마트 교통 혁신 센터를 구축하는 데 도움이 됩니다. Oct 15, 2023 am 08:17 AM

"높은 복잡성, 높은 단편화 및 교차 도메인"은 항상 운송 산업의 디지털 및 지능적 업그레이드로 가는 길의 주요 문제점이었습니다. 최근에는 China Vision, Xi'an Yanta District Government, Xi'an Future Artificial Intelligence Computing Center가 공동으로 구축한 매개변수 규모 1,000억 규모의 '친링·친추안 교통 모델'이 스마트 교통 및 스마트 교통 분야를 지향하고 있습니다. 시안과 그 주변 지역에 서비스를 제공하여 스마트 교통 혁신의 거점을 만들 것입니다. '친링·친추안 교통 모델'은 개방형 시나리오의 시안의 대규모 지역 교통 생태 데이터, China Vision이 독자적으로 개발한 독창적인 고급 알고리즘, 시안 미래 인공 지능 컴퓨팅 센터의 Shengteng AI의 강력한 컴퓨팅 성능을 결합하여 도로를 제공합니다. 네트워크 모니터링, 비상 명령, 유지 관리, 대중 교통 등 스마트 교통 시나리오는 디지털 및 지능적 변화를 가져옵니다. 교통 관리는 도시마다 특성이 다르며 도로 교통도 다릅니다.

NVIDIA 대규모 모델 추론 프레임워크 살펴보기: TensorRT-LLM NVIDIA 대규모 모델 추론 프레임워크 살펴보기: TensorRT-LLM Feb 01, 2024 pm 05:24 PM

1. TensorRT-LLM의 제품 포지셔닝 TensorRT-LLM은 NVIDIA에서 LLM(대형 언어 모델)을 위해 개발한 확장 가능한 추론 솔루션입니다. TensorRT 딥 러닝 컴파일 프레임워크를 기반으로 계산 그래프를 구축, 컴파일 및 실행하고 FastTransformer의 효율적인 커널 구현을 활용합니다. 또한 장치 간 통신에는 NCCL을 활용합니다. 개발자는 커틀라스를 기반으로 한 맞춤형 GEMM을 개발하는 등 기술 개발 및 수요 차이를 기반으로 특정 요구 사항을 충족하도록 운영자를 맞춤화할 수 있습니다. TensorRT-LLM은 고성능을 제공하고 실용성을 지속적으로 개선하기 위해 노력하는 NVIDIA의 공식 추론 솔루션입니다. 텐서RT-LL

벤치마크 GPT-4! 차이나 모바일의 Jiutian 대형 모델이 이중 등록을 통과했습니다. 벤치마크 GPT-4! 차이나 모바일의 Jiutian 대형 모델이 이중 등록을 통과했습니다. Apr 04, 2024 am 09:31 AM

4월 4일 뉴스에 따르면 중국 사이버공간국은 최근 등록된 대형 모델 목록을 공개했는데, 여기에 차이나 모바일의 'Jiutian Natural Language Interaction Large Model'이 포함돼 있어 차이나 모바일의 Jiutian AI 대형 모델이 공식적으로 생성 인공 지능을 제공할 수 있음을 알렸다. 외부 세계에 대한 정보 서비스. 차이나 모바일은 이 모델이 중앙 기업이 개발한 최초의 대규모 모델로 국가 '생성 인공 지능 서비스 등록'과 '국내 심층 합성 서비스 알고리즘 등록' 이중 등록을 모두 통과했다고 밝혔습니다. 보고서에 따르면 Jiutian의 자연어 상호 작용 대형 모델은 향상된 산업 역량, 보안 및 신뢰성을 갖추고 있으며 풀 스택 현지화를 지원하며 90억, 139억, 570억, 1000억 등 다양한 매개변수 버전을 형성했습니다. 클라우드에 유연하게 배포할 수 있으며 엣지와 엔드는 상황이 다릅니다.

산업지식 그래프 고급실습 산업지식 그래프 고급실습 Jun 13, 2024 am 11:59 AM

1. 배경 소개 먼저 Yunwen Technology의 발전 역사를 소개하겠습니다. Yunwen Technology Company...2023년은 대형 모델이 유행하는 시기입니다. 많은 기업에서는 대형 모델 이후 그래프의 중요성이 크게 감소했으며 이전에 연구된 사전 설정 정보 시스템이 더 이상 중요하지 않다고 생각합니다. 그러나 RAG의 홍보와 데이터 거버넌스의 확산으로 우리는 보다 효율적인 데이터 거버넌스와 고품질 데이터가 민영화된 대형 모델의 효율성을 향상시키는 중요한 전제 조건이라는 것을 알게 되었습니다. 따라서 점점 더 많은 기업이 주목하기 시작했습니다. 지식 구축 관련 콘텐츠에 이는 또한 탐구할 수 있는 많은 기술과 방법이 있는 더 높은 수준으로 지식의 구성 및 처리를 촉진합니다. 신기술의 출현이 기존 기술을 모두 패배시키는 것이 아니라, 신기술과 기존 기술을 통합할 수도 있음을 알 수 있습니다.

새로운 테스트 벤치마크 공개, 가장 강력한 오픈소스 라마3 당황스럽다 새로운 테스트 벤치마크 공개, 가장 강력한 오픈소스 라마3 당황스럽다 Apr 23, 2024 pm 12:13 PM

시험 문제가 너무 단순하면 상위권 학생과 하위 학생 모두 90점을 받을 수 있어 격차가 더 벌어질 수 없다… 클로드3, 라마3, 심지어 GPT-5 등 더욱 강력한 모델이 출시되면서 업계는 보다 어렵고 차별화된 모델 벤치마크가 시급히 필요합니다. 대형 모델 아레나를 운영하는 조직인 LMSYS가 차세대 벤치마크인 Arena-Hard를 출시해 큰 관심을 끌었습니다. Llama3 명령의 두 가지 미세 조정 버전의 강점에 대한 최신 참조도 있습니다. 이전에 비슷한 점수를 받았던 MTBench와 비교하면 Arena-Hard 판별력이 22.6%에서 87.4%로 증가해 한눈에 봐도 강하고 약해졌습니다. Arena-Hard는 경기장의 실시간 인간 데이터를 사용하여 구축되었으며 인간 선호도와 89.1%의 일치율을 가지고 있습니다.

샤오미 바이트가 힘을 합쳤습니다! Xiao Ai의 Doubao 액세스 대형 모델: 휴대폰과 SU7에 이미 설치되어 있음 샤오미 바이트가 힘을 합쳤습니다! Xiao Ai의 Doubao 액세스 대형 모델: 휴대폰과 SU7에 이미 설치되어 있음 Jun 13, 2024 pm 05:11 PM

6월 13일 뉴스에 따르면 Byte의 'Volcano Engine' 공개 계정에 따르면 Xiaomi의 인공 지능 비서인 'Xiao Ai'가 Volcano Engine과 협력을 이루었습니다. 두 당사자는 beanbao 대형 모델을 기반으로 보다 지능적인 AI 상호 작용 경험을 달성할 것입니다. . ByteDance가 만든 대형 빈바오 모델은 매일 최대 1,200억 개의 텍스트 토큰을 효율적으로 처리하고 3,000만 개의 콘텐츠를 생성할 수 있는 것으로 알려졌습니다. Xiaomi는 Doubao 대형 모델을 사용하여 자체 모델의 학습 및 추론 능력을 향상시키고 사용자 요구를 보다 정확하게 파악할 뿐만 아니라 보다 빠른 응답 속도와 보다 포괄적인 콘텐츠 서비스를 제공하는 새로운 "Xiao Ai Classmate"를 만들었습니다. 예를 들어, 사용자가 복잡한 과학 개념에 대해 질문하면 &ldq

See all articles