데이터는 인공지능의 핵심입니다. 좋은 데이터가 없으면 유용한 AI 모델을 개발할 가능성은 희박합니다. 이를 염두에 두고 지난 주 미국 상무부는 생산 인공 지능(GenAI) 모델 구축을 위한 수많은 공개 데이터 세트를 더 잘 준비하는 방법에 대한 공개 요청을 발표했습니다. 이 공개 요청은 현재 인공 지능 분야가 직면한 중요한 문제, 즉 고품질의 다양한 공개 데이터 세트가 부족하다는 문제를 해결합니다. 이러한 데이터세트는 기계 학습 모델을 훈련하고, 혁신을 촉진하고, AI 애플리케이션 개발을 추진하는 데 중요합니다. 이 공개 요청을 통해 부서는 공개 데이터 세트를 구축하고 관리하는 방법을 더 잘 이해하기 위해 모든 당사자의 의견을 수집하기를 희망합니다. 그들은 듣고 싶어합니다
미국 상무부는 4월 17일에 "업계 전문가, 연구원, 시민 사회 단체 및 기타 대중에게" 개발 방법에 대한 의견을 제공하도록 요청하는 정보 요청(RFI)을 발행했습니다. 인공지능 'Smart Open Dataset'을 활성화해 도와드립니다.
상무부는 스스로를 "미국 데이터 기관"이라고 부르며 경제, 인구, 환경에 대한 데이터를 포함하여 미국에 관한 다양한 데이터를 수집, 저장 및 분석하는 일을 담당합니다. 상업용 데이터 센터를 빠르게 검색하면 기후 및 날씨부터 특허, 인구 조사 정보에 이르기까지 다양한 주제에 대해 공개적으로 액세스할 수 있는 122,000개 이상의 데이터 세트가 표시됩니다.
이 섹션은 수년에 걸쳐 기술이 변화하고 개선됨에 따라 데이터 관리 및 데이터 공유 활동을 현재 기술 표준에 맞게 유지하는 데 도움을 주기 위한 것입니다. 기계가 읽을 수 있는 형식이나 웹 서비스 및 API를 통해 전자적으로 데이터에 액세스하는 것은 데이터 서비스를 시대에 맞게 조정하는 예입니다.
이제 GenAI 혁명이 도래하면서 업계에서는 인공지능 모델을 구축하는 데 사용할 데이터의 가장 적합한 위치를 찾고 있습니다.
미국 상무부 최고 데이터 책임자인 올리버 와이즈(Oliver Wise)는 정보 요청에 다음과 같이 썼습니다. “오늘날 인공 지능 기술의 출현으로 상무부는 사용자에게 더 나은 정보를 제공하는 새로운 기술 변화에 직면해 있습니다. "비즈니스는 특히 다양한 소스의 텍스트, 이미지, 오디오, 비디오 및 기타 유형의 정보를 소화하여 새로운 GenAI 및 기타 인공 콘텐츠를 생성할 수 있는 생성적 인공 지능(GenAI) 애플리케이션에 관심이 있습니다. 스마트 기술은 기회와 정부 기관, 업계, 학계, 미국 국민을 포함한 기업 및 데이터 사용자와 같은 데이터 제공업체에 대한 과제입니다.” 단어 수는 482개를 초과해서는 안 됩니다.
"스마트"는 비즈니스 부문이 직면한 가장 큰 과제를 식별하는 것입니다
. "최근 AI 시스템은 대량의 디지털 콘텐츠를 학습하고 콘텐츠의 맥락에 따라 응답을 생성합니다." "그러나 이러한 시스템은 텍스트를 의미 있는 방식으로 진정으로 '이해'하지 않습니다." 기계가 읽을 수 있을 뿐만 아니라 "기계가 이해할 수 있는" 데이터에 액세스할 수 있습니다. 오늘날의 AI 시스템은 이해를 바탕으로 추론하고 판단하는 능력보다는 기본 데이터에 의존하는 대규모 비정형 데이터 저장소에 의존한다는 점에서 한계가 있습니다.
상무부는 GenAI 기술의 이러한 근본적인 한계를 고려하여 데이터 공유에 대한 도움을 구하고 있습니다. 읽기 쉽고 이해할 수 있는 데이터에 대한 라이센스 표준을 포함한 새로운 데이터 보급 표준을 찾고 있습니다. 데이터 접근성 및 검색 측면에서, 부서는 API나 "웹 크롤러"를 통해 데이터에 더 쉽게 접근할 수 있는 방법에 대한 제안을 원합니다.
사람의 용어를 데이터에 더 잘 연결하기 위해 메타데이터를 활용하는 지식 그래프를 사용하는 방법이 특히 필요합니다. 또한 Schema.org 또는 NIEM과 같은 표준 온톨로지 채택과 지식 그래프가 온톨로지 및 어휘를 "조화하고 연결"하는 데 어떻게 도움이 될 수 있는지에 대한 방향을 얻기를 희망합니다.
부서에서는 최고 수준의 데이터 무결성, 품질, 보안 및 윤리를 유지하면서 이러한 데이터 표준화 노력을 발전시키는 방법에 대한 커뮤니티의 의견을 구합니다.
Wise는 이해관계자에게 "AI 지원 오픈 데이터 자산 정보 요청 양식"이라는 제목의 이메일을 통해 제안서를 보내줄 것을 요청합니다. 7월 16일 이전에 이러한 주제에 대한 의견이나 피드백을 받을 수 있기를 바랍니다.
위 내용은 미국 상무부는 GenAI 데이터 준비에 대한 의견과 제안을 공개적으로 요청합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!