美 메타, 베트남 AI 개발 위한 오픈소스 베트남어 데이터 세트 구축 협력

(VOVWORLD) - 미국 메타 그룹은 최근 베트남 국가혁신센터(NIC), 재정부와 협력하여 고품질의 오픈 소스 베트남어 데이터 세트를 구축하는 ‘ViGen’ 프로젝트를 발표했다. 이 프로젝트는 인공지능(AI) 개발 과정에서 베트남어의 입지를 강화하고 디지털 경제의 획기적이고 지속 가능한 발전에 기여하는 것을 목표로 한다.
美 메타, 베트남 AI 개발 위한 오픈소스 베트남어 데이터 세트 구축 협력 - ảnh 1사진: chinhphu.vn

지난 3월 14일에서 열린 프로젝트 출범식에서 메타의 사림 아지즈(Sarim Aziz) 공공정책 담당 이사는 다음과 같이 밝혔다.

“해당 이니셔티브는 베트남의 AI 기술 효율성 및 적용을 향상시키는 것을 목표로 합니다. 베트남 연구원, 개발자, 스타트업, 기업 및 베트남과 협력하려는 전 세계 파트너들에게 무료 및 쉬운 접근을 보장합니다. 더욱 중요한 것은 이 데이터 플랫폼이 베트남의 연구를 촉진할 뿐만 아니라 민간 부문의 혁신을 촉진하여 베트남을 새로운 혁신의 시대로 이끌 것입니다.”

계획에 따르면 메타는 AI 프로그램의 오픈 소스 데이터 세트 및 사회 공익을 위한 데이터를 기여할 것이다. 여기에는 이동 및 사회적 연결에 대한 세부 정보는 물론 AI 지원 인구 지도의 훈련 데이터도 포함된다.

한편, 현재 AI 데이터의 99% 이상이 영어 및 기타 언어로 구성되어 있으며, 베트남어 데이터는 1% 미만에 불과하다. 따라서 베트남 AI 모델은 적절한 데이터 파일로 학습되지 않아 정확성과 효율성이 제한적이다. AI 학습 및 평가를 위한 대규모 고품질 오픈 소스 베트남어 데이터 세트 개발이 시급한 우선순위로 부상했다. 베트남어 데이터 세트는 베트남이 발전에 AI의 강점을 활용하는 데 도움이 될 것으로 보인다.

피드백

기타