美 메타, 베트남 AI 개발 위한 오픈소스 베트남어 데이터 세트 구축 협력
(VOVWORLD) - 미국 메타 그룹은 최근 베트남 국가혁신센터(NIC), 재정부와 협력하여 고품질의 오픈 소스 베트남어 데이터 세트를 구축하는 ‘ViGen’ 프로젝트를 발표했다. 이 프로젝트는 인공지능(AI) 개발 과정에서 베트남어의 입지를 강화하고 디지털 경제의 획기적이고 지속 가능한 발전에 기여하는 것을 목표로 한다.
지난 3월 14일에서 열린 프로젝트 출범식에서 메타의 사림 아지즈(Sarim Aziz) 공공정책 담당 이사는 다음과 같이 밝혔다.
“해당 이니셔티브는 베트남의 AI 기술 효율성 및 적용을 향상시키는 것을 목표로 합니다. 베트남 연구원, 개발자, 스타트업, 기업 및 베트남과 협력하려는 전 세계 파트너들에게 무료 및 쉬운 접근을 보장합니다. 더욱 중요한 것은 이 데이터 플랫폼이 베트남의 연구를 촉진할 뿐만 아니라 민간 부문의 혁신을 촉진하여 베트남을 새로운 혁신의 시대로 이끌 것입니다.”
계획에 따르면 메타는 AI 프로그램의 오픈 소스 데이터 세트 및 사회 공익을 위한 데이터를 기여할 것이다. 여기에는 이동 및 사회적 연결에 대한 세부 정보는 물론 AI 지원 인구 지도의 훈련 데이터도 포함된다.
한편, 현재 AI 데이터의 99% 이상이 영어 및 기타 언어로 구성되어 있으며, 베트남어 데이터는 1% 미만에 불과하다. 따라서 베트남 AI 모델은 적절한 데이터 파일로 학습되지 않아 정확성과 효율성이 제한적이다. AI 학습 및 평가를 위한 대규모 고품질 오픈 소스 베트남어 데이터 세트 개발이 시급한 우선순위로 부상했다. 베트남어 데이터 세트는 베트남이 발전에 AI의 강점을 활용하는 데 도움이 될 것으로 보인다.