AI/ML/DL 영역에는 다양한 소프트웨어들 및 eco-system 이 존재하고 있지만 기본적으로는 개발자들이 필요로 하는 자원을 종합적으로 제공하는 것이 필수입니다.
ai.Accelerator 플랫폼의 핵심 설계 목표는 이러한 다양한 요구 사항을 체계적으로 지원하는 것입니다. Windows 또는 Linux 기반 혹은 필요한 소프트웨어 스택을 빠르게 제공하여 개발자들이 원활하게 작업할 수 있도록
지원합니다. 공유 자원의 최적화된 활용을 위하여 개발자들의 역량 또는 교육/개발/서비스 제공과 같은 사용 목적에 따라 우선순위를 부여하여 자원을 할당합니다.
개발자들에 따라서 선호하는 환경은 Windows 또는 Linux 으로 가변적입니다. ai.Accelerator 는 하나의 클러스터 내에서 이러한 2가지 환경을 모두 지원합니다. 특히 GPU 와 같은 고가의 자원들도 공유하여 사용함으로써 자원의 활용성을 증대 시킵니다. 개발자는 관리서버에 접속하여 선호하는 환경을 선택하고 활용할 수 있습니다.
공유 계산 자원을 효율적으로 사용하기 위해서는 자원 할당 정책이 다양하여야 합니다. 기본적인 CPU/메모리/스토리지 용량 및 GPU 수량이외에 개발자의 역량 또는 계산 자원 사용 목적 (교육, 개발, 서비스 제공) 에 따라 우선 순위를 조정하여 할당합니다. 이러한 과정을 통해서 자원 부족 상황 시 전체적이 효율성을 증대 시킵니다.
(주) 관리자는 강제로 개발자 인스턴스를 KILL 할 수 있습니다.
AI 에서 사용하는 데이터들은 전사적으로 관리되고 있는 대용량 파일 혹은 다량의 파일들입니다. 이러한 데이터들은 통상적으로 고속 병렬파일시스템 기반 이거나 다수의 계산 서버들과 공유되어야 함으로 Linux 기반으로 구성됩니다. Windows 사용자들이 이러한 데이터를 쉽게 접속할 수 경량화 된 기능을 제공합니다.
개발자들이 사용하는 소프트웨어 스택은 지속적으로 변경되고 진화됩니다. 이러한 상황을 관리자가 효율적으로 지원하기 위하여 개발자의 요청 사항을 등록하고 처리할 수 있는 기능을 제공합니다.
ai.Accelerator 는 관리자들에게 운영 효율성을 제공하며 모델 개발자들에게는 편의성을 제공합니다.
공통적으로 제공하는 Image의 소프트웨어 스택 정보를 통합 관리하여 업그레이드와 같은 작업 용이
공공 및 엔터프라이즈 영역에서 AI 관련 다양한 사업을 통해서 고객 요구 사항을 충족시키고 있으며 이를 바탕으로 ai.Accelerator 기능을 확장 시키고 검증하고 있습니다.
고등과학원 인공지능 연구 클러스터 구축
NHN AI센터용 스토리지 장비 제조 위탁계약
국내 철강기업의 ML 어플리케이션 개발을 위한 플랫폼으로 활용 중이며 다양한 역량의 개발자 지원 및 AS-IS 시스템과 연계를 통한 효율성 제고를 위한 과제들이 추진되고 있습니다.
window 및 linux 기반 연구자