KT가 자체 개발한 한국형 AI 언어모델 ‘믿:음 2.0’을 공개하고, 오픈소스 플랫폼 ‘허깅페이스(Hugging Face)’를 통해 누구나 상업적으로 자유롭게 활용할 수 있도록 전면 개방했다고 3일 밝혔다. 이는 국내 기업 중 110억 파라미터급 이상의 한국어 기반 LLM을 상업 이용까지 허용한 첫 사례다.
이번에 공개된 믿:음 2.0은 대규모 모델 ‘믿:음 2.0 Base’(115억 파라미터)와 경량 모델 ‘믿:음 2.0 Mini’(23억 파라미터) 2종으로, 모두 한국어와 영어를 지원한다. KT는 “이번 공개를 계기로 국내 AI 생태계의 실용성과 접근성이 대폭 강화될 것”이라고 강조했다.
KT는 이 모델이 한국어의 구조와 사회·문화적 맥락을 반영해 만들어졌으며, 한국 특화 데이터만을 기반으로 사전 학습됐다고 밝혔다. 저작권 검수까지 마친 고품질 데이터만을 활용했으며, 한국어 언어 특성을 반영한 전용 토크나이저도 자체 개발해 정확성을 높였다.
믿:음 2.0은 고려대와 공동 개발한 한국어 특화 AI 벤치마크 ‘Ko-Sovereign’에서 국내외 주요 LLM들을 뛰어넘는 평가 점수를 기록했으며, 한국어 일반성 평가인 KMMLU, HAERAE 등에서도 우수한 성능을 입증했다.
KT는 또한 AI 윤리성과 신뢰성을 높이기 위해 자체 ‘AI 영향 평가 체계’를 적용했다. 이 체계는 국내외 AI 정책과 가이드라인을 기반으로 전문가들과 공동 설계한 것이다.
믿:음 2.0은 AI 반도체 스타트업 리벨리온과의 협력을 통해 국산 AI 칩에서 최적화된 성능을 구현했으며, 프렌들리AI와는 일반 사용자 대상의 무설치 체험 환경을 한시적으로 제공한다. KT는 허깅페이스에서의 접근성과 실용성 확대를 통해 일반 개발자와 기업, 공공기관 누구나 쉽게 활용할 수 있도록 지원할 예정이다.
KT는 향후 마이크로소프트와 협업해 GPT-4 기반 한국형 AI 모델도 선보일 계획이다. 신동훈 KT Gen AI Lab장(CAIO)은 “믿:음 2.0은 KT의 AI 철학인 ‘한국적 AI’의 실현을 위한 본격적인 첫걸음”이라며 “AI 생태계 전반에 긍정적 파급력을 줄 수 있는 상징적 모델이 될 것”이라고 밝혔다.