• 인쇄
  • 전송
  • 보관
  • 기사목록

SK텔레콤, 한국어 특화 LLM ‘A.X 4.0’ 오픈소스로 공개

GPT-4o 능가하는 한국어 처리력…기업용 온프레미스 지원으로 데이터 보안 강화

  •  

cnbnews 김한준⁄ 2025.07.03 10:15:32

A.X 4.0의 대규모 학습을 진행한 SK텔레콤 자체 구축 슈퍼컴퓨터 ‘타이탄’. 사진=SK텔레콤
 

SK텔레콤이 세계 최고 수준의 한국어 처리 성능을 자랑하는 대규모 언어모델(LLM) ‘A.X(에이닷 엑스) 4.0’을 오픈소스로 공개하며 국내 AI 생태계 강화에 나섰다.

SKT는 3일 AI 개발자 플랫폼 ‘허깅페이스(Hugging Face)’를 통해 A.X 4.0의 ▲720억 개 파라미터를 갖춘 표준 모델(72B)과 ▲70억 개 파라미터의 경량 모델(7B) 등 2종을 전면 공개했다. 누구나 자유롭게 상업적 목적까지 활용할 수 있다.

A.X 4.0은 토크나이저(Tokenizer)를 SK텔레콤이 자체 설계해 한국어 처리 효율을 극대화했다. 자체 테스트 결과 같은 한국어 문장을 처리할 때 GPT-4o보다 약 33% 높은 토큰 효율을 기록해, 처리 용량 확대와 AI 운영 비용 절감이 가능하다는 강점이 있다.

또한 A.X 4.0은 국내 주요 AI 벤치마크 평가에서도 글로벌 상위 모델을 능가하는 성능을 입증했다. 한국어 언어 이해 평가 ‘KMMLU’에서 GPT-4o(72.5점)를 앞서는 78.3점을, 한국 문화 이해를 평가하는 ‘CLIcK’에서는 GPT-4o의 80.2점보다 높은 83.5점을 기록했다.

 

A.X 4.0의 대규모 학습을 진행한 SK텔레콤 자체 구축 슈퍼컴퓨터 ‘타이탄’. 사진=SK텔레콤
 

SKT는 이번 공개와 함께 A.X 4.0을 온프레미스(On-premises) 방식으로도 제공해, 보안이 중요한 기업들이 내부 서버에 설치해 사용할 수 있도록 했다. 모델 개발 또한 CPT(지속적 사전학습) 전 과정을 외부 연동 없이 자체 데이터로만 수행해 데이터 주권을 확보했다.

특히 오픈소스 기반의 Qwen 2.5 모델에 방대한 한국어 데이터를 추가 학습해, 국내 기업 환경에 최적화된 성능을 구현했다는 점에서 의미가 크다. SKT는 현재 A.X 4.0을 자사 AI 서비스 ‘에이닷’의 통화 요약 기능에 실제 적용 중이며, 추후 SK그룹 전반에 적용 범위를 확대할 계획이다.

SKT는 A.X 4.0 공개와 함께 수학 문제 해결 및 코드 생성 능력이 강화된 ‘추론형(reasoning) 모델’을 이달 중 공개하고, 이후 이미지와 텍스트를 동시에 처리할 수 있는 멀티모달 모델로도 확장할 계획이다.

또한 A.X 3.0에서 선보인 ‘프롬 스크래치(From Scratch)’ 방식 역시 병행 개발 중이며, 소버린 AI(주권 AI) 전략에 기반한 후속 모델도 순차적으로 내놓을 예정이다.

김지원 SK텔레콤 AI Model Lab장은 “A.X 4.0은 SK텔레콤의 다양한 서비스를 고도화하는 동시에 국내 비즈니스 환경에 최적화된 한국어 LLM으로 자리매김할 것”이라며 “앞으로도 지속적인 기술 혁신을 통해 국내 AI 생태계 확산을 이끌어가겠다”고 밝혔다.

배너
배너
배너

많이 읽은 기사

배너
배너
배너
배너
배너
배너
배너
배너
배너
배너
배너
배너
배너
배너
배너
배너
배너