"영어 중심 AI 한계 깬다"…KT, 한국형 '믿음 2.0' 오픈소스 공개
믿음 2.0 베이스·미니 모델 업데이트
국내 출판·교육과정 데이터 학습…'저작권 침해' 우려엔 "구매 데이터 사용"
‘믿음 프로’, MS 협업 모델 등 상위 버전도 향후 출시
‘독자 AI 파운데이션 모델’ 개발 프로젝트 참여 의사
"글로벌 시장에서 경쟁력을 갖출 발판이 될 것"
2025-07-03 14:38:04 2025-07-03 16:02:20
[뉴스토마토 박재연 기자] KT(030200)가 한국의 사회와 문화, 그리고 한국어의 특성을 반영해 학습한 자체 거대언어모델(LLM) '믿:음 2.0(믿음 2.0)'을 AI 개발자 플랫폼 '허깅페이스'를 통해 오픈소스로 공개한다고 밝혔습니다. 이를 통해 국내 인공지능(AI) 생태계에 '한국형 AI' 확산을 선도하겠다는 계획입니다. 
 
신동훈 KT Gen AI 랩장은 3일 열린 온라인 기자 간담회에서 "믿음 2.0은 기업과 개인, 공공 누구나 제약 없이 상업적으로 활용할 수 있도록 개방된다"고 강조했습니다. 
 
KT 기술혁신부문 연구원들이 서초구 KT 우면연구센터에서 믿:음 2.0을 테스트하고 있는 모습.  (사진=KT)
 
오는 4일부터 공개되는 믿음 모델은 △115억 파라미터 규모의 ‘믿음 2.0 베이스’ △23억 파라미터 규모의 ‘믿음 2.0 미니’ 등 2종으로, 모두 한국어와 영어를 지원합니다. 신 랩장은 "미니는 베이스 모델에서 증류한 지식을 학습한 소형 모델로, 국내 AI 생태계 활성화에 긍정적인 역할을 할 것"이라고 설명했습니다. 
 
믿음 2.0이 한국 문화와 사회에 대한 높은 이해력과 생성 능력을 갖췄다는 주장도 이어갔습니다. KT는 고려대학교와 공동 개발한 한국어 AI 역량 평가 지표 '코-소버린(Ko-Sovereign)' 벤치마크에서 다른 모델보다 높은 점수를 기록한 점을 근거로 들었는데요. 
 
신 랩장은 "기존 AI 모델은 대부분 영어 중심이라 한국의 특수성을 반영하지 못하는 한계가 있었다"라며 "한국 도서 출판물 데이터, 한국 교육과정별 학습 데이터 등 국내 고유 데이터를 직접 수집하고, 고려대 민족문화연구원과 협업해 가장 한국적인 가치가 반영되도록 했다"고 덧붙였습니다. 
 
데이터 학습 과정에서의 저작권 침해 우려에 대해서는 "교육·문학·법률 분야의 데이터를 직접 모으고 정식으로 구매한 데이터를 활용했기 때문에 저작권 문제는 없다"고 밝혔습니다. 
 
KT 기술혁신부문 연구원들이 서초구 KT 우면연구센터에서 믿:음 2.0을 테스트하고 있는 모습. (사진=KT)
 
KT는 이후 출시 예정인 모델들의 설명도 이어갔습니다. 고성능 모델인 ‘믿음 프로’를 향후 출시하고, 마이크로소프트(MS)와 협업해 GPT-4에 한국적 사고를 추가 학습시키는 모델도 순차적으로 선보일 예정인데요. KT는 이 모델들을 활용해 국내 AI 생태계에 ‘한국형 AI’ 확산을 선도하겠다는 계획입니다. 
 
정부가 추진 중인 ‘독자 AI 파운데이션 모델’ 개발 프로젝트에도 참여 의사를 전했습니다. 신 랩장은 "믿음 2.0은 한국적 내용을 담아 경쟁력은 다른 모델과 비교해도 뒤지지 않는다"며 "결과와 무관하게 프로젝트 참여를 위해 노력하고 있다”고 전했습니다. 
 
신 랩장은 "믿음 2.0은 국내 사용자들에게 고성능 한국형 AI 모델의 새로운 대안을 제시하고, 글로벌 시장에서도 경쟁력을 갖출 발판이 될 것"이라며 "중장기 투자 계획과 사업화 방향, 수익 모델 등은 7월 중순 이후 별도로 공개하겠다"고 덧붙였습니다. 
 
박재연 기자 damgomi@etomato.com
 
이 기사는 뉴스토마토 보도준칙 및 윤리강령에 따라 김나볏 테크지식산업부장이 최종 확인·수정했습니다.

ⓒ 맛있는 뉴스토마토, 무단 전재 - 재배포 금지

지난 뉴스레터 보기 구독하기
관련기사
0/300

뉴스리듬

    이 시간 주요 뉴스

      함께 볼만한 뉴스