▲허깅페이스 오픈 LLM 리더보드 순위에서 업스테이지의 모델이 1위를 차지한 모습. |
솔라는 글로벌 머신러닝 플랫폼 허깅페이스에서 운영하는 ‘오픈 LLM 리더보드’ 평가에서 74.2점을 기록하며 글로벌 1위를 기록했다. 특히 솔라는 300억 매개변수(30B) 이하 사이즈로 세계 최초 107억 매개변수(10.7B) 모델인 알리바바 최신모델 큐원의 6분의1도 안되는 크기다. 기업들이 활용하기 좋은 중소형LLM(SLLM)임에도 글로벌 유명 LLM 급의 높은 성능을 기록한 것이다.
업스테이지에 따르면 솔라는 사전 학습 및 파인튜닝 단계에서는 리더보드 벤치마킹 데이터 셋을 사용하지 않고, 자체적으로 구축한 데이터를 적용했다. 또 최근 20억 달러의 기업 가치로 유니콘에 오른 미스트랄AI의 최신 모델 믹스트랄(Mixtral 8x7B) 모델의 성능지표도 뛰어넘었다. 믹스트랄은 작은 전문 모델 여러 개를 묶는 방식으로 소형 모델임에도 메타 ‘라마’와 GPT-3.5를 능가해 최근 가장 뜨거운 관심을 받고 있는 모델이다.
이번 솔라 모델은 사전학습 모델까지 상업적 활용까지 가능하게 공개된다. 실사용성 높은 파인튜닝 모델은 물론 자체 추가 학습이 가능한 사전학습 모델까지 모두 공개됐다. 모델의 성능을 자체적으로 끌어올리는데 사용할 수 있는 사전학습 모델 역시 허깅페이스 리더보드 평가 기준 66.04점으로 소형 모델의 대표 주자인 알리바바의 큐원(Qwen), 메타의 라마2(Llama 2), 미스트랄AI의 미스트랄(Mistral) 사전학습 모델들을 모두 제치고 1위에 올랐다.
업스테이지는 아마존웹서비스(AWS), 포(Poe), 투게더AI(Together.ai) 등 글로벌 플랫폼과의 협력을 통해 최고 기술력을 바탕으로 글로벌 생성 AI 시장에 본격적으로 진출할 계획이다. 뿐만 아니라 글로벌 생성 AI 활용 플랫폼 Poe에 메인 모델로 등록돼 있는 솔라 모델을 업데이트해 대중들이 최고 성능의 업스테이지 LLM을 직접 경험해 볼 수 있도록 할 예정이다. 이밖에 업스테이지는 콴다, KT와 함께 세계 최고의 수학 GPT를 구축, 생성형 AI가 약한 추론 영역까지 LLM의역량을 확장하고 있다.
김성훈 업스테이지 대표는 "세계 AI회사들을 압도하는 모델을 공개하게 되어 기쁘고 업스테이지 솔라가 모두를 위한 모델이 되기를 희망한다" 며 "KT의 전략투자를 통한 지원이 큰 도움이 되었고 앞으로 지속적으로 더 큰 격차를 벌릴 수 있는 최고 성능의 솔라 모델을 활용, 기업간거래(B2B) 시장에서의 협력도 추진할 것"이라고 말했다.
sojin@ekn.kr