세계 1위 업스테이지 솔라 AI: 인공지능(AI) 기술은 우리의 삶을 변화시키는 데 중요한 역할을 하고 있습니다. 그 중에서도 특히 거대언어모델(LLM)은 텍스트 생성, 번역, 질문 응답 등 다양한 분야에서 활용되며, 이러한 기술의 발전은 우리의 일상생활과 업무 환경에 큰 영향을 미치고 있습니다. 이번 글에서는 한국의 스타트업 업스테이지가 개발한 솔라 AI에 대해 알아보겠습니다.
거대언어모델의 원리와 발전 과정
거대언어모델(LLM)은 수많은 파라미터를 보유한 인공 신경망으로 구성되는 언어 모델입니다. LLM은 자기 지도 학습이나 반자기지도학습을 사용하여 레이블링되지 않은 상당한 양의 텍스트로 훈련됩니다. LLM은 2018년 즈음에 모습을 드러냈으며 다양한 작업을 위해 수행되었습니다. 이전의 특정 작업의 특수한 지도 학습 모델의 훈련 패러다임에서 벗어나 자연어 처리 연구로 초점이 옮겨졌습니다. LLM 은 AI 챗봇 기술을 가능하게 하는 요소이며 많은 화제를 불러일으키고 있는 주제 중 하나입니다.
업스테이지 솔라 AI란?
솔라 AI는 업스테이지가 개발한 거대언어모델입니다. 이 모델은 공개와 동시에 세계 최대 머신러닝 플랫폼인 [허깅페이스]에서 운영하는 ‘오픈 LLM 리더보드’에서 성능 평가에서 세계 1위를 차지했습니다. 솔라는 AI의 시냅스 역할을 하는 매개변수 수가 107억개로, 중국 알리바바의 큐원 모델(720억개 매개변수)의 6분의 1 수준임에도 불구하고 성능을 극대화했다고 업스테이지는 설명하고 있습니다. 이러한 성과는 업스테이지의 자체적인 최적화 방식을 적용한 결과입니다.
업스테이지의 역사와 비전
업스테이지는 AI 스타트업으로, 창립 2주년을 기념하며 창립 스토리를 되짚어보고, 함께 그려갈 비전을 공유하고 있습니다. 업스테이지의 공동 창업자들은 AI를 쉽게 도입할 수 있는 시대를 그리고 있으며, 이를 위해 다양한 문서를 여러분만의 지식 데이터 베이스로 만드는 데 집중하고 있습니다. 업스테이지는 창업 1년 만에 엔지니어 60여 명과 300억원대 투자금을 확보하였으며, 첫 해 매출 90억원을 돌파하였습니다. 이러한 성과는 업스테이지의 김성훈 대표의 뛰어난 리더십과 팀원들의 노력 덕분입니다.
업스테이지 솔라 AI의 기술적 세부사항
솔라 AI는 다양한 분야에서 활용될 수 있는 인공지능 기술을 개발하고 있습니다. AI 도입 시에는 적합성 검토 및 영향평가를 실시하며, 학습 데이터 관리와 AI 모델 개발 절차를 철저히 관리합니다. 이러한 과정은 AI의 보안성을 준수하고, 설계 및 테스트 절차를 통해 AI의 성능을 최적화하는 데 중요합니다.
업스테이지 솔라 AI의 특징
- 높은 성능: 솔라 AI는 107억개의 매개변수를 가지고 있지만, 그 크기에 비해 뛰어난 성능을 보여줍니다. 이는 업스테이지의 자체적인 최적화 방식을 적용한 결과입니다.
- 다양한 활용 가능성: 솔라 AI는 텍스트, 이미지, 음성 등 다양한 형식의 콘텐츠를 생성할 수 있으며, 창작이 요구되는 작업이나 콘텐츠 제작에도 도움을 줄 수 있습니다.
- 빠른 검색 시간: 솔라 AI는 특정 정보나 답변을 빠르게 생성할 수 있어, 검색 시간을 크게 절약할 수 있습니다.
업스테이지 솔라 AI의 성능
솔라 AI는 107억개의 매개변수를 가지고 있지만, 그 크기에 비해 뛰어난 성능을 보여줍니다. 이는 업스테이지의 자체적인 최적화 방식을 적용한 결과입니다. 솔라 AI는 중국 거대 기업인 알리바바가 만든 최신 모델 ‘큐원’ (QWEN, 73.6점), 마크 저커버그가 직접 공개한 메타의 ‘라마2’ (67.87점), 아랍에미리트 (UAE) 아부다비 기술혁신연구소 (TII)의 ‘팔콘’ (67.85점)을 앞질렀습니다. 리더보드에 오르지는 않지만 똑같은 테스트를 통해 점수를 매기면 71.07점이 나오는 오픈AI의 ‘GPT-3.5 터보’ 역시 솔라보다 점수가 낮습니다. 이러한 결과는 솔라 AI가 소형 LLM (SLM)의 기준이라고 할 수 있는 300억 매개변수 (30B) 이하 사이즈로 글로벌 최고 성능 모델로 인정받아 의미가 있습니다. 솔라는 107억 매개변수 (10.7B) 모델로 리더보드 평가에서 2위 (73.6점)에 오른 알리바바의 최신 모델 큐원 (720억 매개변수)의 6분의1도 안 되는 크기로 이를 훌쩍 뛰어넘는 성능을 증명한 것입니다.
업스테이지 솔라 AI의 성공 사례
솔라 AI는 107억개의 매개변수를 가지고 있지만, 그 크기에 비해 뛰어난 성능을 보여줍니다. 이는 업스테이지의 자체적인 최적화 방식을 적용한 결과입니다. 또한, 솔라 AI는 사전 학습 및 파인 튜닝 단계에서 리더보드 벤치마킹 데이터세트를 사용하지 않고, 자체 구축한 데이터를 적용했습니다. 이로 인해 기업들은 업스테이지의 솔라 모델을 기반으로 자신들의 데이터와 목적에 맞게 추가학습을 하고 다양한 생성형 AI 서비스를 구축·운영할 수 있게 되었습니다. 아울러, 글로벌 생성형 AI 활용 플랫폼 ‘Poe’에 메인 모델로 등록된 솔라 모델을 업데이트해 대중이 최고 성능의 업스테이지 LLM을 경험해볼 수 있게 할 예정입니다. 이는 솔라 AI의 또 다른 성공 사례로 볼 수 있습니다.
업스테이지 솔라 AI의 활용
솔라 AI는 다양한 분야에서 활용될 수 있습니다. 예를 들어, 텍스트, 이미지, 음성 등 다양한 형식의 콘텐츠를 생성할 수 있으며, 창작이 요구되는 작업이나 콘텐츠 제작에도 도움을 받을 수 있습니다. 또한 특정 정보나 답변을 빠르게 생성할 수 있어 검색 시간을 크게 절약할 수 있습니다.
업스테이지 솔라 AI의 미래
업스테이지는 솔라 AI의 기술력을 바탕으로 글로벌 생성형 AI 시장에 본격적으로 진출할 계획이라고 합니다. 이는 한국의 AI 기술이 세계적인 수준에 도달했음을 보여주는 중요한 사례로, 앞으로의 발전이 기대됩니다.
맺음말
이상으로 업스테이지 솔라 AI에 대한 소개를 마치겠습니다. 솔라 AI는 우리의 삶을 더욱 풍요롭게 만들어 줄 기술 중 하나입니다. 앞으로의 발전이 기대되는 솔라 AI에 대한 더 많은 정보를 얻기 위해선 [업스테이지의 공식 웹사이트]를 참조하시기 바랍니다. 최근 구글에서 발표한 구글 제미나에 대한 자세한 정보는 [여기]를 참하시기 바랍니다.