구글 제미나이, 정말 최강일까?

구글 제미나이: 구글은 2023년 12월 6일, 차세대 AI 언어 모델인 “구글 제미나이(Gemini)”를 공개했습니다. 제미나이는 텍스트, 이미지, 음성, 영상 등 다양한 모드의 데이터로 학습된 대규모 언어 모델(멀티모달)로, 다양한 창의적인 콘텐츠를 생성하고, 사용자의 질문에 유익한 방식으로 답변할 수 있는 능력을 갖추고 있습니다. 그러나 최근 제미나이의 성능에 대한 의구심이 제기되고 있습니다. 오늘은 구글의 제미나이에 대한 사실과 오해를 자세히 알아보도록 하겠습니다.

구글 제미나이, 정말 최강일까?

구글은 제미나이의 성능을 평가하기 위해 다양한 방식으로 테스트를 진행했습니다다. 그 중에서도 가장 대표적인 테스트는 자연어 이해(NLU) 테스트입니다. NLU 테스트는 컴퓨터가 인간의 언어를 이해하고 처리할 수 있는 능력을 평가하는 테스트인데요, 구글은 제미나이의 NLU 테스트 결과를 공개하지 않았습니다. 구글의 연구원들은 제미나이가 GPT-4보다 더 정확하게 질문의 의미를 이해하고, 더 적절한 답변을 생성할 수 있다고 밝혔습니다.

또 다른 중요한 테스트는 다양한 모드의 데이터 학습(CDM) 테스트이다. CDM 테스트는 컴퓨터가 다양한 모드의 데이터로 학습할 수 있는 능력을 평가하는 테스트입니다. 구글은 제미나이가 CDM 테스트에서 우수한 성능을 보였다고 밝혔으며 제미나이가 텍스트, 이미지, 음성, 영상 등 다양한 모드의 데이터로 학습할 수 있고 이러한 데이터를 유기적으로 결합하여 새로운 창의적인 콘텐츠를 생성할 수 있다고 밝혔습니다.

제미나이의 성능에 대한 평가는 엇갈렸지만, 그 중에서도 가장 큰 오해는 제미나이(제미나이 울트라)가 GPT-4를 뛰어넘는 성능을 보였다는 주장입니다. 구글의 연구원들은 제미나이가 GPT-4를 뛰어넘는 성능을 보였다고 주장했지만, 구글은 이 주장을 뒷받침할 수 있는 구체적인 근거를 공개하지 않았으며, 제미나이와 GPT-4의 성능을 비교한 독립적인 연구 결과도 아직까지 발표되지 않았습니다. 특히 비교 대상이 일관적이지 못하다는 평가를 받고 있습니다.

최근에는 외부 테스트에서 제마니이의 경량 버전인 “제미나이 프로”가 [GPT-3.5 터보] 보다도 성능이 떨어진다는 주장이 제기되었습니다. 12월 19일(현지시각) 카네기 멜론 대학교와 스타트업 기업인 베리 AI의 연구진이 “제미나이 프로”, “GPT-3.5 터보”, “GPT-4 터보”, “믹스트랄 8x7B” 등 4가지 LLM을 비교 테스트한 결과를 발표했는데요, 이 테스트에서 “제미나이 프로”는 “GPT-3.5 터보” 현재 버전과 성능이 비슷하거나 낮은 것으로 나타났습니다. 아래 그림은 실제 테스트 결과를 보여주고 있습니다.

구글 제미나이 프로 테스트 결과(출처: 카네기 멜론 대학)
구글 제미나이 프로 테스트 결과(출처: 카네기 멜론 대학)

 

구글은 공개 당시 자체 테스트를 기반으로 “제미나이 프로”가 “GPT-3.5 터보”보다 성능이 뛰어나며 내년 초에 출시될 “제미나이 울트라”는 “GPT-4” 보다 더 뛰어나다고 밝힌 바가 있습니다. 따라서 오픈 AI의 “GPT-4” 보다 성능이 뛰어나다는 구글의 주장이 거짓이라는 분위기가 고조되고 있는 상황입니다. 결국 구글의 제미나이가 GPT-4를 뛰어넘는 성능을 보였다는 주장은 아직까지 검증되지 않은 주장으로 볼 수 있습니다.(참고로 구글의 제미나이는 3가지의 버전이 존재하는데, 가장 상위 모델인 울트라 그리고 그 아래 프로와 나노 버전이 존재합니다)

구글 제미나이의 잠재적 가능성

제미나이의 성능은 아직까지 완전히 평가되지 않았고 검증되지도 않았지만 지만, 제미나이가 인공지능 분야에 큰 잠재력을 가지고 있다는 것은 분명하다. 제미나이는 다양한 창의적인 콘텐츠를 생성할 수 있는 능력을 갖추고 있습니다. 예를 들어, 제미나이는 다음과 같은 콘텐츠를 생성할 수 있습니다.

  • 텍스트: 시, 소설, 코드, 대본, 음악, 이메일, 편지 등
  • 이미지: 그림, 사진, 디자인, 지도 등
  • 음성: 노래, 오디오북, 팟캐스트 등
  • 영상: 영화, TV 프로그램, 광고 등

제미나이는 또한 사용자의 질문에 유익한 방식으로 답변할 수 있는 능력도 갖추고 있습니다. 예를 들어, 제미나이는 다음과 같은 질문에 답변할 수 있습니다.

  • 사실적인 질문: 날씨, 세계 지리, 역사 등
  • 추상적인 질문: 삶의 의미, 우주의 기원 등
  • 창의적인 질문: 새로운 아이디어, 해결책 등

제미나이의 이러한 능력은 특히 콘텐츠 창작 분야에서 기존의 콘텐츠 제작 방식을 근본적으로 변화시킬 수 있을 것으로 기대됩니다. 뿐만 아니라 제미나이는 사용자의 질문에 유익한 방식으로 답변할 수 있는 능력을 갖추고 있기 때문에, 사용자 지원 분야에서도 활용될 수 있을 것으로 기대됩니다.

  • 고객 서비스: 고객 문의 응대, 고객 불만 처리 등
  • 교육: 학습 지원, 과제 첨삭 등
  • 의료: 진단 및 치료 지원, 질병 예방 및 관리 등
  • 법률: 법률 상담, 법률 문서 작성 등

맺음말

구글 제미나이는 다양한 모드의 데이터로 학습된 대규모 언어 모델로, 다양한 창의적인 콘텐츠를 생성하고, 사용자의 질문에 유익한 방식으로 답변할 수 있는 능력을 갖추고 있습니다. 그러나 구글이 발표한 제미나이의 성능은 아직 검증되지 않은 것이 사실입니다. 제미나이의 성능이 아직까지 완전히 평가되지 않았지만, 콘텐츠 창작, 사용자 지원, 연구, 금융, 제조, 물류 등 다양한 분야에서 활용될 수 있을 것으로 기대됩니다. 구글 제미나이에 대한 더 자세한 정보는 [여기]를 참조하십시오. 최근 한국 기업이 발표 솔라 AI에 대한 자세한 정보는 [여기]를 참조하시기 바랍니다

Leave a Comment