AI

제미니(Gemini) 성능 및 3가지 모델 핵심 정리

소소한84 2023. 12. 7.

최근 구글이 그들의 AI 플랫폼인 바드에 '제미니(Gemini)'라는 새로운 모델을 도입했다는 소식이 있습니다. 이 제미니 시리즈에는 세 가지 버전이 포함되어 있는데, 그중 '울트라(Ultra)', '프로(Pro)', 그리고 '나노(Nano)'가 있습니다. 이 중에서도 프로 버전은 현재의 GPT-3.5 모델을 능가하는 성능을 자랑합니다. 더욱 주목할 만한 것은 내년에 출시될 예정인 울트라 모델이 현 GPT-4.0 기술을 넘어설 것으로 기대되고 있다는 점입니다. 오늘 이 제미니 모델이 갖는 의미와 기술 발전을 살펴보려고 합니다. 

 

구글 제미니: AI의 새로운 이정표

구글의 자회사인 딥마인드가 최근 AI 기술의 새로운 지평을 여는 모델, '제미니(Gemini)'를 발표했습니다. 제미니는 인공지능 분야에서 전문가 수준의 성능을 처음으로 달성한 모델로 평가받고 있습니다. 이 모델은 구글 인공지능 기술의 정수를 보여주는 것으로, 그 성능은 현재까지 공개된 모든 AI 모델 중 최고로 예상됩니다.

구글의 자회사 딥마인드가 개발한 제미니는 멀티모달 기능을 갖춘 최첨단 AI 모델로, 
현재까지의 AI 기술을 능가하는 성능을 보유

 

특히 주목할 점은, 제미니가 멀티모달 기능을 내장하고 있다는 것입니다. 이는 텍스트, 이미지, 소리, 비디오 등 다양한 형태의 입력을 처리할 수 있다는 의미로, AI 기술의 범용성과 활용 가능성을 한층 더 넓혔습니다. 이러한 제미니의 등장은 인공지능의 발전을 새로운 차원으로 이끌며, 우리 일상생활과 산업 전반에 광범위한 영향을 미칠 것으로 기대됩니다.

 

제미니 울트라, MMLU 테스트에서 인간 전문가와 챗GPT-4 넘어서

meet the first version of gemini
제미니 울트라 모델은 인간 전문가 수준을 뛰어넘음

인공지능의 발전을 증명하는 새로운 사례가 등장했습니다. 구글의 최신 AI 모델인 '제미니 울트라'가 다양한 문제 이해 능력을 평가하는 MMLU 테스트에서 인상적인 성과를 거두었습니다. 이 테스트에서 제미니 울트라는 90.0%라는 높은 이해도를 기록했으며, 이는 인간 전문가의 89.8% 기록을 약간 상회하는 수치입니다. 또한, 현재 널리 알려진 챗GPT-4는 이보다 다소 낮은 86.4%의 이해도를 보였습니다. 이러한 결과는 제미니 울트라가 챗GPT-4를 넘어서는 언어 모델로 등장했음을 의미합니다.

구글의 제미니 울트라 모델이 MMLU 테스트에서 90.0%의 이해도를 기록하며, 
인간 전문가와 챗GPT-4를 뛰어넘는 언어 이해 능력을 선보임


인공지능 분야의 선구자인 제프 딘(Jeff Dean)은 제미니 울트라를 두고 MMLU의 57개 과목에서 90% 이상의 점수를 얻은 최초의 인공지능 모델이라고 칭찬했습니다. 이러한 성과는 인공지능 기술이 어느 정도까지 발전했는지를 보여주는 중요한 지표로, 이 분야의 전문가들 사이에서 큰 주목을 받고 있습니다.

 

인공지능 분야에서 새로운 성과가 나타났습니다. 구글의 제미니 울트라는 최근 실시된 여러 평가에서 GPT-4의 성능을 상회하는 결과를 보였습니다. 특히 추론, 수학, 코딩과 같은 분야에서 이러한 우수한 성능이 드러났으며, 멀티모달 능력에서도 GPT-4를 앞질렀습니다.

 

이러한 성과는 단순히 기존 벤치마크 점수에 맞추어진 결과가 아님을 MMMU(최신 벤치마크 평가)에서도 입증되었습니다. MMMU 평가에서 제미니 울트라는 GPT-4보다 더 높은 점수를 기록하며, 그 성능의 우수성을 다시 한번 증명했습니다.

 

제미니(Gemini)의 3가지 모델

제미니(Gemini)의 3가지 모델

제미니 울트라(GPT-4 유사)

이 모델은 가장 지능적인 버전으로, 모든 작업을 처리할 수 있는 능력을 갖추고 있지만, 그만큼 무거운 구조와 높은 비용이 수반됩니다. '무거운 모델'이라는 용어는 다양한 방식으로 복잡한 계산을 수행해야 하기 때문에, 결과를 도출하는 데 상당한 시간이 소요된다는 것을 의미합니다.

  • 비용이 많이 들고, 무거운 모델
  • 어려운 과제 수행 가능

제미니 프로(GPT-3.5 유사)

구글 바드 플랫폼에서 사용할 수 있는 제미니 프로 모델은 제미니 울트라보다 결과를 더 빠르게 제공합니다. 제미니 울트라가 결과를 산출하는 데 오랜 시간이 걸리는 반면, 제미니 프로는 비교적 짧은 시간 안에 결과를 도출할 수 있는 모델입니다.

  • 가성비가 좋은 모델
  • 대용량 서비스를 할 때

제미니 나노(GPT-3.0 유사)

제미니 나노는 가장 가벼운 모델로, 복잡한 계산이나 추론을 많이 필요로 하지 않으며, 많은 메모리나 GPU 자원을 요구하지 않습니다. 이 모델은 온 디바이스 방식으로 작동하며, 일반적으로 AI 작업은 클라우드에서 복잡한 연산을 수행한 후 그 결과를 핸드폰으로 전달하는데, 온 디바이스 모델은 핸드폰 내에서 모든 처리를 완료한다는 것을 의미합니다. 이는 네트워크 연결이 불가능한 상황에 대비한 것이며, 민감한 정보의 경우, 네트워크를 통해 클라우드로 전송하는 것에 대한 사용자의 불편함을 감소시키기 위함입니다. 제미니 나노 모델은 이러한 수요를 반영하여 설계되었습니다.

  • 가장 가벼운 모델
  • 온 디바이스 모델(핸드폰에서 사용 가능)

 

제미니 울트라 성능

제미니가 농담하는 것제미니 수학적 문제 해결
왼: 농담을 하는 제미니, 오: 복잡한 수학 문제를 해결하는 제미니

제미니 울트라의 경우 이미지를 입력 후 역사적인 이벤트를 힌트로 주고 질문을 하면 왼쪽 이미지아 같이 1971년에 아폴로로 달에 간 사람들이 골프를 친 적이 있다고 말하기도 합니다. 또한 오른쪽 이미지와 같이 복잡한 수학 문제를 해결하는 능력도 갖추고 있습니다.

작곡에 대해 이해하는 제미니
그 외에도 제미니의 성능

위에서 언급한대로 제미니는 멀티 모달이기 때문에 인풋으로 사진도 입력이 가능합니다. 그리고 사진과 텍스트를 합쳐 새로운 이미지 도출도 가능합니다. 또한 동영상을 입력 후 이를 코드로 변경해 달라고 요청해도 동영상에 해당하는 움직임을 코드로 만들어주기도 합니다. 코딩 능력은 프로그래밍 대회에서 상위 15% 안에 들어갈 정도의 수준이라고 하니 대단하네요. 

 

과연 GPT를 넘어 설 수 있을까

현재 제미니 프로는 텍스트 기반으로만 작동하지만, 향후 멀티모달 지원이 계획되어 있습니다. 현재 바드 플랫폼에서 사용 가능한 제미니 프로는 GPT-3.5보다는 우수한 성능을 보이나 GPT-4.0과의 비교는 아직 불확실합니다. 또한, 영어 이외의 언어에서는 성능이 다소 낮은 것으로 평가되고 있어, 이로 인해 제미니의 출시가 지연되었다는 소식이 있습니다. 따라서 다양한 언어로의 사용은 아직 이르다고 볼 수 있습니다. 내년에는 'Bard Advanced'라는 이름으로 구글 울트라가 출시될 예정입니다. 이에 대한 오픈 AI의 대응이 기대되며, 그것이 GPT-5일 수도 있고, 소문으로 떠도는 AGI일 수도 있습니다.

 

댓글