구글 제미나이(GEMINI), 딥마인드가 만든 인공지능

구글 제미나이(GEMINI), 딥마인드가 만든 인공지능

구글이 2023년 12월 6일 또 다른 대형언어모델 제미나이(GEMINI)를 공개했습니다. 처음부터 멀티모달로 학습시킨터라 인간이 인식하는 것과 비슷한 방식으로 인식하고 추론한다는 것이 특징입니다. 이번 포스팅에서는 인공지능 시대를 가속화시킬 또 다른 인공지능인 구글 제미나이에 대해 알아보겠습니다.

 

 


글의 순서

구글 딥마이드의 제미나이
구글이 강조하는 제미나이 능력
제미나이 출시와 활용
3가지 예로 보는 구글 제미나이의 놀라운 능력


구글 딥마이드의 제미나이

구글이 현지시간 2023년 12월 6일 또 다른 대형언어모델 제미나이(GEMINI)를 공개했습니다. 언어모델인데, 문자뿐만 아니라, 목소리, 손 동작 등을 인식할 수 있는 모델입니다. 처음부터 문자, 코드, 음성, 그림, 동영상 등 멀티모달로 학습시켰기 때문입니다. 구글은 제미나이가 ChatGPT를 개발한 오픈AI의 최신 모델인 GPT-4보다 성능이 우수하고 심지어 사람의 능력 이상이라는 것을 강조했습니다. 덕분에 구글의 모회사인 알파벳의 주가도 하루 만에 5% 넘게 오르기도 했습니다.

 

 


구글이 강조하는 제미나이 능력

구글 제미나이는 모델의 크기에 따라 제미나이 울트라, 제미나이 프로, 제미나이 나노로 나뉩니다. 이 중 울트라 모델이 가장 성능이 좋습니다. 제미나이 울트라는 다중작업 언어이해MMLU(massive multitask language understanding)에서 90.0%라는 점수를 획득했습니다. 여기서 MMLU는 수학, 물리학, 역사, 법률, 의학, 윤리, 생물학 등 57개 교과목 지식을 조합한 추론 능력 테스트를 의미합니다. MMLU에서 GPT-4는 86.4%, 인간 전문가는 89.8%를 받았으니 자랑할 만합니다.


제미나이 출시와 활용

제미나이 프로와 제미나이 나노는 이미 출시되었고, 프로버전은 Bard에서 사용될 예정입니다. 2023년 12월 13일부터 API도 쓸 수 있습니다. Google AI Studio, 또는 Google Cloud Vertex AI를 통해서 말입니다. 여기서 구글 AI 스튜디오는 웹기반의 도구이며 공짜입니다. 개발자들이 API 키를 사용하여 빠르게 응용프로그램을 만드는데 활용할 수 있습니다. Vertex AI는 개발자들이 데이터에 접근해서 보다 적극적으로 맞춤형 응용프로그램을 만들 수 있도록 도와줄 예정입니다. 또한 제미나이는 구글이 개발한 스마트폰 픽셀 8 프로(The Pixes 8 Pro)에 탑재될 예정입니다.

구글은 앞으로 구글 검색을 비롯한 광고, 크롬, 듀엣 AI 등 더 많은 구글 제품과 서비스에서 제미나이를 활용할 수 있게 될 것이라 얘기했는데요. 제미나이가 본격적으로 활용되는 순간, 많은 사용자를 확보하고 있는 현재의 ChatGPT와 더불어 2024년에는 AI가 더 보편화될 것으로 보입니다.


3가지 예로 보는 구글 제미나이의 놀라운 능력

2023년 12월 현재, 특히 놀라운 제미나이의 능력을 정리해 보았습니다.

(1) 제미나이는 사람의 손글씨도 인식합니다. 손으로 쓴 수학문제를 그대로 옮겨 쓰기도 합니다. 만약 내가 푼 수학문제가 틀렸다면, 제미나이는 그걸 보고 바로잡아줍니다. ChatGPT 음성인식으로 영어회화 연습을 할 수 있듯, 이런 종류의 생성형 인공지능을 수학, 물리 과외 선생님으로도 모실 수 있는 세상이 된 것입니다.

(2) 대형언어모델이 잘 하는 것 중 하나는 방대한 양의 데이터를 정리하는 것입니다. 수많은 논문을 읽은 후 거기서 데이터를 추출하고, 정리하고, 분류한 후 거기서 새로운 정보를 찾아내는 일을 특히 잘하는데, 제미나이는 이를 자동으로 처리할 수 있습니다.

(2) 복잡한 최적화 문제를 푸는 코드를 작성하는 것도 가능합니다. 단순히 알고리즘 하나를 얘기하는게 아니라, 복잡한 문제를 단순한 여러 개의 문제로 쪼개고, 작은 단위에서 문제를 푼 뒤, 합쳐가는 방식을 사용합니다. 마치 과학자나 공학자들이 문제를 푸는 방식처럼 말입니다.


마치며 …

이번 포스팅에서는 인공지능 시대를 가속화시킬 또 다른 인공지능인 구글 제미나이에 대해 알아보았습니다. 구글은 구글 딥마인드가 개발한 제미나이(Gemini)를 현지시간 2023년 12월 6일에 공개했습니다. 구글은 처음부터 제미나이를 문자, 코드, 음성, 그림, 동영상 등 멀티모달로 학습시켰습니다. 그래서, 단순히 문자로만 학습시킨 다른 모델보다는 인간이 인식하는 방식에 더 가깝다는 것이 특징입니다.

구글이 제미나이를 발표할 때 보여준 영상이 실시간이 아니었다는 뉴스가 뒤따라 나왔습니다. 그렇지만 멀티모달 능력이 있는 대형언어모델을 중심으로 한 인공지능 세상이 가속화 될 것이라는 것은 분명합니다. 우리는 어떻게 이들 인공지능을 잘 활용할 수 있을까를 계속 고민해야 합니다.

 

 

함께 참고하면 좋은 글
ChatGPT, 라마(LLaMA)가 여는 생성형 인공지능 시장
초 거대 인공지능 ChatGPT
자연어 처리 신경망 모델 ChatGPT를 만든 딥러닝 방법
챗GPT와 같은 자연어 처리 인공지능 한계
ChatGPT 플러그인, 멀티 모달 인공지능
머신러닝, 인공지능. 커피 마시며 가볍게 읽는
커피와 인공지능


참고자료

[1] Google DeepMind, Welcome to the Gemini era
[2] Sundar Pichai, Demis Hassabis (2023), Introducing Gemini: our largest and most capable AI model
[3] 이재욱 (2023), 구글의 인공지능 ‘제미나이’‥막강 기능은 편집의 힘?, MBC 뉴스데스크

Leave a Comment