Google AI 프로덕트 Gemini 리뷰

December 7, 2023

우리의 일상에서 '구글링'이라는 단어가 사전에 등제될 정도로 한때 구글은 일반인들에게 거의 필수적인 요소가 되었습니다. 정보를 찾거나 계획을 세울 때, 심지어 영상을 볼 때조차도, 구글은 우리 생활에 깊숙이 자리 잡았습니다. 그러나 GPT의 출현으로, 사람들이 구글을 벗어나 GPT에 집중하기 시작하면서 구글은 전에 없던 도전에 직면하게 되었습니다. 이러한 변화에 대응하기 위해 구글은 AI 모델 개발에 전력을 기울였고, 그 모델은 단순히 바둑을 두는 알파고를 넘어서야 했습니다.

스파이더맨 영화에서 나오는 "위대한 힘에는 위대한 책임이 따른다"는 말처럼, 거대한 기업, 구글의 첫 AI 시도는 일반적인 기업보다 더 크고 많은 도전에 직면했습니다. 대중의 기대가 높았던 만큼, GPT에 비해 실수가 잦은 Bard는 구글에게 큰 실망을 안겼습니다. 이러한 상황에서 구글은 새로운 돌파구를 모색해야 했습니다.

그리고 어제, 12월 6일, 구글의 AI 회사인 Deepmind가 'Gemini Era'를 선언하며 새로운 모델을 발표함으로써 나타났습니다. 이는 단순한 모델의 출시가 아닌, 하나의 시대를 여는 선언이었습니다. Gemini 는 현재 구글이 발표한 모델중 최고로 크며 최대로 활용성이 높은 모델이며, 최고로 유연한 모델이라고 합니다. 이번 Gemini 1.0은 총 3가지 모델이 나오며 아래와 같습니다:

Gemini Ultra: 어렵고 힘든 태스크를 해결할수 있는 현재 Gemini에 최고의 모델입니다.
Gemini Pro : 일반적이고 많은 종류의 태스크를 해결할수 있는 최적의 모델입니다.
Gemini Nano : 핸드폰으로 해결할수 있는 태스크의 기반인 모델입니다.

Gemini 성적표 : 얼마나 발전했나?

시험성적표: 데이터셋 기반 벤치마크 결과

구글은 바드의 실수를 만회하기 위해 Gemini 모델에서 여러 분야의 테스트를 실시했습니다. 텍스트 기반 최신 데이터셋 벤치마크에서 GPT-4와 비교했을 때, 8개 데이터셋 중 7개에서 GPT-4보다 더 높은 성적을 기록했습니다. 특히 학술 분야 데이터셋인 MMLU 벤치마크 결과, 실제 인간전문 성적을 뛰어넘는 90%의 놀라운 성적을 보였습니다. 또한 이미지, 비디오, 오디오 분석 분야에서도 GPT-4를 상회하는 성적을 나타냈으며 Gemini가 AI 분야에서 새로운 장을 열고 있다 주장합니다.

‘진짜’ 멀티모달?

Gemini는 멀티모달 AI 모델로 개발되었습니다. 이전의 AI 모델들은 한 가지 태스크에만 집중하거나, 복수의 태스크를 수행할시 다른 모델을 ‘흉내’ 내는 수준으로만 튜닝이 되어있지만 Gemini는 처음부터 다양한 태스크를 통합적으로 학습하고, 추가적인 파인튜닝을 통해 이전 모델들보다 더 효과적으로 다양한 작업을 수행할 수 있습니다. 이러한 접근 방식은 AI 분야에서 새로운 패러다임을 제시하며, 더욱 복잡하고 다양한 문제 해결에 기여할 것으로 기대됩니다.

안전성: 모델은 과연 안전한가?

구글은 'Gemini'의 다중 모달 기능을 고려하여 새로운 보호 조치를 도입하고 있습니다, 이는 대담하면서도 책임 있는 AI 발전을 목표로 하고 있습니다. 'Gemini'는 편향과 독성에 대해 구글 AI 모델 중 가장 포괄적인 안전 평가를 받았으며, 이는 사이버 공격과 설득, 자율성과 같은 잠재적 위험 영역에 대한 연구를 포함합니다. 구글은 'Real Toxicity Prompts'를 사용하여 훈련 단계에서 내용 안전 문제를 진단하고, 폭력이나 부정적인 스테레오타입을 식별하고 분류하기 위한 전용 안전 분류기를 구축한 모델입니다.

추가로 구글은 사실성, 기초, 인용 및 확인과 같은 모델의 도전 과제를 지속적으로 해결하고 있습니다. 이를 통해 AI가 제공하는 정보의 정확성과 신뢰성을 보장하고자 하며, 구글은 업계와 생태계 전반에 걸쳐 안전 및 보안 벤치마크를 설정하고 최상의 관행을 정의하기 위한 장기적인 약속을 하고 있으며, 이를 위해 MLCommons, Frontier Model Forum, AI Safety Fund, Secure AI Framework (SAIF)와 같은 조직과 협력하고 있어 다른 AI 모델들 보다 더 높은 안전한 모델을 만들기 위해 노력하는중입니다.

Gemini의 추후 일정 및 배포 계획

12월 6일부터, 구글은 Bard와 픽셀 8 프로에서 Gemini Pro의 파인튜닝 버전과 Gemini Nano의 사용을 시작합니다. 이는 Bard 공개 이후 가장 큰 업그레이드로, 영어뿐만 아니라 170개 이상의 국가에서 사용 가능하며, 추후 더 많은 국가로 확장될 예정입니다. 픽셀 기기에서는 Gemini를 기반으로 한 녹음 파일, 스마트 답장 등 새로운 AI 기능이 도입될 예정입니다. 또한, Gemini는 구글 듀엣 AI, 광고, 검색 등 다양한 분야에 활용될 계획입니다.

12월 13일부터는 구글 클라우드 Vertex AI에서 Gemini Pro와 API를 사용할 수 있게 됩니다. 구글 AI 스튜디오는 무료 웹 기반 개발 도구로, API 키를 사용하여 앱을 빠르게 프로토타이핑하고 출시할 수 있습니다. Vertex AI는 완전 관리형 AI 플랫폼으로, Gemini의 사용자 정의와 데이터 관리, 추가적인 구글 클라우드 기능을 제공합니다.

Android 개발자들은 Pixel 8 Pro 기기에서 Android 14에 새롭게 도입되는 AICore를 통해, 기기 내 작업에 최적화된 Gemini Nano를 사용할 수 있게 됩니다. AICore의 초기 프리뷰에 대한 등록도 가능합니다.

Gemini Ultra 모델은 현재 최종 안전 검사와 검수 중에 있으며, 내년 초 일부 고객들에게 시범적으로 사용되기 전에 추가적인 검수, 피드백 수집, 테스트를 거칠 예정입니다. 또한, 내년 초에는 Bard의 고급 버전과 함께 새로운 모델인 Gemini Ultra의 사용이 가능하게 될 예정입니다.

Gemini의 출현은 AI 분야에서 중대한 전환점을 의미합니다. 구글은 이를 통해 AI 기술의 미래를 새롭게 그리고 있으며, Gemini의 다양한 버전과 기능은 AI가 우리 삶에 미치는 영향을 더욱 확대시킬 것입니다. 이는 또한 구글이 AI 분야에서 지속적으로 혁신을 추구하고 있다는 것을 보여주며, Gemini Era의 시작은 단순한 기술적 진보를 넘어 AI 기술이 인류의 삶을 어떻게 변화시킬 수 있는지를 보여주는 중요한 사례입니다.

Gemini 모델의 발전은 AI 기술이 사회적, 경제적, 심지어 문화적인 측면에서도 큰 변화를 가져올 것임을 시사합니다. AI의 능력이 인간의 일상 생활뿐만 아니라 산업, 교육, 의료 등 다양한 분야에 긍정적인 영향을 미칠 수 있는 가능성을 열어주고 있습니다. 구글의 이러한 혁신적인 접근은 AI 기술의 발전과 적용을 위한 새로운 길을 열고 있으며, 향후 AI 분야에서의 경쟁과 혁신에 있어 중요한 이정표가 될 것입니다.

By BetaAI