구글의 새로운 야심작, Gemini3 pro 사용기 및 특징

25년 11월 28일, Google이 Gemini 3 pro를 공개했습니다.
구글 서치, Gemini 앱, 클라우드 서비스에 AI 모델이 통합된게 가장 큰 특징 입니다.
시장에선 단순한 모델 업그레이드가 아닌 새로운 차원의 AI 모델의 출시라고 합니다.
Gemini3 pro 사용기 및 AI 모델 특징 함께 알아보겠습니다.

향상된 Gemini3 pro AI 모델 특징

Gemini 3 pro는 여러종류의 모달리티를 동시에 입렵받고 처리할 수 있는 능력을 갖췄습니다.

AI의 모달리티(Modality)란 AI가 다루는 정보의 형태 또는 유형을 뜻합니다.
즉, AI가 정보를 인지하고 표현하는 방식 입니다.

사용자가 대화(텍스트)로 도형(이미지)를 요청해서, AI가 도형(이미지)를 만드는 과정을 모달리티 라고 합니다.

모달리티 예시
텍스트 : 텍스트 형식의 글, 파일을 읽고 텍스트 형식으로 결과물을 내놓는방식
이미지 : 이미지를 인식하거나, 이미지 또는 도형을 만드는 방식
음성/오디오 : 음성/오디오를 인식하고, 음성/오디오로 만들어내는 방식
영상/비디오 : 영상, 비디오를 인식하고, 새로운 영상/비디오를 만들어내는 방식
코드 : 프로그래밍 언어를 인식하거나, 요청사항을 코드를 통해 표현하는 방식

멀티모달리티란, AI 모델이 두 개 이상의 서로 다른 종류의 데이터(텍스트, 이미지, 영상, 코드 등)를
동시에 이해하고 처리할 수 있는 능력 입니다.
이를 바탕으로 새로운 콘텐츠를 생성할수 있습니다.

예시

  • 손으로 그린 다이어그램을 AI에 업로드
  • 그림을 이해하고 코드로 변환
  • UI를 설명하는 문서 생성

Step 1)
UI를 손으로 그린후 AI 프롬프트에 업로드 하면
코드로 변환

단순하게 손 스케치한 이미지와 원하는 기능을 텍스트로 요청 합니다 (멀티모달리티).
Gemini는 요청사항을 인식후 Canvas 영역에 결과물을 만들어 줍니다.

글로 작성했던 간단한 요청사항인
‘Details’ 버튼 클릭시 상세 페이지 도 함께 생성합니다.


Step2) UI에 대해
서비스 기획서 작성을 요청하면
기획서 초안 작성


Context Window의 기억력 향상

텍스트 기준으로는 소설책 수백권 분량, 수십만 줄의 코드를 한번에 입력하고 분석할 수 있는 수준 입니다.
멀티모달 기준 긴 수준의 영상파일이나, 수십장의 고해상도 이미지등을 동시에 처리할 수 있습니다.

긴 컨텍스트 윈도우 특성상 참조할수 있는 정보가 많아지며 환각 현상 감소에도 도움이 됩니다.

활용 예시
코드 디버깅 기능으로 한 제품의 코드 전체를 입력 후
구조를 이해한 상태로 버그를 찾아내고 최적화 방안을 제안할수있습니다.

Gemini는 MoE기반으로 여러 벤치마크에서 최고 점수를 기록했습니다.

AI에게 질문을 하게 되면, 적절한 결과를 내 줘야 합니다.

Gemini에는 다양한 분야별 전문 AI 모델이 있다면
그 중 해당 분야에 대해 잘 답할 수 있는 모델(2~4개)이 투입되어 빠르고, 효율적인 답을 할 수 있게 합니다.

기존엔 질문 하나에 대해 AI 모델 전체가 다 활용됐다면,
Gemini 3 pro의 경우 AI 모델 중에서도 가장 유사한 분야의 모델이 응답에 참여하게 됩니다.

“양자 기술 투자”에 대한 질문을 묻게 되면
‘양자물리 관련 전문 모델’, ‘금융 투자 관련 전문 모델’ 이 그 응답에 참여하게 됩니다.

Gemini의 성능 지표는 아래에서 확인할 수 있습니다.

구글코리아 블로그 Gemini 3 주요 벤치마크 레퍼런스 링크

Gemini 3의 주요 활용 사례

스스로 계획하고 실행하는 에이전트 기능 혁신
  • 복잡한 업무 자동화 :
    – 이메일 정리를 통한 일정 정리
    – 여행을 위한 항공권 예약 부터 여행 계획 수립 및 호텔 예약

AI가 복잡한 여러 단계의 작업을 계획하고 실행하는 능력을 가졌습니다.

“항공편을 검색한 다음, 그 결과에 따라 근처 호텔을 예약해줘”

위와 같이 하나의 프롬프트를 요청하면 각 단계에 필요한 도구를 순차적으로 호출하고 결과를 냅니다.
(다음 구글 블로그에서 자세한 내용을 확인할수있습니다)

또한, Google Antigravity를 통해 Agent 기반의 IDE 개발환경을 제공합니다.
Antigravity에서는 터미널, 브라우저, 에디터 전반을 AI가 자동으로 동작 시키며 작업을 수행합니다.
즉, 담당개발자는 개발 설계를 한다면, AI는 버그 수정, UI 구현, 리서치 등을 담당합니다.

다음은 Antigravity를 통한 UI 검증 활용 사례 입니다.

Vibe Coding 성능 향상을 통한 창의적인 UI 개발
  • 웹/앱 프로토타이핑 시간 단축
  • 대중화 가능한 콘텐츠 제작 (앱게임, 영상 등)
  • 3D voxel 아트, 게임 구조 설계 등 복잡한 작업 가능
  • 한 줄의 프롬프트로 게임 개발 가능 (음성 메모로 랜딩페이지 생성 등)

대부분의 AI 서비스가 대화형 기반이라면, Gemini 3 pro는 멀티 모달이 가능합니다.
즉, 이미지 인식 + 텍스트 인식을 통해 복잡한 명령을 이해하고, 심층 도구로 높은 수준의 아이디어로 앱을 개발할수있습니다.
Vibe Coding 성능은 25년 11월 22일 기준 WebDev Leaderboard에서 1483 스코어로 1위를 차지합니다.

WebDev Leaderboard 캡쳐 (링크)

가볍게는 Google Canvas, 혹은 Google AI Studio를 통해 프롬프트 한 줄로 게임을 생성하거나 인터랙티브한 랜딩페이지를 만들수 있습니다.

혹은, 손으로 그린 스캐치, 다이어그램을 입력하면 AI가 구조를 파악해 웹 코드로 변환이 가능합니다.
아래 영상과 같이 이미지 스케치, 설계도 등을 참고해
웹상에서 활용 가능한 서비스 개발이 가능합니다.

멀티모달 추론과 분석을 통한 복잡한 차트, 데이터 분석부터 영상 이해
  • 논문 시각자료 분석
  • 교육 영상 핵심 내용 요약 및 질문 응답

멀티모달리티 성능으로 인해 100만토큰 이상의 컨텍스트 윈도우 저장소로 복잡한 데이터 해석과 문제를 이해할수있습니다.

예를 들어서 복잡한 논문을 학습시켜,
인터렉션으로 체험해볼수있는 웹사이트까지 만들어볼수 있습니다.

Gemini3와 구글 검색의 통합 : AI Search Mode
  • 물리학 논문 스터디를 위한 검색 및 상호작용 제공
  • 주택담보대출 조사에 대한 결과 및 대출 계산기 제공

미국을 시작으로 구글 AI Pro와 Ultra 버전 구독일 경우 Gemini 3 pro 검색 기능이 탑제된 구글 검색 기능을 활용할수 있습니다.
검색을 할 경우, 결과를 동적으로 확인할수 있습니다.

Gemini3 pro의 thinking 모드

Search Mode를 사용하게 될 경우, 기존 Chat-AI 사용을 하듯이 대화형으로 검색을 하게 되면
원하는 결과를 보여주고, 실제 사용해볼 수 있는 예제도 사용해볼수있습니다.

예를 들어, 주택 담보대출 옵션에 대해 검색을 할 경우 단순히 결과만 보여주는게 아닌
직접 비교해볼 수 있는 담보대출 계산기도 간단한 코드를 통해 제공해 줍니다.

고품질 이미지 생성 (나노바나나 Pro)
  • 촬영 없이 고품질 4k 제품 이미지 생성
  • 데이터기반 인포그래픽 자료 생성
  • 다국어 컨텐츠 현지화
  • 스토리보드 및 캐릭터 일관성 유지
  • 사진 편집 및 보정

나노바나나의 경우, 고품질 컨텐츠 제작이 가능할 정도로 모델 성능이 향상됐다는 시장 평가를 받습니다.
추상적인 이미지 생성이 아닌, 사실적인 이미지를 생성할수 있습니다.

성능 지표Nano Banana Pro정량적/기술적 지표기존 모델(Nano Banana 1)과의 차이
고해상도 출력광고, 인쇄물 등 전문 제작 수준 품질
물리적 광학 기반 제어 기능 제공
최대 4K 해상도
(2K, 4K 옵션 제공)
기존 모델: 1024×1024 해상도 수준
텍스트 렌더링이미지 내 텍스트의 가독성,
철자 정확도, 스타일 일관성
획기적 개선.
다국어 텍스트 지원 및 정확한
서체(Typography) 표현.
기존 모델: 텍스트가 뭉개지거나 오류 발생 빈번.
이미지 합성 및 일관성여러 요소를 하나의 이미지에
정밀하고 일관성 있게 통합.
최대 14개의 입력 이미지 결합 가능. 최대 5명의 인물 일관성 유지.기존 모델: 합성 가능 개수 및 인물 일관성 유지가 제한적.
현실 세계 정보Google 검색과 통합되어
실시간 데이터 기반 이미지 생성.
검색 접지(Search Grounding) 기능 탑재.기존 모델: 실시간 정보 통합 기능 부족.
창의적 제어전문 사진작가처럼
세밀한 시각 요소를 제어 가능.
조명, 초점(Depth of Field), 카메라 앵글, 색보정(Color Grading) 등을 프롬프트로 제어.기존 모델: 제어 옵션이 제한적.

아래와 같이 개별 캐릭터 모델을 생성한 후에,
동일한 스타일을 유지한 채로 배경, 구조를 바꿔 이미지를 생성할 수 있습니다.
이미지의 일관성을 유지할 수 있습니다.

Gemini 3 pro 나노바나나 활용 페이지 캡처
Gemini 3 pro 나노바나나 활용 페이지 캡처

위 이미지와 같이, 개별 3D 캐릭터를 생성한 후

시장의 주요 반응 및 투자 관점

시장에서는 구글 Gemini 3 pro 출시로, AI 관련 빅테크 업계와 투자 시장에 큰 반향을 일으켰다는 평가 입니다.
특히나, 이번 AI 모델 출시로 주가에서도 긍정적인 상승을 보여주었습니다.

  • 다중모드(멀티모달리티) 및 복잡한 추론, 능력에 대한 긍정적인 성과
    멀티모달리티 능력이 크게 강화되면서 수학/과학/엔지니어링 등 벤치마크에서 좋은 결과를 보여주고 있습니다.

  • 유명 벤치마크, 안전성 분야에 최고 기록 달성
    Humanity’s Last Exam, GPQA Diagmond 에서 기존 AI 점수보다 높은 결과를 기록하며,
    똑똑한 AI, 안정적인 모델이라는 평가가 퍼지고 있습니다.

  • 개발자 개발 환경의 폭발적인 개선
    gemini 3 pro를 쉽게 쓸수 있는 API 개발 도구를 제공 합니다 (Google Antigravity).
    또한, 획기적인 AI 프롬프트 개발 UX의 혁신으로 사용성이 개선됐습니다.

  • Gemini3 pro 에이전트 기능의 외부 활용
    Adobe, Figma 등 Gemini 3 Pro 서비스를 활용해 AI 기능을 제공하는 IT 기업들이 증가하고 있습니다.

댓글 남기기