구글, '제미나이 3.1 프로' 출시…추론 성능 2배 향상으로 GPT·클로드 제쳐

블록스트리트 등록 2026-02-20 13:36 수정 2026-02-20 13:36

ARC-AGI-2 벤치마크 77.1% 기록, 제미나이 3 프로 대비 2배↑…오픈AI·앤스로픽 모델 앞질러

구글, '제미나이 3.1 프로' 출시…추론 성능 2배 향상으로 GPT·클로드 제쳐
구글이 전일 추론 성능을 대폭 강화한 인공지능(AI) 모델 '제미나이 3.1 프로(Gemini 3.1 Pro)'를 출시했다. 제미나이 3.1 프로는 지난해 11월 출시된 제미나이 3.1의 후속 모델로, 핵심 추론(Core Reasoning) 능력에서 비약적인 발전을 이뤘다.

구글은 제미나이 3.1 프로를 "더 스마트하고 강력한 복잡한 문제 해결 기준 모델"로 소개하며, 엄격한 벤치마크 테스트에서 상당한 진전을 이뤘다고 밝혔다. 이번 출시는 지난주 제미나이 3 딥 씽크(Gemini 3 Deep Think)의 대규모 업데이트를 발표한 지 일주일 만에 이뤄졌다.

ARC-AGI-2 벤치마크 77.1% 달성…전작 대비 2배 이상


제미나이 3.1 프로는 완전히 새로운 논리 패턴을 해결하는 모델의 능력을 평가하는 'ARC-AGI-2' 벤치마크에서 검증 점수 77.1%를 기록했다. 이는 이전 버전인 제미나이 3 프로의 31.1%와 비교해 2배 이상 향상된 수치다.

ARC-AGI-2는 AI 모델이 학습하지 않은 새로운 논리 문제를 얼마나 잘 해결하는지 측정하는 벤치마크로, 인간 수준의 일반 지능(AGI)에 얼마나 근접했는지를 평가하는 중요한 지표다. 제미나이 3.1 프로의 77.1%는 현재까지 공개된 AI 모델 중 최고 수준의 성능이다.

오픈AI GPT-5.2·앤스로픽 클로드 오퍼스 4.6 넘어서


제미나이 3.1 프로의 77.1% 점수는 경쟁사 모델들을 크게 앞지른다. 오픈AI의 GPT-5.2는 52.9%, 앤스로픽의 클로드 오퍼스 4.6은 68.8%를 기록해 제미나이 3.1 프로보다 낮은 성능을 보였다.

구글 제미나이 팀은 "제미나이 3.1 프로의 핵심 지능이 지난주 업데이트된 제미나이 3 딥 씽크의 기반"이라며 "복잡한 과제 해결을 위해 더욱 스마트해진 모델"이라고 설명했다. 제미나이 3 딥 씽크는 과학, 연구, 엔지니어링 분야의 현대적 과제들을 해결하기 위해 개발됐다.

텍스트로 코딩·애니메이션 생성…실용성 강화


제미나이 3.1 프로는 단순한 추론 성능 향상을 넘어 실용적인 기능도 대폭 강화했다. 텍스트 명령만으로 코딩과 애니메이션을 생성할 수 있으며, 명령 수행 능력과 도구 사용, 에이전트 코딩 기능이 크게 개선됐다.

구글은 "제미나이 3는 뛰어난 명령 수행 능력을 제공하며, 도구 사용과 에이전트 코딩에서 의미 있는 개선을 이뤘다"고 강조했다. 현재 제미나이 3.1 프로는 구글 AI 스튜디오와 버텍스 AI를 통해 이용할 수 있다.

구글은 제미나이 3 시리즈를 통해 추론 성능에서 경쟁사들을 앞서가며 AI 시장에서의 입지를 강화하고 있다. 국내 AI 업계와 투자자들은 구글의 이번 발표가 AI 기술 발전 속도를 가늠할 수 있는 중요한 지표가 될 것으로 주목하고 있다.

최주훈 joohoon@blockstreet.co.kr