지난 10년간 구글은 현대 AI의 핵심 기반을 다져오기 위해 다양한 노력을 해왔습니다. 대규모 언어 모델의 기반이 된 트랜스포머(Transformer) 아키텍처를 개척하고, 알파고(AlphaGo)와 알파제로(AlphaZero) 등 혁신적인 에이전트 시스템을 개발했습니다.
또한 이러한 방식을 통해 양자 컴퓨팅, 수학, 생명 과학, 알고리즘을 이용한 발견 등 다양한 분야에서 의미 있는 성과를 이뤄냈습니다. 구글은 지금도 기반 연구의 폭과 깊이를 계속해서 넓혀가며, 범용 인공지능(artificial general intelligence, AGI) 구현에 필수적인 다음 단계의 혁신을 창출하기 위해 지속적으로 노력하고 있습니다.
이 같은 노력의 연장선상에서 구글은 최고의 멀티모달 기반 모델인 제미나이 2.5 프로를 인간의 뇌처럼 현실 세계의 여러 측면을 시뮬레이션하고, 계획을 세우며, 새로운 경험을 상상하는 능력을 갖춘 ‘월드 모델(world model)’로 확장하기 위해 노력하고 있습니다.
바둑, 스타크래프트 등의 복잡한 게임을 마스터하는 에이전트 훈련과 같은 선구적인 연구부터, 단일 이미지 프롬프트만으로 상호 작용을 할 수 있는 3D 시뮬레이션 환경을 생성하는 지니 2(Genie 2)에 이르기까지, 구글은 AI의 잠재력을 현실화하기 위해 꾸준히 발전해 왔습니다.
실제로 이미 여러 제품과 사례에서 이 같은 역량을 관찰할 수 있습니다. 제미나이는 세계 지식과 추론을 활용해 자연환경을 표현하고 시뮬레이션하며, 비오(Veo)는 직관적인 물리학을 깊이 이해하고, 제미나이 로보틱스(Gemini Robotics)는 로봇이 물체를 잡고 지침을 따르며, 즉석에서 상황에 따라 유연하게 조정할 수 있도록 학습합니다.
제미나이를 월드 모델로 발전시키는 것은 새롭고, 더 보편적이며, 더 유용한 종류의 AI, 즉 범용 AI 어시스턴트 개발의 중요한 단계입니다. 범용 AI 어시스턴트란 지능적이며, 이용자의 현재 상황을 이해하고, 어떤 기기를 통해서든 요청에 따라 이용자를 대신해 행동을 수행할 수 있는 AI입니다.
