구글 SIMA 2 등장, AI 에이전트가 진화한 5가지 이유

구글 DeepMind가 이번 주 SIMA 2를 공개했어요. 제미니를 탑재한 이 AI 에이전트는 단순히 명령을 따르는 수준을 넘어 가상 세계를 이해하고 스스로 학습하는 능력을 갖췄답니다. 게임을 넘어 실제 로봇으로 확장될 이 기술, 지금부터 자세히 알아볼게요.

A futuristic AI agent exploring a vibrant virtual world with colorful landscapes, digital elements floating around, Korean appearance character interacting with holographic interfaces, modern sci-fi atmosphere with gradient blue and purple background, bright balanced lighting, centered composition, no text

Table of Contents

SIMA 2가 뭔가요

SIMA는 Scalable Instructable Multiworld Agent의 약자로, 여러 가상 환경에서 작동하는 범용 AI 에이전트예요. 작년 3월에 첫 버전이 나왔는데, 당시에는 복잡한 작업 성공률이 31%에 불과했어요. 사람이 71%였던 걸 생각하면 많이 부족했죠.

그런데 이번에 나온 2세대는 완전히 다른 수준이랍니다. 구글 DeepMind의 조 마리노 선임 연구원은 “SIMA 2는 이전 버전과 비교해 능력이 단계적으로 향상됐다”며 자신감을 보였어요. 실제로 성능이 2배나 올랐거든요.

Advanced AI system interface showing game environment analysis, Korean appearance researcher observing multiple virtual game screens, high-tech laboratory setting with dark blue gradient background, glowing digital displays, futuristic technology visualization, no text, bright lighting

제미니 통합으로 달라진 점

SIMA 2의 가장 큰 변화는 바로 제미니 2.5 플래시 라이트 모델을 탑재했다는 거예요. 제미니는 구글의 대규모 언어 모델인데, 이걸 통합하면서 AI 에이전트가 언어를 이해하고 추론하는 능력이 크게 향상됐답니다.

예를 들어볼게요. “잘 익은 토마토 색깔의 집으로 가세요”라고 지시하면, SIMA 2는 내부적으로 이렇게 생각해요. “잘 익은 토마토는 빨간색이니까, 빨간 집으로 가야겠다.” 그리고 실제로 빨간 집을 찾아서 다가가죠.

더 재미있는 건 이모지도 이해한다는 거예요. “🪓🌲”라고 입력하면 나무를 찾아가서 도끼로 베어요. 언어의 경계를 넘어선 거죠.

환경을 이해하는 능력

데모에서 SIMA 2는 노 맨즈 스카이라는 게임에서 자신의 주변 환경을 설명했어요. “여기는 바위로 된 행성 표면이네요”라고 인식하고, 조난 신호를 발견해서 상호작용했답니다. 그냥 명령을 따르는 게 아니라 상황을 파악하고 판단하는 거예요.

성능이 2배로 뛴 비결

SIMA 1과 비교해서 성능이 정확히 2배 향상됐어요. 이건 단순히 숫자가 좋아진 게 아니라, 실제로 복잡한 작업을 훨씬 잘 처리한다는 의미랍니다.

DeepMind의 신경과학 배경을 가진 제인 왕 연구원은 이렇게 설명했어요. “우리는 AI에게 실제로 무슨 일이 일어나고 있는지 이해하고, 사용자가 요청하는 걸 파악한 다음, 상식적인 방식으로 반응하도록 요구하고 있어요. 이게 사실 꽤 어려운 일이죠.”

제미니의 언어 능력과 SIMA의 구현 능력이 합쳐지면서 시너지가 났다고 볼 수 있어요. 마치 뛰어난 두뇌와 숙련된 손이 만난 것처럼요.

Dynamic scene showing AI agent successfully completing complex tasks in virtual environment, multiple game scenarios displayed simultaneously, Korean appearance developer analyzing performance metrics, vibrant gradient background with orange and teal colors, modern tech aesthetic, no text

스스로 학습하는 AI의 등장

SIMA 2의 진짜 혁신은 자가 개선 능력이에요. SIMA 1은 전적으로 사람이 게임하는 영상으로만 학습했어요. 하지만 SIMA 2는 사람의 데이터를 기본으로 깔고, 그 다음부터는 스스로 배워요.

어떻게 작동하냐면요:

새로운 환경에 AI를 배치해요
다른 제미니 모델이 새로운 작업을 만들어줘요
별도의 보상 모델이 AI의 시도를 채점해요
AI는 자신이 생성한 경험을 학습 데이터로 사용해요

사람처럼 시행착오를 거치면서 점점 나아지는 거죠. 다만 사람 대신 AI 기반 피드백을 받는다는 차이가 있어요. 이건 AGI, 즉 인공 일반 지능을 향한 중요한 발걸음이랍니다.

지니 월드 모델과의 협업

SIMA 2는 DeepMind의 지니(Genie)라는 세계 모델이 만든 사실적인 환경에서도 작동해요. 새로 생성된 세상에서 벤치, 나무, 나비 같은 물체를 정확하게 인식하고 상호작용했답니다. 본 적 없는 환경에서도 적응하는 능력이 있다는 증거예요.

게임을 넘어 실제 로봇으로

DeepMind는 SIMA 2를 게임용 AI로만 보지 않아요. 궁극적인 목표는 실제 세계에서 작동하는 범용 로봇이랍니다.

프레데릭 베세 선임 연구 엔지니어는 이렇게 설명했어요. “실제 세계에서 작업을 수행하려면 두 가지가 필요해요. 첫째는 실제 세계에 대한 높은 수준의 이해와 추론 능력이고, 둘째는 물리적 관절이나 바퀴 같은 걸 제어하는 낮은 수준의 행동이에요.”

SIMA 2는 첫 번째 부분, 즉 높은 수준의 행동에 더 집중한다고 해요. 예를 들어 집 안의 휴머노이드 로봇에게 “찬장에 콩 통조림이 몇 개 있는지 확인해줘”라고 하면, 로봇은 콩이 뭔지, 찬장이 뭔지 이해하고 그곳으로 이동해야 하죠. SIMA 2가 바로 이런 이해와 계획 능력을 담당하는 거예요.

Humanoid robot with Korean appearance features working in modern home kitchen, checking cupboard contents, realistic home interior with warm lighting, gradient beige and soft blue background, natural setting with everyday objects, futuristic yet approachable design, no text

앞으로의 전망은

현재 SIMA 2는 연구 프리뷰 단계예요. DeepMind는 구체적인 출시 일정을 밝히지 않았지만, 제인 왕 연구원은 “우리가 작업해온 것을 세상에 보여주고, 어떤 협업과 잠재적 활용이 가능한지 보고 싶다”고 말했어요.

DeepMind가 최근 공개한 로봇 기초 모델과는 별도로 훈련됐지만, 언젠가는 이 두 기술이 만날 수도 있겠죠. 높은 수준의 추론 능력과 낮은 수준의 물리적 제어가 결합되면, 정말로 범용적인 로봇이 탄생할 거예요.

개인적으로는 SIMA 2가 보여준 자가 학습 능력이 가장 인상적이었어요. 사람의 데이터 없이도 스스로 개선된다는 건, AI가 진정한 의미에서 독립적으로 진화할 수 있다는 뜻이거든요. 물론 안전성과 윤리적 문제는 계속 논의되어야 하겠지만요.

여러분은 이런 AI 에이전트가 일상에 들어온다면 어떤 일을 시키고 싶으세요? 댓글로 의견을 나눠주시면 재미있을 것 같아요.

Futuristic vision of AI agents and robots working alongside humans in various environments, Korean appearance people interacting with advanced technology, vibrant cityscape with holographic displays, gradient purple and cyan background, optimistic future atmosphere, bright balanced lighting, no text

출처: https://techcrunch.com/2025/11/13/googles-sima-2-agent-uses-gemini-to-reason-and-act-in-virtual-worlds/

Hashtags

#SIMA2 #구글DeepMind #AI에이전트 #제미니 #인공지능 #가상세계 #게임AI #AGI #인공일반지능 #자가학습AI #머신러닝 #딥러닝 #로봇기술 #휴머노이드로봇 #범용AI #구글AI #노맨즈스카이 #가상환경 #AI추론 #언어모델 #AI혁신 #미래기술 #스마트로봇 #AI발전 #테크트렌드