hultakai 님의 블로그

구글의 Gemini Robotics와 Gemini Robotics-ER, 로봇 혁신의 시작! 본문

과학 공학

구글의 Gemini Robotics와 Gemini Robotics-ER, 로봇 혁신의 시작!

hultakai 2025. 3. 14. 11:07
728x90
반응형

구글의 Gemini Robotics와 Gemini Robotics-ER, 로봇 혁신의 시작!

2025년 3월 12일, 구글의 AI 연구 부문인 DeepMind가 두 가지 신기술을 발표하며 로봇 업계를 흔들었어요. 바로 Gemini RoboticsGemini Robotics-ER인데요, 이게 뭔지, 왜 개발했는지, 어떻게 만들었는지, 앞으로의 계획은 뭔지, 그리고 두 모델의 차이점까지 한 번에 정리해 볼게요!

Gemini Robotics와 Gemini Robotics-ER, 대체 뭐야?

  • Gemini Robotics: 구글의 최신 AI 모델 Gemini 2.0을 기반으로 한 로봇 전용 기술이에요. 로봇이 시각, 언어, 그리고 물리적 행동을 통합해 실제 세상에서 다양한 일을 할 수 있게 해줘요. 예를 들어, "종이를 접어줘"라고 말하면 로봇이 종이를 조심스럽게 접는 식이죠.
  • Gemini Robotics-ER: "Embodied Reasoning(구체적 추론)"의 약자로, 공간 인식과 물리적 이해를 강화한 모델이에요. 로봇이 주변 환경을 더 잘 파악하고 안전하게 움직일 수 있도록 설계됐죠. 커피 잔을 집을 때 손잡이를 어떻게 잡을지 계산하는 수준이에요.

구글이 왜 개발했을까?

구글은 AI가 텍스트나 이미지에서 벗어나 현실 세계에서 유용하게 쓰이길 원했어요. 지금까지의 AI는 채팅이나 검색에 강했지만, 로봇처럼 물리적 행동을 하는 데는 한계가 있었죠. CEO 선다 피차이(Sundar Pichai)는 "로봇은 AI 발전을 현실로 옮기는 테스트 장"이라고 말하며, 인간처럼 세상을 이해하고 반응하는 "구체적 추론(Embodied Reasoning)" 능력을 키우는 게 목표였어요. 게다가 산업, 가정, 심지어 군사적 용도로 로봇 수요가 늘고 있어, 이 시장을 선점하려는 전략도 깔려 있어 보입니다. 하지만 과연 상업적 이익만 추구하는 걸까요? 로봇 안전성과 윤리적 사용도 중요한 의문점으로 남네요.

개발 과정은 어땠을까?

개발은 DeepMind의 오랜 AI 연구를 바탕으로 진행됐어요:

  1. 기초 연구: Gemini 2.0의 멀티모달 능력(텍스트, 이미지, 오디오 처리)을 로봇에 맞게 확장하기 시작.
  2. 데이터 수집: 주로 ALOHA 2라는 이중 팔 로봇 플랫폼에서 데이터를 모았고, 다양한 로봇 형태(휴머노이드 포함)를 테스트.
  3. 테스트 단계: 2024년부터 Apptronik, Boston Dynamics 같은 파트너와 협력하며 실험. 예를 들어, 바나나를 바구니에 넣거나 안경을 케이스에 정리하는 작업을 시도.
  4. 안전 강화: 아시모프의 로봇 3원칙에서 영감받아 "Robot Constitution"을 만들어 로봇이 사람을 해치지 않도록 설계.

이 과정에서 DeepMind는 수백 가지 시나리오를 테스트하며, 기존 모델보다 성능이 2배 이상 향상됐다고 주장했어요. 하지만 초기 단계라 상용화까지는 시간이 더 필요해 보입니다.

어떻게 개발했나?

Gemini Robotics는 Gemini 2.0에 물리적 행동을 추가한 "Vision-Language-Action(VLA)" 모델로, 카메라로 본 물체를 인식하고 명령에 따라 움직이게 했어요. 반면 Gemini Robotics-ER는 공간 이해에 초점을 맞춰, 로봇이 새로운 환경에서도 안전하게 작동할 수 있도록 훈련했죠. 두 모델 모두 다양한 로봇(Franka 팔, Apptronik의 Apollo 등)에 맞게 유연하게 설계됐어요. 특히, 안전을 위해 저수준 제어기와 연결하고, ASIMOV 데이터셋을 공개해 안전 연구를 지원했답니다. 기술적으로 인상적이지만, 데이터 의존도가 높아 편향 가능성도 경계해야 할 부분이에요.

앞으로 구글의 계획은?

구글은 이 기술을 다음 단계로 끌어올릴 계획이에요:

  • 휴머노이드 로봇 개발: Apptronik과 협력해 Gemini 2.0 기반의 차세대 로봇을 만들 예정.
  • 파트너십 확대: Agile Robots, Agility Robots, Boston Dynamics 등 신뢰할 수 있는 기업과 테스트를 진행 중.
  • 안전성 강화: Responsible Development 팀과 외부 전문가와 협력해 윤리적 사용을 보장.
  • 실제 적용: 집안일(설거지, 정리), 공장 작업, 심지어 교육용 로봇까지 목표로 해요. 하지만 상용화 시점은 아직 불확실하니, 기대 반 걱정 반이네요.

Gemini Robotics와 Gemini Robotics-ER의 차이점은?

두 모델은 비슷해 보이지만 역할과 초점이 달라요:

  • 기능: Gemini Robotics는 시각-언어-행동(VLA)을 통합해 로봇이 직접 움직이게 해요(예: 종이 접기). 반면 Gemini Robotics-ER는 공간 이해와 추론에 집중해, 로봇이 어떻게 행동할지 계획 짜는 데 강점(예: 커피 잔 안전 잡기).
  • 용도: Gemini Robotics는 실질적 작업 수행에, Gemini Robotics-ER는 개발자용 기반 모델로 활용.
  • 유연성: Gemini Robotics는 다양한 로봇에 맞게 훈련됐고, Gemini Robotics-ER는 저수준 제어기와 연동해 커스터마이징 가능.
  • 안전: Gemini Robotics-ER가 더 안전 설계에 중점을 둬, 새로운 환경에서도 위험을 피할 수 있게 함.

 

글보다는 영상으로 보는게 더 좋겠죠?

아래 공식영상 확인하세요!

 

https://youtu.be/ikZeU3wKVjM?si=x7_4nLCC0i9V4bPe

 

https://youtu.be/4MvGnmmP3c0?si=vAI-maXpMkzfiKhU

 

728x90
반응형