걸음걸이가 어색하고 삐뚤삐뚤한 로봇이 엔비디아, 삼성전자, LG, 아마존 모두의 투자를 받았다면 믿어지시겠습니까? 처음 그 영상을 봤을 때 솔직히 이건 예상 밖이었습니다. 매끄럽게 움직이는 중국 로봇들 사이에서 왜 하필 이 회사인가 싶었거든요. 그런데 파고들수록 이유가 있었습니다.

어떻게 배우느냐가 어떻게 움직이느냐보다 중요한 이유
로봇이 잘 걷는 것과 어디서든 걸을 수 있는 것은 완전히 다른 문제입니다. 지금까지 대부분의 로봇은 균일한 지면, 정해진 경로, 사전에 튜닝된 보행 제어계 위에서만 제대로 작동했습니다. 연구실에서 1mm 오차도 없이 완벽한 동작을 수행하는 로봇이 현장에 나오는 순간 바닥 전선 하나에 멈춰버리는 장면을 떠올리면 이해가 빠릅니다. 제 경험상 이건 로봇 분야만의 문제가 아니라, 실험실 성과와 실제 현장 사이의 간극이라는 공학 전반의 오래된 과제이기도 합니다.
스킬드 AI(Skild AI)가 주목받은 이유는 바로 이 지점에서 출발합니다. 이 회사는 모방 학습(Imitation Learning)의 한계를 정면으로 직시했습니다. 여기서 모방 학습이란 로봇이 인간의 행동 시범을 보고 그대로 따라하도록 훈련시키는 방식을 말합니다. 문제는 컵의 위치가 10cm만 바뀌어도 동작에 실패할 만큼 법용성이 극히 낮다는 점입니다. 창업자인 아브나브 굽타는 카네기 멜론대학교 재직 시절, 로봇팔 하나로 물건 집기라는 단순한 동작을 위해 700시간, 5만 번 이상의 시도를 반복한 연구를 했습니다. 이 결과는 성공의 증거가 아니라 오히려 경고였습니다. 이 비용 구조로는 인간 수준의 로봇은 영원히 불가능하다는 계산이 나왔으니까요.
그래서 스킬드 AI가 선택한 방향은 어포던스(Affordance) 기반 학습입니다. 어포던스란 사물의 사용 가능성을 직관적으로 파악하는 능력을 의미합니다. 머그잔은 손잡이를 잡고, 망치는 손잡이 끝을 쥐어야 못을 박을 수 있다는 것을 '이건 컵이다'처럼 외우는 게 아니라, 맥락 속에서 눈치채도록 만드는 것입니다. 영상 속에서 이런 패턴을 추출해 로봇에게 이식하는 방식이고, 2022년에 이 접근이 현실 세계에서도 유효하다는 것이 실험적으로 입증되었습니다.
결정적인 전환점은 시뮬레이션-투-리얼리티(Sim-to-Real) 기술의 성과입니다. 시뮬레이션-투-리얼리티란 가상 환경에서 훈련된 데이터를 실제 로봇에 이식해도 현실의 복잡성 속에서 정상 작동하도록 하는 기술 체계를 말합니다. 스킬드 AI 연구팀은 2024년 기준으로 이 방식이 전통적인 훈련 방식 대비 약 40% 높은 성능을 보인다는 것을 확인했습니다. 로봇이 처음 보는 환경에서도 적응할 수 있는 범용 AI, 즉 피지컬 AI(Physical AI)로 가는 핵심 경로가 바로 여기에 있습니다.
한국 입장에서 이게 흥미로운 이유가 있습니다. K팝, 버추얼 아이돌, XR 콘텐츠 같은 한국의 강점 산업이 사실상 고도화된 시뮬레이션 환경으로 기능할 수 있다는 점입니다. 로봇 학습에 필요한 대규모 시뮬레이션 데이터를 한국이 이미 만들어내고 있다는 시각은 개인적으로도 꽤 설득력 있게 다가왔습니다.
스킬드 AI가 세계 최정상급 인재들을 끌어모을 수 있었던 배경도 여기서 연결됩니다. 로봇계의 안드로이드, 즉 범용 로봇 운영체제가 되겠다는 비전이 카네기 멜론 연구진과 메타 출신 대규모 AI 개발 경험자들을 하나로 묶은 것입니다.
핵심 포인트를 정리하면 다음과 같습니다.
- 모방 학습의 한계: 위치 변화에 극히 취약, 700시간·5만 번 시도로도 단일 동작 학습
- 어포던스 기반 학습: 사물의 사용 방식을 맥락으로 파악, 영상 데이터에서 패턴 추출
- 시뮬레이션-투-리얼리티: 가상 훈련 데이터를 현실에 이식, 기존 대비 40% 성능 향상
- 범용성(Generalization): 처음 보는 환경에서도 적응하는 것이 핵심 목표
한국 로보틱스의 현실, 어디서부터 막혔는가
삼성이 메모리 반도체의 자원을 전장과 이미지 센서 분야로 오래전부터 분산해 왔다는 것, 당시 메모리 부진을 보면서 다른 쪽을 들여다봤던 사람들은 이미 눈치챘을 겁니다. 제가 그 흐름을 지켜보면서 느꼈던 건, 전략적 피벗은 항상 외부에서 늦게 알려진다는 점이었습니다. 소프트웨어 우선주의를 선언한 스킬드 AI도 비슷한 맥락입니다. 하드웨어가 아닌 두뇌, 즉 AI 소프트웨어에 미래 로봇 시장의 패권이 달려 있다는 판단을 일찍 굳힌 것이죠.
그렇다면 한국은 이 흐름에서 어디에 서 있을까요? 솔직히 말씀드리면, 전망이 밝지 않습니다. 저도 정부 지원을 받고 민간 투자도 받아본 스타트업에 있어봐서 그 차이를 몸으로 압니다. 정부 지원금은 어디에 썼느냐를 증명하는 데 에너지의 상당 부분이 들어갑니다. 대학원에서 국책과제를 해본 분들은 더 공감하실 텐데, 낮에는 행정 처리로 시간을 다 쓰고 정작 연구는 밤에 해야 하는 구조입니다. 더 좋은 장비를 발견해도 기존 계획서에 없는 품목이면 구매 자체가 극히 복잡해집니다. 이 경험이 꽤 뼈아팠습니다.
중국 칭화대의 원칙은 최소 10년 투자입니다(출처: 칭화대학교 공식 사이트). 우리나라는 정권이 바뀌면 R&D 우선순위가 함께 바뀌는 구조라 장기 투자 자체가 어렵습니다. 화웨이의 경우 성과 중심 예산 집행을 원칙으로 하고, 집행 과정의 사전 통제보다 결과물에 집중합니다. 반면 한국 정부 지원 사업은 몇 천만 원만 넘어도 비교 견적서와 사전 승인이 필수입니다. 정부 지원 사업은 사업의 본질을 벗어나게 만든다는 말이 연구자들 사이에서 공공연히 도는 이유입니다.
AGI(범용 인공지능)로 나아가기 위한 피지컬 AI 경쟁에서, 몸을 가진 로봇이 현실을 학습하는 과정이 핵심 경로라는 것은 이제 업계의 공통된 인식입니다. 여기서 AGI란 특정 작업이 아닌 인간처럼 다양한 영역에서 스스로 판단하고 행동할 수 있는 인공지능을 의미합니다. 미국 스탠퍼드 대학교 AI 인덱스 보고서에 따르면, 로봇 관련 AI 논문 출판 수와 투자 규모 모두 2023년 이후 가파르게 상승하고 있습니다(출처: Stanford HAI AI Index). 한국이 콘텐츠와 반도체에서 쌓아온 역량이 로봇 AI의 학습 데이터 공급망으로 이어지려면, 지금의 사전 통제 중심 포지티브 규제를 결과 중심 네거티브 규제로 전환하는 것이 선행 조건입니다. 네거티브 규제란 금지 항목만 명시하고 그 외는 모두 허용하는 규제 방식으로, 연구자가 매번 과업 지시서와 비교 견적서를 제출하는 부담을 없애줍니다.
저는 세계 최초라는 이유만으로 지원을 받지 못하거나, 서양에서 시도하지 않았다는 이유로 불가능하다고 판정받는 구조야말로 한국 혁신의 가장 큰 장벽이라고 생각합니다. 창조적 파괴가 필요한 건 기술 자체가 아니라 그 기술을 둘러싼 제도적 틀입니다.
피지컬 AI는 결국 로봇이 얼마나 새로운 환경에 적응하느냐의 싸움입니다. 그리고 그 싸움에서 한국이 가진 콘텐츠 자산이 진지하게 활용되려면, 연구자와 기업이 허락을 구하느라 시간을 낭비하지 않아도 되는 환경이 먼저입니다. 스킬드 AI가 주목받은 건 단지 기술 때문만이 아니었습니다. 명확한 비전이 S급 인재를 끌어당겼고, 그 인재들이 10년 가까운 연구를 쌓은 결과입니다. 한국에서도 그런 흐름이 만들어지길 바랍니다.