AISplatHub — 사진 20장으로 3D 모델을 만드는 Meta VGGT 적용기
Photogrammetry는 사진 여러 장에서 3D 모델을 복원하는 기술입니다. 십수 년간 산업·연구 분야에서만 쓰였습니다. 이유는 두 가지였습니다 — 정확도가 낮았고, 비용이 높았습니다. CVPR 2025 Best Paper인 Meta VGGT(Visual Geometry Grounded Transformer)가 이 두 장벽을 동시에 무너뜨렸고, WishPle 사업부의 SplatHub은 한국에서 처음 이 기술을 일반 사용자가 쓸 수 있는 형태로 공개했습니다.
기존 photogrammetry의 두 가지 한계
기존 방식은 두 단계로 작동했습니다. 첫째, 사진 간 특징점을 매칭(SIFT, ORB 같은 알고리즘). 둘째, 매칭 정보로 3D 점군을 복원(SfM/MVS). 매칭이 실패하면 다음 단계가 깨집니다. 그래서 "사진을 어떻게 찍어야 하는가"가 매우 까다로웠습니다 — 충분히 겹치되 다른 각도, 일정한 조명, 정적인 물체 같은 조건. 일반 사용자가 이 조건을 다 맞추는 것은 거의 불가능했습니다.
Meta VGGT가 바꾼 것 — 트랜스포머의 동시 처리
VGGT는 이 두 단계를 하나로 통합합니다. 트랜스포머가 모든 사진을 동시에 입력으로 받고, 각 사진의 카메라 파라미터(위치·방향·왜곡)와 3D 형상을 동시에 추론합니다. 매칭이라는 별도 단계가 사라졌기 때문에 매칭 실패라는 실패 지점이 없어졌습니다. 결과적으로 성공률이 일반 사용자의 사진에서 5배 가까이 올랐습니다.
SplatHub의 사용자 인터페이스 전략
기술이 좋아도 사용자가 어떻게 찍어야 하는지 모르면 결과가 안 나옵니다. SplatHub은 촬영 가이드 UI에 가장 많은 시간을 들였습니다.
- 사용자는 물체 주변을 한 바퀴 돌면서 사진을 찍습니다. - 앱이 실시간으로 부족한 시점을 화면에 빨간색으로 표시합니다. - 20장이 채워지면 자동으로 다음 단계로 넘어갑니다.
이 가이드 덕분에 첫 시도 성공률이 70% 이상입니다. 가이드 없이 같은 기술을 노출했을 때(베타 시기) 첫 시도 성공률은 25%였습니다. UI가 알고리즘 성능의 3배 차이를 만든 사례입니다.
비용 0원의 의미 — 산업용 솔루션의 가격 비교
상용 photogrammetry 솔루션의 가격대는 다음과 같습니다.
- Agisoft Metashape: 라이선스 $179-3,499 - RealityCapture: 시간당 $1.20+ 또는 라이선스 $7,500 - Polycam Pro: 월 $24
SplatHub은 이를 무료로 제공합니다. 운영 비용은 GPU 호출당 약 $0.05-0.15입니다. 사용자가 매일 1번 쓴다고 했을 때 월 운영비는 사용자당 $1.5-4.5 수준입니다. 광고나 구독 없이도 일정 규모까지는 손익분기 운영이 가능합니다.
Physical AI 카테고리에서의 위치
WishPle 사업부는 16개 AI 응용 중 Physical AI 4종을 운영합니다. SplatHub(3D 스캔), Staylooper(공간 교환), DullePass(주차), CruiseLog(이동 로그)가 그것입니다. 공통점은 디지털이 아니라 물리적 세계의 측정·이동·교환입니다. SplatHub은 이 카테고리의 핵심으로, 일반 사용자가 일상 공간을 디지털화하는 첫 진입점 역할을 합니다.
현재 한계와 다음 단계
SplatHub은 정적인 물체에 최적화되어 있습니다. 움직이는 물체(예: 사람)는 깨집니다. 또한 큰 공간(예: 건물 전체)은 사진 수가 더 많이 필요해 처리 시간이 분 단위로 늘어납니다. 다음 버전은 두 영역을 다룹니다.
1. 동적 장면: 4D Gaussian Splatting으로 시간축까지 복원 2. 공간 스캔: VR 영상 기반 실내 공간 전체 복원
이 두 기능이 들어가면 SplatHub은 단순 3D 스캔 도구를 넘어 일상 공간의 디지털 트윈을 만드는 일반 도구가 됩니다.
시사점 — Best Paper에서 한국 출시까지의 시간
VGGT는 2025년 발표되었고, SplatHub은 같은 해 한국 출시되었습니다. 논문 발표 → 일반 사용자 응용까지의 시간이 6개월이라는 것이 핵심입니다. 한국 AI 회사가 글로벌 최신 기술을 동등한 시점에 응용할 수 있다는 것을 보여준 사례이기도 합니다.