현재 인공지능 기술의 중심은 거대한 데이터 센터와 클라우드에 쏠려 있지만 정작 우리 손안의 기기에서 AI를 효율적으로 돌리는 기술은 아직 걸음마 단계에 머물러 있습니다. 이런 상황에서 최근 1,000만 달러의 투자금을 유치하며 등장한 Mirai라는 스타트업이 큰 주목을 받고 있습니다. 이들이 왜 전 세계 테크 업계의 시선을 사로잡았는지 그 핵심적인 이유와 기술적 배경을 정리해 보았습니다.

Reface와 Prisma 창업자가 Mirai를 만든 배경
Mirai의 탄생이 화제가 된 것은 창업자들의 화려한 이력 덕분이기도 합니다. 딥페이크 기술로 유명한 Reface의 공동 창업자 디마 셰브츠와 사진 필터 열풍을 일으켰던 Prisma의 창업자 알렉세이 모이세엔코프가 손을 잡았거든요. 두 사람은 수백만 명의 사용자가 사용하는 앱을 운영하면서 클라우드 서버 비용과 지연 시간의 한계를 뼈저리게 느꼈다고 합니다.
- Reface의 글로벌 스케일링 경험
- Prisma의 실시간 이미지 처리 노하우
- 사용자 기기에서 직접 구동되는 AI의 필요성 절감
이들은 런던에서 만나 대화하던 중 생성형 AI 열풍 속에서 정작 소비자용 하드웨어에서 돌아가는 온디바이스 기술이 빠져 있다는 점에 주목했습니다. 결국 서버를 거치지 않고 스마트폰 자체에서 복잡한 작업을 수행하는 파이프라인을 구축하기 위해 Mirai를 설립하게 된 것이죠.
왜 클라우드가 아닌 온디바이스 AI가 중요한가?
대부분의 기업이 클라우드 인퍼런스 비용에 엄청난 자금을 쏟아붓고 있지만 이런 구조는 지속 가능하지 않다는 것이 전문가들의 지적입니다. 토큰을 사용할 때마다 발생하는 비용은 기업의 수익성을 깎아먹는 주범이 되기도 하거든요.
- 클라우드 서버 운영 비용의 획기적 절감
- 데이터 유출 걱정 없는 강력한 보안성 구현
- 인터넷 연결 없이도 작동하는 즉각적인 반응 속도
특히 개인정보 보호가 중요해진 요즘 시대에 데이터를 외부 서버로 보내지 않고 기기 안에서 처리하는 방식은 사용자들에게 큰 신뢰를 줄 수 있습니다. 투자자들 역시 언젠가는 기업들이 클라우드 경제성의 한계를 깨닫고 엣지 컴퓨팅으로 눈을 돌릴 것이라 예상하며 Mirai의 가치를 높게 평가하고 있습니다.

Mirai 엔진으로 AI 처리 속도를 37% 높이는 법
Mirai는 단순히 모델을 작게 만드는 것에 그치지 않고 인퍼런스 엔진 자체를 완전히 새롭게 설계했습니다. 이들은 시스템 프로그래밍 언어인 Rust를 사용하여 애플 실리콘에 최적화된 엔진을 구축했는데요. 이를 통해 기존 방식보다 처리 속도를 최대 37%까지 끌어올렸다고 주장합니다.
- Rust 기반의 고효율 런타임 설계
- 모델의 가중치를 건드리지 않는 품질 유지 기술
- 애플 M시리즈 및 A시리즈 칩셋 최적화
보통 모델 속도를 높이려고 가중치를 조정하다 보면 출력물의 품질이 떨어지기 마련인데 Mirai는 품질 손실 없이 성능만 개선했다는 점이 놀랍더라고요. 현재는 텍스트와 음성 모달리티에 집중하고 있지만 앞으로는 이미지와 영상 분야까지 지원 범위를 넓힐 계획이라고 합니다.
복잡한 AI 기능을 8줄의 코드로 구현하는 방법
개발자들에게 가장 매력적인 부분은 아마도 압도적인 사용 편의성일 것입니다. Mirai의 목표는 마치 결제 시스템의 Stripe처럼 단 몇 줄의 코드로 복잡한 기능을 구현하게 만드는 것이거든요.
- Mirai 플랫폼에서 API 키 발급 받기
- 제공되는 SDK를 프로젝트에 통합하기
- 단 8줄의 코드로 요약이나 분류 기능 실행하기
복잡한 머신러닝 최적화 과정을 거치지 않아도 개발자가 원하는 기능을 즉시 앱에 심을 수 있다는 점이 정말 혁신적입니다. 이는 중소 규모의 앱 개발사들도 비용 부담 없이 고성능 AI 기능을 탑재할 수 있는 길을 열어준 셈입니다.

스마트폰에서 고성능 AI 모델을 가볍게 돌리려면?
기기의 성능만으로는 한계가 있을 때 Mirai는 이른바 믹스드 모드라는 운영 방식을 제안합니다. 기기 내에서 처리 가능한 작업은 즉시 수행하고 성능이 부족한 작업은 클라우드로 넘겨주는 오케스트레이션 레이어를 구축한 것입니다.
- 온디바이스와 클라우드의 효율적인 업무 분담
- 기기 성능에 따른 유연한 모델 배포 전략
- 하이브리드 인퍼런스를 통한 사용자 경험 최적화
이런 방식은 전력 소모를 줄이면서도 사용자에게는 끊김 없는 경험을 제공하는 데 큰 도움이 됩니다. 앞으로 안드로이드 기기까지 지원이 확대되면 우리가 쓰는 거의 모든 스마트폰에서 Mirai의 엔진이 돌아가는 모습을 보게 될지도 모르겠네요.
Mirai가 그리는 온디바이스 인퍼런스의 미래
Mirai는 단순한 엔진 제공을 넘어 모델 제작자들이 기기별 성능을 직접 테스트해 볼 수 있는 온디바이스 벤치마크 툴도 출시할 예정입니다. 이는 파편화된 모바일 하드웨어 시장에서 표준적인 지표를 제시하겠다는 의지로 읽힙니다.
- 안드로이드 및 다양한 칩메이커와의 협업 확대
- 시각 지능을 포함한 멀티모달 지원 강화
- 전 세계 개발자들을 위한 엣지 AI 생태계 구축
유명 벤처캐피털인 Uncork Capital을 비롯해 ElevenLabs, Groq, Snowflake 등의 창업자들이 이번 투자에 참여한 것만 봐도 이 기술이 가진 잠재력이 얼마나 큰지 알 수 있습니다. 클라우드 중심의 AI 시대가 Mirai를 통해 개인 기기 중심으로 이동하는 변곡점을 맞이하고 있는 것 같습니다.

마치며
Mirai의 등장은 AI 기술이 단순히 거대 자본의 전유물이 아니라 우리 일상 속 기기에서 더 친숙하고 저렴하게 구현될 수 있음을 시사합니다. 서버 비용 걱정 없이 고성능 AI 비서나 실시간 번역기를 주머니 속 스마트폰에서 마음껏 쓰는 날이 머지않아 보이네요. 기술의 발전이 사용자에게 실질적인 이익으로 돌아오는 이런 흐름을 계속해서 지켜봐야 할 것 같습니다.
이어서 보면 좋은 글
#Mirai #온디바이스AI #인공지능 #Reface #Prisma #테크트렌드 #스타트업 #AI인퍼런스 #애플실리콘 #IT뉴스