인공지능 시장의 중심축이 대규모 모델 학습에서 실제 구동을 위한 추론으로 빠르게 이동하고 있습니다. 최근 모달 랩스(Modal Labs)가 25억 달러라는 엄청난 기업 가치를 인정받으며 대규모 투자 유치에 나섰다는 소식이 전해지면서 업계의 관심이 뜨겁습니다. 단순히 자금을 모으는 수준을 넘어 인프라 시장의 판도를 바꾸고 있는 이들의 전략을 구체적으로 살펴보겠습니다.

Modal Labs 가치가 5개월 만에 2배 뛴 배경
모달 랩스는 최근 벤처 캐피털들과 약 25억 달러 규모의 기업 가치를 기준으로 신규 투자 라운드를 논의 중인 것으로 알려졌습니다. 이는 불과 5개월 전 발표된 11억 달러의 가치에서 두 배 이상 급등한 수치라 더욱 놀랍습니다. 현재 제너럴 캐탈리스트가 이번 투자를 주도하기 위해 협의 중이며 모달의 연간 반복 매출은 약 5천만 달러 수준에 도달한 것으로 파악됩니다.
에릭 베른하르드손 대표는 공식적으로는 활발한 펀드레이징 활동을 부인하며 일반적인 대화일 뿐이라고 일축했습니다. 하지만 업계 관계자들은 인퍼런스 시장의 폭발적인 수요가 이들의 가치를 단기간에 끌어올렸다고 분석합니다. 인공지능 서비스를 운영하는 기업들에게 비용 절감과 응답 속도 개선은 생존이 걸린 문제이기 때문입니다.
왜 인공지능 인퍼런스 인프라가 투자자들을 매료시키는가?
인공지능 모델을 학습시키는 단계가 지나고 이제는 이를 실제로 활용하는 추론 단계의 효율성이 중요해졌습니다. 사용자의 질문에 AI가 답을 내놓는 과정인 추론은 막대한 컴퓨팅 자원을 소모하며 이는 곧 기업의 운영 비용으로 직결됩니다. 투자자들이 모달 랩스에 열광하는 이유는 바로 이 지점입니다.
- 컴퓨팅 비용의 획기적인 절감
- 사용자 요청과 응답 사이의 지연 시간 단축
- 복잡한 클라우드 설정 없이도 모델을 즉시 배포할 수 있는 편의성
인퍼런스 시장은 학습 시장보다 규모가 훨씬 커질 것으로 예상됩니다. 모델은 한 번 학습하지만 추론은 사용자가 사용할 때마다 발생하기 때문입니다. 이러한 시장 흐름이 모달 랩스의 가치를 3조 원대에 육박하게 만든 핵심 동력입니다.

General Catalyst가 주목하는 Modal Labs만의 강점 3가지
전 세계적인 벤처 캐피털인 제너럴 캐탈리스트가 모달 랩스에 거액을 베팅하려는 이유는 명확합니다. 기술적 진입장벽과 더불어 시장의 고질적인 문제를 해결하는 능력이 탁월하기 때문입니다.
- 개발자 친화적인 서버리스 환경: 복잡한 인프라 관리 없이 파이썬 코드 몇 줄로 수천 개의 GPU를 제어할 수 있는 환경을 제공합니다.
- 데이터 팀 운영 경험: 스포티파이와 베터닷컴에서 데이터 팀을 이끌었던 에릭 베른하르드손의 실전 경험이 제품에 녹아있습니다.
- 압도적인 확장성: 트래픽이 몰리는 순간에도 즉각적으로 자원을 할당하여 서비스 중단 없는 운영을 지원합니다.
이러한 강점들은 단순히 기술력을 자랑하는 것을 넘어 실제 기업들이 겪는 인프라 운영의 고통을 정확히 해결해 줍니다. 럭스 캐피털과 레드포인트 벤처스 같은 기존 투자자들이 초기에 합류한 이유도 이와 궤를 같이합니다.
폭발적으로 성장하는 AI 인퍼런스 스타트업 시장 현황
현재 시장은 모달 랩스뿐만 아니라 여러 인퍼런스 전문 기업들이 거액의 자금을 흡수하며 몸집을 불리고 있습니다. 경쟁 구도가 심화되면서 인프라 최적화 기술은 더욱 고도화되는 추세입니다.
- 베이즈텐(Baseten): 최근 50억 달러 가치로 3억 달러 규모의 투자를 유치하며 모달의 강력한 라이벌로 부상했습니다.
- 파이어웍스 AI(Fireworks AI): 지난 10월 40억 달러의 가치를 인정받으며 인퍼런스 클라우드 시장의 한 축을 담당하고 있습니다.
- 인퍼랙트(Inferact): 오픈 소스 프로젝트 vLLM 팀이 설립한 스타트업으로 안드레센 호로위츠로부터 8억 달러 가치에 투자를 받았습니다.
- 래딕스아크(RadixArk): SGLang 팀이 상업화한 곳으로 엑셀로부터 4억 달러 가치의 시드 투자를 유치했습니다.
이처럼 수조 원 단위의 가치를 인정받는 기업들이 속출하는 것은 인퍼런스 인프라가 AI 생태계의 필수 재화가 되었음을 시사합니다.

효율적인 AI 모델 운영을 위한 인프라 최적화 방법
모달 랩스와 같은 솔루션을 활용하여 인프라를 최적화하면 기업은 어떤 이점을 얻을 수 있을까요? 단순히 돈을 아끼는 것을 넘어 비즈니스 모델의 구조 자체가 바뀝니다.
- 콜드 스타트 문제 해결: 사용하지 않을 때는 자원을 반납하고 요청이 올 때만 순식간에 모델을 띄워 비용을 0에 가깝게 유지합니다.
- GPU 가용성 확보: 전 세계적으로 부족한 GPU 자원을 효율적으로 분배하여 필요한 순간에만 점유할 수 있습니다.
- 배포 파이프라인 자동화: 코드 변경 사항이 즉시 인프라에 반영되어 개발 주기를 단축합니다.
실제로 많은 스타트업이 초기 구축 단계에서 모달 랩스를 선택하는 이유는 이러한 운영 효율성 때문입니다. 인프라 전문가를 별도로 고용하지 않고도 대기업 수준의 안정적인 서비스를 운영할 수 있다는 점이 매력적입니다.
AI 산업의 중심이 학습에서 추론으로 이동하는 이유
과거에는 누가 더 큰 모델을 만드는지에 집중했다면 이제는 그 모델을 얼마나 저렴하고 빠르게 서비스에 적용할지가 화두입니다. 오픈AI의 o1 모델이나 딥시크의 사례처럼 효율적인 알고리즘과 이를 뒷받침하는 인프라의 조합이 승패를 가르고 있습니다.
추론 인프라는 이제 선택이 아닌 필수입니다. 모델의 성능이 상향 평준화될수록 사용자 경험을 결정짓는 것은 응답의 속도와 서비스의 안정성입니다. 모달 랩스가 3조 원에 육박하는 가치를 평가받는 것은 인공지능이 실험실을 벗어나 우리 일상의 모든 서비스에 스며들 준비가 되었음을 의미합니다.

마무리
모달 랩스의 가파른 기업 가치 상승은 인공지능 인프라 시장의 잠재력이 얼마나 거대한지 증명하고 있습니다. 25억 달러라는 숫자는 단순한 거품이 아니라 실제 기업들이 겪고 있는 비용과 기술적 난제를 해결해 주는 가치의 총합입니다. 인공지능 서비스를 준비하거나 운영 중인 개발자라면 인퍼런스 최적화가 가져올 변화에 주목해야 합니다. 이제는 기술을 만드는 것을 넘어 어떻게 효율적으로 전달할지를 고민할 때입니다.
이어서 보면 좋은 글
#ModalLabs #AI인퍼런스 #스타트업투자 #GeneralCatalyst #인프라최적화 #인공지능기술 #기업가치 #에릭베른하르드손 #GPU서버리스 #테크트렌드