AI를 쓰려면 반드시 인터넷이 필요할까? 아마존, 구글, 마이크로소프트의 데이터센터를 거쳐야만 할까? 캘리포니아공과대학(Caltech) 연구자들이 창업한 스타트업 PrismML이 2026년 4월 3일 스텔스 모드를 해제하며 내놓은 답은 "아니다"다. 그것도 1,625만 달러 시드 라운드와 함께, 아이폰 위에서 돌아가는 8B 파라미터 모델을 손에 들고.

Bonsai 8B: 숫자가 말하는 혁명

PrismML의 Bonsai 8B는 기존 8B 파라미터 모델과 같은 규모지만, 작동 방식이 근본적으로 다르다. 일반 LLM이 각 가중치를 16비트 혹은 32비트 부동소수점으로 저장하는 것과 달리, Bonsai는 각 가중치를 단 1비트(-1 또는 +1)로 표현한다. 여기에 그룹별 공유 스케일 팩터만 추가된다. 결과는 놀랍다: 모델 크기 1.15GB(기존 대비 14분의 1), 추론 속도 8배 향상, 에너지 효율 5배 향상, 그리고 동급 모델 대비 경쟁력 있는 성능.

Bonsai 8B는 오늘 바로 맥북, 아이폰, 아이패드에서 MLX를 통해 네이티브로 실행되며, Nvidia GPU에서는 llama.cpp CUDA로 돌아간다. 라이선스는 Apache 2.0 , 상업적 이용도 완전히 자유롭다. 소형 버전인 Bonsai 4B와 Bonsai 1.7B도 함께 공개됐다. 창업 배경은 Caltech 전기공학과 교수 Babak Hassibi와 동료들의 신호 처리 연구에서 출발했으며, PrismML은 이 학술 연구를 최초의 상업적으로 실행 가능한 1비트 LLM으로 구현했다.

온디바이스 AI가 바꾸는 것들: 단순한 편의가 아니다

클라우드 AI의 구조적 취약점은 세 가지다. 첫째, 개인정보: 당신이 입력한 모든 텍스트가 서버를 거친다. 둘째, 지연시간(latency): 아무리 빠른 모델도 네트워크 왕복 시간이 존재한다. 셋째, 비용: API 호출은 토큰당 과금된다. Bonsai처럼 디바이스에서 직접 실행되는 모델은 이 세 가지를 모두 제거한다. 의료 기기, 자율주행, 군사 시스템, 산업 IoT , 인터넷 연결이 없거나 허용되지 않는 환경에서 AI가 작동해야 하는 모든 분야에서 온디바이스 모델은 클라우드 모델이 원천적으로 진입할 수 없는 영역을 점령한다.

숨은 인사이트: 빅테크의 AI 수익 모델을 위협하는 1비트

현재 AI 산업의 수익 구조를 지탱하는 가장 큰 기둥 하나는 API 과금이다. GPT-4o를 쓰려면 OpenAI에 돈을 내야 하고, Gemini를 쓰려면 Google에 돈을 내야 하고, Claude를 쓰려면 Anthropic에 돈을 내야 한다. 이 구조는 모델이 클라우드에만 있기 때문에 유지된다. 오픈소스 모델(LLaMA, Mistral 등)이 이 구조를 흔들기 시작했지만, 여전히 수십 GB의 VRAM이 필요했다. 1.15GB에 아이폰에서 돌아가는 Bonsai 8B는 그 마지막 장벽마저 허문다.

아이러니하게도 Apple이 가장 긴장해야 할 수 있다. Apple Intelligence의 핵심 가치는 온디바이스 AI로 개인정보를 보호한다는 것인데, PrismML의 완전 오픈소스 모델이 그 포지셔닝을 잠식한다. Apple은 독점 하드웨어와 생태계를 통해 온디바이스 AI를 통제하려 하지만, Apache 2.0 라이선스는 누구도 그 AI를 통제할 수 없게 만든다. 모델이 오픈소스이고, 디바이스가 누구의 것이든 돌아간다면 , AI의 민주화는 비로소 기술적 수사가 아니라 현실이 된다.

모든 AI가 클라우드에 산다면 클라우드를 소유한 자가 AI를 소유한다 , 1비트 혁명은 이 등식을 깨는 첫 번째 균열이다.


핵심 요약

  • 1.15GB에 8B 파라미터 , 기존 동급 모델 대비 14분의 1 크기, PrismML Bonsai 8B
  • 8배 빠른 추론, 5배 낮은 전력 , 에지 하드웨어 기준 성능 격차
  • Apache 2.0 완전 오픈소스 , 상업적 이용 무제한, 아이폰·맥·Nvidia GPU 즉시 실행 가능
  • $1,625만 시드 라운드 , Caltech 기반 스타트업, 창업 직후 자금 조달 완료
  • 1비트 가중치 아키텍처 , 각 가중치를 -1/+1로만 표현, 그룹별 스케일 팩터 공유

더 생각해볼 것들

  1. 온디바이스 AI가 보편화되면 OpenAI·Anthropic·Google의 API 수익 모델은 어떻게 재편될까? 클라우드 AI와 온디바이스 AI 사이에서 살아남는 비즈니스 모델은?
  2. 1비트 LLM이 스마트폰에 보편화되면 인터넷 없이 작동하는 AI 에이전트가 등장한다. 이것이 개인정보 보호에 미치는 영향은 기회인가 위협인가?
  3. 당신의 회사 또는 서비스에서 클라우드 AI를 온디바이스 AI로 교체한다면 어떤 새로운 가능성이 열리는가?