Sociology

Etched는 하나의 모델만 실행하는 AI 칩을 만들고 있습니다

생성적 AI가 점점 더 많은 산업에 영향을 미치는 가운데 모델을 실행하는 칩을 생산하는 기업들은 큰 혜택을 누리고 있습니다. 특히 70% ~ 95%의 시장을 지배하고 있는 Nvidia는 거대한 영향력을 행사하고 있습니다. Meta부터 Microsoft까지의 클라우드 제공업체들은 생성적 AI에서 뒤처지지 않기 위해 Nvidia GPU에 수십억 달러를 투자하고 있습니다.

생성적 AI 공급업체들은 자신들의 성공의 상당 부분이 주도적인 칩 생산업체들의 변덕에 달려 있다는 이유로 현 상황에 만족하지 못하고 있습니다. 그래서, 기회주의 VC들과 함께 AI 칩 기존업체들에 도전할 유망한 신생 기업을 찾기 위해 노력하고 있습니다.

Etched는 테이블에 자리를 확보하기 위해 경쟁하는 많은 대체 칩 기업 중 하나입니다. 하지만 그 중에서도 가장 흥미로운 기업중 하나입니다. 2년 된 Etched는 하버드 탈퇴자인 Gavin Uberti (ex-OctoML, ex-Xnor.ai)와 Chris Zhu, Robert Wachen, 이전 Cypress Semiconductor CTO Mark Ross 등이 설립하였으며 단 하나의 일만 할 수 있는 칩을 만들기로 했습니다.

이것은 일반적이지 않습니다. 다양한 스타트업들과 기술 거물들이 오로지 AI 모델을 실행하는 칩, 즉 추론 칩으로 알려진 칩을 개발 중이거나 개발해왔습니다. Meta는 MTIA, Amazon은 Graviton 및 Inferentia와 같은 칩을 보유하고 있습니다. 그러나 Etched의 칩은 오로지 하나의 모델만 실행할 수 있는 독특한 특징을 가지고 있습니다: 트랜스포머.

트랜스포머는 2017년 구글 연구팀이 제안한 것으로, 지금은 훨씬 우세한 생성적 AI 모델 구조가 되었습니다.

트랜스포머는 OpenAI의 비디오 생성 모델 Sora의 기초를 이루고 있습니다. 이들은 Anthropic의 Claude 및 Google의 Gemini와 같은 텍스트 생성 모델의 핵심입니다. 그리고 Stable Diffusion의 최신 버전과 같은 아트 생성기를 구동합니다.

“2022년, 우리는 트랜스포머가 세상을 지배할 것이라고 판단했습니다,” Etched의 CEO인 Uberti는 TechCrunch와의 인터뷰에서 말했습니다. “우리는 전문화된 일반 GPU보다 더 좋은 성능을 발휘할 수 있는 특수 칩이 불가피하다고 판단하였으며, 기술적 의사결정자들도 이를 알고 있습니다."

Etched의 Sohu라는 칩은 특정 애플리케이션, 즉 트랜스포머 실행에 특화된 ASIC (application-specific integrated circuit)입니다. TSMC의 4nm 공정을 사용하여 제조된 Sohu는 Uberti에 따르면 GPU 및 기타 일반 목적 AI 칩보다 훨씬 더 효율적인 성능을 제공하면서 에너지 소비를 줄일 수 있습니다.

“Sohu는 텍스트, 이미지 및 비디오 트랜스포머를 실행할 때 심지어 Nvidia의 다음 세대인 Blackwell GB200 GPU보다 한 차원 빠르고 저렴합니다,” Uberti는 말했습니다. “한 대의 Sohu 서버가 160대의 H100 GPU를 대체합니다... Sohu는 전문 칩이 필요한 비즈니스 리더들에게 더 저렴하고 효율적이며 환경 친화적인 옵션입니다.”

그렇다면 Sohu가 이 모든 것을 어떻게 이룩할 수 있을까요? 몇 가지 방법이 있지만 그 중에서도 가장 명백하고 직관적인 것은 간소화된 추론 하드웨어 및 소프트웨어 파이프라인입니다. Sohu는 트랜스포머 이외의 모델을 실행하지 않기 때문에, Etched 팀은 트랜스포머와 관련 없는 하드웨어 구성 요소를 제거하고, 일반적으로 사용되는 소프트웨어 오버헤드를 제거할 수 있었습니다.

Etched가 Meta의 오픈 모델 Llama 70B를 실행하는 하드웨어 성능을 비교한 그래프.
이미지 제공: Etched

Etched는 생성적 AI 인프라 경쟁의 전환점에 나타납니다. 비용 이슈를 넘어서, 오늘날 모델을 대규모로 실행하기 위해 필요한 GPU 및 기타 하드웨어 구성 요소는 위험하게 에너지를 많이 소모합니다.

골드만 삭스는 2030년까지 AI가 데이터 센터의 전기 수요를 160% 증가시킬 것으로 예측하며, 이는 큰 폭의 온실 가스 배출량 증가로 이어질 것입니다. 한편 UC 리버사이드의 연구원들은 글로벌 AI 사용이 2027년까지 데이터 센터가 1조~1.7조 갤런의 신선한 물을 빨아들 일 수 있다고 추정하며, 이는 지역 자원에 영향을 미칠 것입니다. (많은 데이터 센터가 서버를 냉각하기 위해 물을 사용합니다.)

Uberti는 낙관적으로 - 또는 폭발적인, 어떻게 해석할지에 따라 - Sohu를 산업의 소비 문제에 대한 해결책으로 제시합니다.

“요컨대, 우리의 미래 고객들은 Sohu로 전환하지 않을 수 없을 것입니다,” Uberti는 말했습니다. “기업들은 자신들이 구축하려는 AI 제품에 필수적인 속도와 비용 때문에 Etched에 베팅할 준비가 되어 있습니다.”

그러나 Etched는 - 회사가 몇 달 내에 Sohu를 대량 시장에 내놓는 목표를 달성할 경우 - 이와 같은 많은 기업이 뒤를 쫓는 가운데 성공할 수 있을까요?

현재 Etched는 직접적인 경쟁 업체가 없지만, AI 칩 스타트업 Perceive는 최근 트랜스포머에 대한 하드웨어 가속을 갖춘 프로세서를 미리 보여 주었습니다. Groq는 또한 자사의 ASIC에 대한 트랜스포머 특수 최적화에 많은 투자를 하고 있습니다.

경쟁은 물론, 만약 언젠가 트랜스포머가 인기를 잃는다면 어떻게 할까요? Uberti는 그 경우 당연히 새로운 칩을 디자인할 것이라고 말했습니다. 충분히 합리적인 판단입니다. 그러나 이는 Sohu를 구현하는 데 얼마나 많은 시간이 걸렸는지 고려하면 상당히 극단적인 대처 방안입니다.

이러한 우려들로도 투자자들은 Etched에 거액의 자금을 투입하고 있습니다.

오늘, Etched는 Primary Venture Partners와 Positive Sum Ventures가 공동 주도한 1억 2천만 달러의 시리즈 A 펀딩 라운드를 마감했다고 발표했습니다. Etched의 총 자금 조달액을 1억 2천 5천 3백 60만 달러로 높인이 라운드에는 Peter Thiel (Uberti, Zhu 및 Wachen은 Thiel Fellowship 출신), GitHub CEO Thomas Dohmke, Cruise (및 Bot Company) 공동 창업자인 Kyle Vogt 및 Quora 공동 창업자인 Charlie Cheever와 같은 중요한 엔젤 투자자들이 참여했습니다.

이 투자자들은 아마도 Etched가 서버를 판매하는 사업을 성공적으로 확장할 수 있는 합리적인 가능성을 가지고 있다고 믿고 있을 것입니다. 그리고 아마 그럴 수도 있습니다 - Uberti는 아직 이름이 밝혀지지 않은 고객들이 현재까지 수십억 달러의 하드웨어를 예약했다고 말했습니다. 곧 시작될 Sohu Developer Cloud의 출시는 고객들이 온라인 대화식 플레이그라운드를 통해 Sohu를 미리 보도록 해줄 것이라고 Uberti는 시사했습니다.

그래도 Etched와 35인의 팀을 기업의 창시자들이 상상하는 미래로 나아갈만큼 충분한 것이 될지는 아직 이른 것 같습니다. 생성적 AI 칩 세그먼트는 언제나 용서할 수 없을 수 있습니다. - AI 칩 스타트업들의 높은 실패 예과 AI 칩 벤처 자금이 2023년에 급락한 사례를 보라.

Uberti는 강력한 세일즈 포인트를 제공합니다 - “비디오 생성, 오디오 모달리티부터 로봇 공학 등 미래 AI 사용 사례는 Sohu와 같은 빠른 칩 없이는 불가능할 것입니다. 인프라가 확장될 수 있느냐에 따라 AI 기술 전반의 미래가 결정될 것입니다.”

Related Articles

Back to top button