Sociology

Flow는 동반 칩과 약간의 노력으로 모든 CPU의 성능을 100배로 향상시킬 수 있다고 주장합니다

핀란드 스타트업인 Flow Computing은 실리콘 엔지니어링에서 듣기 드문 주장 중 하나를 하고 있습니다. 자체 동반 칩을 추가함으로써, 어떤 CPU든 즉시 성능을 두 배로 높일 수 있으며 소프트웨어 조정을 통해 최대 100배까지 증가할 수 있습니다.

만약 이게 작동한다면, 이것은 AI 개발자들의 엄청난 계산 요구를 따라가는 데 도움이 될 수 있습니다.

Flow는 핀란드 국유 백신 연구 기관인 VTT의 분할 기업입니다. 물론 전략 검색 실에서 수행된 연구의 결과인 병합 처리 장치라고 불리는 칩 기술을 상표로 등록하고 있습니다. (VTT는 투자자이지만, 지적 재산은 Flow가 소유하고 있습니다).

Flow의 주장은, 솔직히 말하자면, 터무니없습니다. 아키텍처와 코드 베이스를 거쳐 CPU의 성능을 간단히 두 배로 높일 수는 없습니다. 만약 그렇다면, Intel 또는 AMD 또는 누가 몇 년 전에 수행했을 텐데요.

하지만 Flow는 사람들이 이론적으로 가능했던 것을 실제로 실행하고 있는 것입니다. CPU는 진공관과 펀치 카드의 초기 시대부터 상당한 발전을 이뤘지만, 근본적인 면에서 여전히 동일합니다. 그들의 주요 제한사항은 직렬 대신 병렬 프로세서로써, 동시에 한 가지 일만 할 수 있다는 것입니다. 물론, 그 일을 빌리언 번의 타임 스텝에서 여러 개의 코어와 경로를 통해 전환하지만, CPU의 단일 레인 성질을 수용하기 위한 방법입니다. (반면 GPU는 한 번에 많은 관련된 계산을 수행하지만 특정 작업에 특화되어 있습니다.)

"CPU는 컴퓨팅에서 가장 취약한 링크입니다,"라고 Flow의 공동 설립자 및 CEO인 Timo Valtonen은 말했습니다. "그 일에 적합하지 않으며, 이것은 변경해야 합니다."

CPU는 매우 빠르게 발전해 왔지만, 나노초 기준 응답 시간을 갖고 있더라도, 명령어를 수행하는 방법에 대한 방대한 낭비가 있습니다. 단순히 한 작업이 끝나야 다음 작업이 시작하는 기본 제한 때문에명령어 수행에 낭비가 발생합니다. (여기서 저는 칩 엔지니어가 아니므로 단순화한 것이고요.)

Flow의 주장하는 바는 CPU를 한 편의 거리에서 다중 차선 고속도로로 변환하여 이 제한사항을 해소했다는 것입니다. CPU는 여전히 한 번에 하나의 작업만 할 수 있지만, Flow의 PPU라고 불리는 칩은 사실상 나노초 스케일 교통 관리를 수행하여 이전에는 불가능했던 것보다 더 빨리 작업을 CPU로 이동하고 처리하는 작업을 수행합니다.

CPU를 요리사가 일하는 주방으로 생각해보세요. 요리사는 그만큼 빠르게 일할 수 있지만, 만약 그 사람이 요리사 일을 하는 도중에 나이프와 도구를 왕복하며 요리사 일이 아닌 모든 작업을 지우고 새로운 재료를 넣고 준비된 음식을 비워내면서 도와주는 초인간 조수가 있다면 어떨까요? 요리사는 여전히 두 손밖에 없지만, 이제 요리사는 10배 빠르게 일할 수 있습니다.

특정한 FPGA PPU-강화 칩의 성능 향상 대 Intel 칩의 비 간 에스컬레이션을 보여주는 로그 차트(참고). PPU 코어 수를 계속 증가시킴으로써 성능을 지속적으로 향상시킵니다.
이미지 출처: Flow Computing

이것은 완벽한 유사성은 아니지만, 이곳에서 무슨 일이 벌어지고 있는지에 대한 아이디어를 제공해줍니다. 적어도 Flow의 내부 테스트와 업계와의 데모에 따르면, 그들이 주장하는 대로입니다. PPU는 클럭 주파수를 증가시키지 않거나 시스템을 다른 방식으로 밀어내어 불필요한 열이나 전력을 생성하지 않습니다; 즉, 요리사에게 두 배로 빨리 다듬을 것을 요구하지 않습니다. 단지 이미 발생하고 있는 CPU 사이클을 더 효율적으로 사용할 뿐입니다.

Valtonen은 "고수준 학계에서 이것에 대해 연구하고 토론해 왔다"고 말했습니다. "이미 병렬화를 수행할 수는 있지만 기존 코드를 망치고 그후에 쓸모 없게 된다"고 말했습니다.

또한 아주유이씨 ZeroPoint가 다른 북유럽 컴퓨팅 회사에서 메모리 압축 레벨을 높이고 시스템의 나머지와의 데이터 투명성을 유지하면서 문제를 해결했습니다.

다시 말하면, Flow의 큰 성취는 고속 교통 관리가 아니라 어떤 CPU 또는 아키텍처의 어떤 코드도 수정하지 않고 이루어져 있다는 사실입니다. 임의의 코드가 칩과 통합하는 것을 넘어서지 않은 채로 어떤 칩에서도 무수한 코드를 두 배로 빨리 실행할 수 있다고 말하는 것은 난봉쇄같이 들립니다.

이것이 Flow의 비즈니스로서 성공의 주요 도전 과제입니다: 소프트웨어 제품과 달리 Flow의 기술은 칩 설계 수준에서 포함되어야 하므로 뒤늦게 작동하지 않으며, PPU가 탑재된 첫 번째 칩은 반드시 생산 라인을 많이 거처야합니다. Flow는 FPGA 기반 테스트 설치에서 기술이 작동함을 보여줬지만, 칩 제작업체들은 해당 이득을 보기 위해 상당한 자원을 투자해야 합니다.

플라우의 설립 팀, 왼쪽부터: Jussi Roivainen, Martti Forsell, Timo Valtonen.
이미지 출처: Flow Computing

이득의 규모와 CPU 개선이 최근 몇 년 동안 점진적이고 분수적이었던 사실을 고려하면, 그런 칩 제작업체들이 Flow의 문을 빨리 두드려 달라 할 수도 있습니다. 한 세대에 성능을 두 배로 높일 수 있다면, 이것은 당연한 선택이기 때문입니다.

코드를 재구성하고 다시 컴파일하여 PPU-CPU 콤보를 더 잘 활용할 수 있도록 소프트웨어를 최적화하면 성능이 계속해서 향상됩니다. Flow는 기술을 활용하려는 소프트웨어 제조업체들을 위해 이 작업을 더 간단하게 만들기 위한 재컴파일 도구를 제공하는 작업을 진행 중입니다.

Flow의 기술에 대해 간략하게 알려져 있는 Tirias Research의 분석가 Kevin Krewell은 이에 대한 외부 의견으로서 산업 시장 수용에 관해 더욱 걱정되고 있다고 지적했습니다.

그는, 매우 옳게, AI 가속은 현재 가장 큰 시장 중 하나로, 이것은 Nvidia의 인기 있는 H100과 같은 특별한 실리콘을 통해 목표화될 수 있습니다. PPU가 가속된 CPU는 전반적으로 이익을 가져올 수 있지만, 칩 제작업체들은 너무 과격하게 일을 돌려 놓기를 원할 수도 있습니다. 그리고 기업들은 주로 그 선택에 따라 오랜 시간 계획을 세운 다섯 년 동안 그 선택에 의해 뒤죽박죽될 수 있으므로, 그 회사들이 중요한 자원을 투자할 준비가 되어 있는지에 대한 문제도 단순합니다.

Flow의 기술이 모든 칩 제작업체에게 절대 필수적인 부품으로 성장해 번성할까요? 아니면 시장의 지속적으로 성장하는 컴퓨트 시장에서 임대료를 추출해서 계속 가져갈 것인지를 결정할 착한 칩 제작업체들이 선택할까요? 아마도 어딘가 사이가 적당하게 될 것입니다 - 그러나, 모든 스타트업들과 마찬가지로, 회사의 미래는 그것의 고객들에 달려 있습니다.

Flow는 이른바 은퇴 후 €4백만 (약 $4.3 백만)의 시드 펀딩으로부터 Butterfly Ventures가 주도하고 FOV Ventures, Sarsia, Stephen Industries, Superhero Capital 및 Business Finland에서 참여합니다.

Related Articles

Back to top button