Nova Delhi:
A razão pela qual você pode perguntar ao ChatGPT “como comer uma manga sem derrubá-la” e muito mais são as Unidades de Processamento Gráfico (GPUs) H100 e B200 da Nvidia. Esses chipsets mágicos que alimentam os chatbots de IA impulsionaram a Nvidia a se tornar a pioneira da indústria de hardware de IA, com capitalização de mercado atingindo a marca de 3 trilhões de dólares — mais do que a Microsoft e a Apple no mês passado.
Mas agora, uma startup relativamente jovem fundada por dois desistentes de Harvard colocou os olhos em sua fatia do bolo de hardware de IA. A Etched, a startup sediada na Califórnia, está procurando interromper o mercado de chipsets de IA com seu chip ASIC (Application Specific Integrated Circuits) transformador chamado Sohu.
A Sohu afirma ser 20 vezes mais rápida na execução de transformadores como ChatGPT do que o carro-chefe da Nvidia, o H100. O B200, que é a oferta mais poderosa da Nvidia do que o H100, é supostamente 10 vezes mais lento do que a Sohu, de acordo com as alegações feitas pela empresa com base em testes de emulação.
A Sohu está adotando uma abordagem totalmente diferente para fornecer alto poder computacional para executar bilhões de parâmetros (Variáveis que são usadas no treinamento de um Modelo de IA) para modelos de transformadores. Ao contrário das GPUs que podem fazer várias tarefas computacionalmente pesadas (como renderizar gráficos em tempo real), a Etched está escolhendo criar um chip especializado que atende apenas a modelos de IA de transformadores – aqueles que executam ChatGPT, Sora (modelo de IA de texto para vídeo da OpenAI) e Gemini do Google.
O que isso significa é que ele não pode executar outros modelos de IA como Redes Neurais Convolucionais (usadas para reconhecimento de imagem). Isso abre a possibilidade de explorar novos produtos de IA por desenvolvedores que até agora não eram possíveis devido à potência limitada em GPUs.
Por exemplo, o Sohu pode potencialmente levar a um tradutor em tempo real que pode ouvir e ler hindi, gujarati ou tâmil e responder em francês, inglês e alemão. Claro, essa tradução multimodal e multilíngue precisa de mais do que apenas o poder computacional, mas, em teoria, abre a possibilidade.
Outra aplicação multimodal de transformadores que o chipset pode explorar é a integração de áreas visuais e de linguagem. Isso significa essencialmente que tal modelo entenderá texto e imagens simultaneamente, abrindo a possibilidade de perguntas e respostas visuais – como uma entrevista.
Mas tudo isso continua sendo uma teoria. A Etched levantou 120 milhões de dólares em 25 de junho para torná-lo realidade, com um cronograma real quanto a um lançamento real do Sohu ASIC permanecendo indefinido.
Hoje anunciamos nossa arrecadação de fundos de US$ 120 milhões para trazer Sohu ao mundo. Obrigado @edludlow por nos hospedar! https://t.co/khzMPAofngfoto.twitter.com/Q4SeuUjP2h
— Gravado (@Etched) 26 de junho de 2024
A Etched afirmou que já tem “dezenas de milhões de dólares” em hardware reservado em pré-encomendas. A empresa também garantiu um acordo com a TSMC (Taiwan Semiconductor Manufacturing Company) para fabricar o chip de 4 nanômetros, prometendo que o acordo vai ajudar a “aumentar nosso primeiro ano de produção”.