Pesquisadores publicaram uma estrutura programável que supera um gargalo computacional fundamental de sistemas de inteligência artificial baseados em óptica. Em uma série de experimentos de classificação de imagens, eles usaram luz dispersa de um laser de baixa potência para executar cálculos precisos e escaláveis usando uma fração da energia da eletrônica.
À medida que os sistemas de inteligência artificial digital crescem em tamanho e impacto, também cresce a energia necessária para treiná-los e implantá-los – sem mencionar as emissões de carbono associadas. Pesquisas recentes sugerem que, se a produção atual de servidores de IA continuar no ritmo atual, seu consumo anual de energia pode ultrapassar o de um pequeno país até 2027. Redes neurais profundas, inspiradas na arquitetura do cérebro humano, são especialmente famintas por energia devido aos milhões ou até bilhões de conexões entre várias camadas de processadores semelhantes a neurônios.
Para neutralizar essa crescente demanda de energia, os pesquisadores dobraram os esforços para implementar sistemas de computação óptica, que existem experimentalmente desde a década de 1980. Esses sistemas dependem de fótons para processar dados e, embora a luz possa teoricamente ser usada para executar cálculos muito mais rápido e eficientemente do que elétrons, um desafio fundamental tem dificultado a capacidade dos sistemas ópticos de superar o estado da arte eletrônico.
Nosso método é até 1.000 vezes mais eficiente em termos de energia do que as redes digitais profundas de última geração, o que o torna uma plataforma promissora para a realização de redes neurais ópticas.
Demetri Psaltis, Laboratório de Óptica
“Para classificar dados em uma rede neural, cada nó, ou ‘neurônio’, deve tomar uma ‘decisão’ de disparar ou não com base em dados de entrada ponderados. Essa decisão leva ao que é conhecido como uma transformação não linear dos dados, o que significa que a saída não é diretamente proporcional à entrada”, diz Christophe Moser, chefe do Laboratório de Dispositivos Fotônicos Aplicados na Escola de Engenharia da EPFL.
Moser explica que, embora as redes neurais digitais possam facilmente realizar transformações não lineares com transistores, em sistemas ópticos, essa etapa requer lasers muito poderosos. Moser trabalhou com os alunos Mustafa Yildirim, Niyazi Ulas Dinc e Ilker Oguz, bem como com o chefe do Laboratório de Óptica, Demetri Psaltis, para desenvolver um método de eficiência energética para realizar essas computações não lineares opticamente. Sua nova abordagem envolve a codificação de dados, como os pixels de uma imagem, na modulação espacial de um feixe de laser de baixa potência. O feixe reflete sobre si mesmo várias vezes, levando a uma multiplicação não linear dos pixels.
“Nossos experimentos de classificação de imagens em três conjuntos de dados diferentes mostraram que nosso método é escalável e até 1.000 vezes mais eficiente em termos de energia do que as redes digitais profundas de última geração, tornando-o uma plataforma promissora para a realização de redes neurais ópticas”, diz Psaltis.
A pesquisa, apoiada por uma bolsa Sinergia da Fundação Nacional Suíça de Ciências, foi publicada recentemente em Fotônica da Natureza.
Uma solução estrutural simples
Na natureza, os fótons não interagem diretamente uns com os outros da maneira que os elétrons carregados o fazem. Para atingir transformações não lineares em sistemas ópticos, os cientistas tiveram, portanto, que “forçar” os fótons a interagir indiretamente, por exemplo, usando uma luz intensa o suficiente para modificar as propriedades ópticas do vidro ou outro material pelo qual ela passa.
Os cientistas contornaram essa necessidade de um laser de alta potência com uma solução elegantemente simples: eles codificaram os pixels de uma imagem espacialmente na superfície de um feixe de laser de baixa potência. Ao realizar essa codificação duas vezes, por meio do ajuste da trajetória do feixe no codificador, os pixels são multiplicados por si mesmos, ou seja, elevados ao quadrado. Como o quadrado é uma transformação não linear, essa modificação estrutural atinge a não linearidade essencial para cálculos de redes neurais, a uma fração do custo de energia. Essa codificação pode ser realizada duas, três ou até dez vezes, aumentando a não linearidade da transformação e a precisão do cálculo.
“Estimamos que, usando nosso sistema, a energia necessária para calcular opticamente uma multiplicação é oito ordens de magnitude menor do que a necessária para um sistema eletrônico”, diz Psaltis.
Moser e Psaltis enfatizam que a escalabilidade de sua abordagem de baixa energia é uma grande vantagem, pois o objetivo final seria usar sistemas híbridos eletrônicos-ópticos para mitigar o consumo de energia de redes neurais digitais. No entanto, mais pesquisas de engenharia são necessárias para atingir tal aumento de escala. Por exemplo, como os sistemas ópticos usam hardware diferente dos sistemas eletrônicos, um próximo passo no qual os pesquisadores já estão trabalhando é desenvolver um compilador para traduzir dados digitais em código que os sistemas ópticos podem usar.
Referências
Yildirim, M., Dinc, NU, Oguz, I., Psaltis, D., & Moser, C. (2023). Processamento não linear com óptica linear. arXiv pré-impressão arXiv:2307.08533.
Os pesquisadores observam que a não linearidade estrutural também foi relatada recentemente, usando um método de implementação diferente, por Cao et al na Universidade de Yale.