Inovação na rede na era da IA: uma atualização abrangente desde os meios de comunicação até os clusters de centros de dados

robot
Geração do resumo em andamento

A importância da rede na era da IA e direções de inovação

A chegada da era dos grandes modelos tornou a rede uma peça chave no campo da IA. À medida que a diferença entre a escala dos modelos e o limite de capacidade de uma única placa gráfica aumenta, os clusters de múltiplos servidores tornaram-se a principal maneira de resolver o treinamento de modelos, o que também é a base para a elevação do status da rede na era da IA. Em comparação com o passado, quando era usada principalmente para transmitir dados, hoje a rede é mais utilizada para sincronizar os parâmetros dos modelos entre as placas gráficas, o que impõe exigências mais altas em termos de densidade e capacidade da rede.

A demanda da rede provém principalmente de três aspectos:

  1. O volume crescente dos modelos resulta em um aumento do tempo de treinamento, sendo necessário aumentar a eficiência computacional para reduzir esse tempo. Como o aumento da capacidade computacional em um único dispositivo é limitado, é preciso aumentar o número de dispositivos e a eficiência paralela para melhorar a capacidade computacional geral.

  2. Comunicação complexa de sincronização de múltiplas placas. Durante o treinamento de grandes modelos, é necessário alinhar entre placas únicas após cada cálculo, o que exige maiores requisitos para a transmissão e troca de rede.

  3. O custo de falhas é elevado. O treinamento de grandes modelos leva meses, e uma interrupção pode causar enormes perdas. Qualquer falha em qualquer parte da rede pode levar a uma interrupção, por isso a exigência de estabilidade da rede é extremamente alta.

Face a essas necessidades, a inovação na rede concentra-se principalmente nas seguintes direções:

  1. Mudança de meios de comunicação. A luz, o cobre e o silício têm suas vantagens e estão competindo em diferentes cenários. Os módulos ópticos, enquanto buscam altas taxas de velocidade, também estão reduzindo custos por meio de LPO, silício fotônico, entre outros. Os cabos de cobre dominam dentro do armário devido à sua vantagem de custo-benefício. Novas tecnologias, como Chiplet e Wafer-scaling, estão explorando os limites da interconexão baseada em silício.

  2. Competição de protocolos de rede. O protocolo de comunicação dentro do nó está fortemente vinculado a GPUs, como NVLINK, Infinity Fabric, etc. A competição entre nós é principalmente entre IB e Ethernet.

  3. Mudanças na arquitetura da rede. A arquitetura de leaf-spine predominante atualmente mostra limitações em super grandes clusters, e novas arquiteturas como Dragonfly e Rail-only têm potencial para se tornarem a direção evolutiva da próxima geração de super grandes clusters.

  4. Inovação em switches. Os switches ópticos estão a receber cada vez mais atenção devido a vantagens como baixa latência e baixo consumo de energia. Os switches elétricos, por sua vez, continuam a inovar a nível de chip.

  5. Inovação em clusters de centros de dados. Com a capacidade de um único centro de dados a aproximar-se do limite, como realizar uma interconexão eficiente entre centros de dados tornou-se uma nova direção de pesquisa.

No geral, a inovação na rede na era da IA está evoluindo continuamente em três direções: redução de custos, abertura e escalabilidade. Os sistemas de comunicação, como um projeto de sistema complexo, precisam inovar continuamente em diferentes etapas. Os investidores devem prestar atenção aos fornecedores de componentes essenciais e também acompanhar as oportunidades de mercado trazidas pelas novas tecnologias.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 3
  • Compartilhar
Comentário
0/400
MemecoinTradervip
· 07-08 04:56
sinais em alta na infraestrutura da rede... hora de carregar em tokens $DATA fr fr
Ver originalResponder0
GateUser-cff9c776vip
· 07-07 05:19
Otimização total, perdas adequadas, será que isso é a redução de custos e aumento de eficiência na era digital?
Ver originalResponder0
DaoTherapyvip
· 07-07 05:18
A nova era chegou à velocidade da internet.
Ver originalResponder0
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)