L'importance du réseau à l'ère de l'IA et les directions d'innovation
Le réseau est devenu un maillon clé à l'ère des grands modèles d'IA. Avec la croissance rapide de la taille des modèles, les clusters de serveurs multiples sont devenus la solution principale pour résoudre les problèmes d'entraînement, ce qui constitue également la base de la montée en puissance du réseau à l'ère de l'IA. Contrairement au simple transfert de données dans le passé, le réseau est désormais davantage utilisé pour synchroniser les paramètres des modèles entre les cartes graphiques, ce qui impose des exigences plus élevées en matière de densité et de capacité du réseau.
La demande réseau provient principalement de trois aspects :
La taille des modèles devient de plus en plus importante. Le temps d'entraînement est proportionnel au nombre de paramètres du modèle et inversement proportionnel à la vitesse de calcul. Pour réduire le temps d'entraînement, il est nécessaire d'élargir le nombre de dispositifs via le réseau et d'améliorer l'efficacité du parallélisme multi-dispositifs.
Complexes communications pour la synchronisation multi-cartes. Une fois que le modèle est divisé en une seule carte, chaque calcul nécessite un alignement, ce qui impose des exigences plus élevées en matière de transmission et d'échange de réseau.
Coûts de défaillance de plus en plus élevés. L'entraînement de grands modèles dure souvent des mois, et des interruptions peuvent entraîner des pertes de temps et de coûts importantes. Les réseaux d'IA modernes sont devenus le fruit des capacités d'ingénierie des systèmes humains comparables à celles des avions, des porte-avions, etc.
L'innovation réseau futur sera axée sur trois directions : "réduction des coûts", "ouverture" et équilibre de l'échelle de calcul.
Changement des supports de communication : Les modules optiques visent des vitesses plus élevées tout en explorant des voies de réduction des coûts telles que LPO, LRO et la photonique sur silicium. Les câbles en cuivre occupent la connexion en rack grâce à leur rapport coût-efficacité. De nouvelles technologies semi-conductrices comme Chiplet et Wafer-scaling accélèrent l'exploration des limites de l'interconnexion basée sur le silicium.
Concurrence des protocoles réseau : protocoles de communication entre puces étroitement liés aux cartes graphiques, tels que NV-LINK, Infinity Fabric, etc. La communication entre nœuds se concentre principalement sur la concurrence entre les deux grands protocoles IB et Ethernet.
Changement de l'architecture réseau : Actuellement, l'architecture en leaf-spine est couramment adoptée, mais avec l'augmentation de l'échelle des clusters, de nouvelles architectures comme Dragonfly et rail-only devraient devenir la direction d'évolution des super grands clusters.
Conseils d'investissement à suivre :
Éléments clés du système de communication : Zhongji Xuchuang, Newyi Sheng, Tianfu Communication, Industrie Fulin, Yinvike, Hu Dian Co.
Innovation dans le système de communication : Yangtze Optical Fibre and Cable Joint Stock Limited Company, Taiyuan Manganese Steel Group, Yuanjie Technology, Shengke Communication-U, Cambrian, Dekoli.
Avertissement de risque : la demande d'IA est inférieure aux attentes, la loi de mise à l'échelle échoue, la concurrence dans le secteur s'intensifie.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
9 J'aime
Récompense
9
6
Partager
Commentaire
0/400
OffchainOracle
· 07-17 01:44
La guerre de puissance de calcul ne fait que commencer~
Voir l'originalRépondre0
CryptoSurvivor
· 07-14 21:49
Encore une vague de prise des gens pour des idiots a commencé.
Voir l'originalRépondre0
HalfIsEmpty
· 07-14 02:14
Ne fais pas tant de concepts, c'est juste une activité qui brûle de l'argent.
Voir l'originalRépondre0
FundingMartyr
· 07-14 02:08
Puissance de calcul拼到头还不是看带宽
Voir l'originalRépondre0
PessimisticOracle
· 07-14 02:01
Qui paie vraiment pour le déploiement de l'image 1 ?
Innovation numérique à l'ère de l'IA : réduction des coûts, ouverture et équilibre de la puissance de calcul deviennent essentiels
L'importance du réseau à l'ère de l'IA et les directions d'innovation
Le réseau est devenu un maillon clé à l'ère des grands modèles d'IA. Avec la croissance rapide de la taille des modèles, les clusters de serveurs multiples sont devenus la solution principale pour résoudre les problèmes d'entraînement, ce qui constitue également la base de la montée en puissance du réseau à l'ère de l'IA. Contrairement au simple transfert de données dans le passé, le réseau est désormais davantage utilisé pour synchroniser les paramètres des modèles entre les cartes graphiques, ce qui impose des exigences plus élevées en matière de densité et de capacité du réseau.
La demande réseau provient principalement de trois aspects :
La taille des modèles devient de plus en plus importante. Le temps d'entraînement est proportionnel au nombre de paramètres du modèle et inversement proportionnel à la vitesse de calcul. Pour réduire le temps d'entraînement, il est nécessaire d'élargir le nombre de dispositifs via le réseau et d'améliorer l'efficacité du parallélisme multi-dispositifs.
Complexes communications pour la synchronisation multi-cartes. Une fois que le modèle est divisé en une seule carte, chaque calcul nécessite un alignement, ce qui impose des exigences plus élevées en matière de transmission et d'échange de réseau.
Coûts de défaillance de plus en plus élevés. L'entraînement de grands modèles dure souvent des mois, et des interruptions peuvent entraîner des pertes de temps et de coûts importantes. Les réseaux d'IA modernes sont devenus le fruit des capacités d'ingénierie des systèmes humains comparables à celles des avions, des porte-avions, etc.
L'innovation réseau futur sera axée sur trois directions : "réduction des coûts", "ouverture" et équilibre de l'échelle de calcul.
Changement des supports de communication : Les modules optiques visent des vitesses plus élevées tout en explorant des voies de réduction des coûts telles que LPO, LRO et la photonique sur silicium. Les câbles en cuivre occupent la connexion en rack grâce à leur rapport coût-efficacité. De nouvelles technologies semi-conductrices comme Chiplet et Wafer-scaling accélèrent l'exploration des limites de l'interconnexion basée sur le silicium.
Concurrence des protocoles réseau : protocoles de communication entre puces étroitement liés aux cartes graphiques, tels que NV-LINK, Infinity Fabric, etc. La communication entre nœuds se concentre principalement sur la concurrence entre les deux grands protocoles IB et Ethernet.
Changement de l'architecture réseau : Actuellement, l'architecture en leaf-spine est couramment adoptée, mais avec l'augmentation de l'échelle des clusters, de nouvelles architectures comme Dragonfly et rail-only devraient devenir la direction d'évolution des super grands clusters.
Conseils d'investissement à suivre :
Éléments clés du système de communication : Zhongji Xuchuang, Newyi Sheng, Tianfu Communication, Industrie Fulin, Yinvike, Hu Dian Co.
Innovation dans le système de communication : Yangtze Optical Fibre and Cable Joint Stock Limited Company, Taiyuan Manganese Steel Group, Yuanjie Technology, Shengke Communication-U, Cambrian, Dekoli.
Avertissement de risque : la demande d'IA est inférieure aux attentes, la loi de mise à l'échelle échoue, la concurrence dans le secteur s'intensifie.