La couche de consensus Ethereum a connu des anomalies brèves pendant deux nuits consécutives, et l'auto-réparation du réseau met en évidence la résilience du PoS.

robot
Création du résumé en cours

Analyse des brèves anomalies d'Ethereum sur deux nuits consécutives

Les nuits des 11 et 12 mai, la couche de consensus d'Ethereum a connu de courtes anomalies. Les analyses montrent que cela est principalement dû à une surcharge de certains nœuds clients de la couche de consensus d'Ethereum, entraînant la mise hors ligne de nœuds validateurs. Cela a directement affecté le vote Epoch, qui n'a pas pu atteindre le seuil de 2/3, empêchant ainsi la couche de consensus de confirmer la finalité. Cependant, le réseau Ethereum s'est rétabli rapidement, ce qui témoigne de la résilience et de la capacité d'auto-réparation de l'algorithme de consensus PoS d'Ethereum.

Pourquoi Ethereum a-t-il connu des pannes brèves pendant deux nuits consécutives ? Analyse des causes de l'événement

Récapitulatif des événements

En général, l'état du réseau de consensus PoS d'Ethereum est finalisé en 2 Epochs. Cependant, la semaine dernière, il y a eu deux cas de retard dans la finalisation des Epochs :

  • 11 mai : le verrouillage de l'Epoch a été retardé de 3 Epochs, soit environ 20 minutes.
  • 12 mai : le décalage de l'Epoch a été retardé de 8 Epochs, soit environ 51 minutes.

Pendant cette période, le réseau Ethereum continue de produire des blocs et de traiter des transactions. Cependant, en raison d'un taux de vote insuffisant des nœuds validateurs, l'Epoch ne peut pas être finalisé, ce qui signifie qu'il n'est pas possible d'obtenir la garantie de sécurité au niveau de consensus du réseau PoS d'Ethereum. Cela signifie que dans des cas extrêmes, les transactions de cette epoch peuvent être annulées.

En réalité, durant cette période, le réseau Ethereum n'a pas connu de fork, et les nœuds validateurs n'ont pas voté de manière malveillante. Un grand nombre de nœuds validateurs hors ligne a entraîné un taux de vote insuffisant, ce qui est la cause directe de l'incapacité à finaliser l'Epoch. Il a été observé que les nœuds validateurs hors ligne présentaient des cas anormaux de surcharge CPU.

Lors du deuxième événement, un retard de confirmation de plus de 4 Epochs a déclenché le mécanisme de fuite d'inactivité de l'algorithme de consensus Ethereum :

  • Punir les nœuds de validateurs hors ligne en réduisant leurs fonds de mise, environ 28 ETH ont été confisqués.
  • Annulation des récompenses d'Attestation, environ 50 ETH non émis.
  • Ce mécanisme garantit que les validateurs en ligne peuvent finalement contrôler 2/3 des fonds de staking totaux d'Ethereum, permettant ainsi de finaliser l'état du réseau.

Pourquoi Ethereum a-t-il connu des pannes brèves pendant deux nuits consécutives ? Une analyse des causes de l'événement

Analyse des causes

La cause directe de cet événement est la surcharge de certaines nœuds clients de la couche de consensus d'Ethereum, entraînant l'interruption de fonctionnement des nœuds validateurs, qui ne peuvent pas participer normalement au vote de consensus. L'analyse spécifique est la suivante :

Lorsqu'un témoin pointant vers un ancien bloc est reçu, ( Attestation ), le nœud doit recalculer l'état de la chaîne de balises pour vérifier ces témoins, ce processus consomme beaucoup de ressources CPU et mémoire. Lorsqu'un grand nombre de témoins pointant vers d'anciens blocs sont reçus simultanément, les ressources CPU et mémoire du nœud sont épuisées, entraînant l'arrêt hors ligne de ces nœuds validateurs.

Théoriquement, ce type de problème peut être résolu par un cache basé sur les attestations pointant vers les blocs. Cependant, en raison de la croissance du nombre de validateurs et de l'apparition d'un grand nombre de telles attestations, le cache de l'implémentation du client problématique est compromis, forçant les nœuds à consommer de nombreuses ressources pour recalculer l'état de la chaîne de balises.

Les clients de couche de consensus Teku et Prysm ont publié des versions de correctif pour résoudre ce problème. Les clients de la version de correctif mettront en œuvre un filtrage de ces anciens témoins, c'est-à-dire qu'ils ignoreront ce témoin lorsque les conditions suivantes seront remplies :

  • Le témoin pointe vers un Slot obsolète
  • Un témoin pointe vers un Checkpoint jamais vu par un nœud

Pourquoi Ethereum a-t-il connu de courtes pannes durant deux nuits consécutives ? Analyse des causes de l'événement

Avantages de la conception d'Ethereum

Dans cet événement, Ethereum a maintenu sa disponibilité, continuant à produire des blocs et à traiter des transactions, ne retardant que la finalisation de l'Epoch. Cela est principalement dû à deux points :

  1. La diversité des clients Ethereum
  2. Conception de l'algorithme Gasper

La diversité des clients Ethereum

Bien que les clients Teku et Prysm aient rencontré des problèmes, cela n'affecte pas le bon fonctionnement des autres clients de la couche de consensus. Par exemple, le client Lighthouse n'est pas affecté cette fois-ci. En raison des différences de conception dans l'implémentation des différents clients, il y a toujours des nœuds validateurs qui fonctionnent normalement.

La diversité des clients Ethereum garantit que : même si certains clients rencontrent des problèmes ( et même entraînent une impossibilité de finaliser l'Epoch ), cela n'affectera pas la génération de blocs et le traitement des transactions par les clients normaux, assurant ainsi la disponibilité d'Ethereum.

Conception de la disponibilité de l'algorithme de consensus Gasper

Garantir la disponibilité d'Ethereum est l'un des points de départ de la conception de l'algorithme Gasper, qui sépare la production de blocs de la finalisation. Ainsi, même si la finalisation des blocs est entravée, la production de blocs ne s'arrête pas. Étant donné que dans la plupart des cas, la finalisation des blocs finira par se rétablir, l'impact réel sur les utilisateurs est très faible.

En revanche, d'autres algorithmes de consensus BFT arrêtent la production du prochain bloc lorsque la confirmation du bloc échoue, rendant la blockchain complètement inutilisable pendant cette période.

De plus, le deuxième événement a également déclenché le mécanisme de fuite d'inactivité, qui vise principalement à garantir qu'Ethereum puisse encore reconfirmer des blocs même dans des situations extrêmes où ( un grand nombre de validateurs sont hors ligne pendant une longue période ).

Pourquoi l'Ethereum a-t-il connu des pannes brèves pendant deux nuits consécutives ? Analyse des causes de l'événement

Expérience et enseignements

Les défis des multiples clients Ethereum

La diversité des clients Ethereum doit encore être promue et annoncée. Si les clients sont suffisamment variés pour que la part de Prysm et Teku soit inférieure à 1/3, alors cet événement ne se produira même pas (2/3 le fonctionnement normal des clients suffit à valider l'Epoch ).

De plus, lorsque l'implémentation d'un client présente des problèmes, la façon dont les nœuds validateurs peuvent passer en toute sécurité à une implémentation de client normale est également un problème à résoudre. Ce processus implique :

  • Migrer en toute sécurité la clé de validation du client problématique vers le client normal.
  • Assurez-vous que le comportement de l'ancien client et du nouveau client est cohérent, afin d'éviter des sanctions.

Surveillance du consensus Ethereum

Il est nécessaire d'avoir des services similaires à Safe Head pour surveiller en continu l'état en temps réel du réseau PoS d'Ethereum, afin de détecter et d'alerter à l'avance de tels événements, au lieu d'attendre que l'Epoch ne puisse pas être confirmé comme prévu pour découvrir que l'état du réseau est anormal.

La vulgarisation de l'algorithme de consensus d'Ethereum

Cet événement a mis en lumière la nécessité de vulgariser le mécanisme de consensus PoS d'Ethereum. De nombreux utilisateurs ont cru à tort que "Ethereum était en panne", provoquant une panique inutile. En réalité, le réseau Ethereum continue de produire des blocs et de traiter des transactions. La vulgarisation des connaissances sur la blockchain à destination des utilisateurs reste un domaine dans lequel les professionnels doivent continuer à travailler.

sur les applications Ethereum

Bien que le réseau Ethereum soit suffisamment robuste, une instabilité occasionnelle peut avoir un certain impact sur les applications. Les applications doivent gérer correctement ces scénarios d'instabilité :

  • Le temps de dépôt de Layer1 à Layer2 peut s'allonger.
  • Le temps de recharge de l'échange peut être prolongé
  • Le risque de rollback existe pour les prix des Oracles sur la chaîne, les services de haute valeur qui en dépendent devraient être temporairement suspendus.
  • Certaines applications DeFi peuvent nécessiter la suspension de certaines fonctionnalités

Résumé

Cet événement a démontré la résilience et la capacité d'auto-réparation de l'algorithme de consensus PoS d'Ethereum, ainsi que la réactivité rapide et la capacité de correction des erreurs des équipes de clients. Pour l'écosystème Ethereum, il est nécessaire de continuer à investir dans les domaines suivants : augmenter la diversité des clients, optimiser la surveillance en temps réel et l'alerte de l'état du réseau, approfondir l'éducation des utilisateurs et améliorer les plans d'urgence des participants de l'écosystème en cas d'anomalies du réseau.

Pourquoi Ethereum a-t-il connu des pannes temporaires au cours de deux nuits consécutives ? Analyse des causes de l'événement

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 5
  • Partager
Commentaire
0/400
WalletsWatchervip
· 07-05 23:56
Tu ne sais vraiment pas, le pos est en fait très fragile.
Voir l'originalRépondre0
BearMarketHustlervip
· 07-05 02:07
C'est quoi ce petit problème ? Bitcoin a déjà été suspendu, après tout~
Voir l'originalRépondre0
WalletDetectivevip
· 07-03 02:22
eth grand frère est tellement bull qu'il n'a pas peur de s'effondrer
Voir l'originalRépondre0
WenMoonvip
· 07-03 02:19
pos n'est-il pas bon de faire frémir le Consensus
Voir l'originalRépondre0
ContractCollectorvip
· 07-03 02:10
Consensus anormal pendant 20 minutes, je vais mourir, je vais mourir.
Voir l'originalRépondre0
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)