Fusion de l'IA et du Web3 : Ouverture d'une nouvelle ère de données, de puissance de calcul et de dynamique d'innovation

AI+Web3 : Tours et places

TL;DR

  1. Les projets Web3 basés sur l'IA deviennent des cibles attractives sur les marchés primaire et secondaire.

  2. Les opportunités de Web3 dans l'industrie de l'IA se manifestent par : l'utilisation d'incitations distribuées pour coordonner les fournisseurs potentiels dans la longue traîne ------ à travers les données, le stockage et le calcul ; en même temps, établir un modèle open source ainsi qu'un marché décentralisé pour les agents d'IA.

  3. L'IA trouve principalement son utilité dans l'industrie Web3 pour la finance sur blockchain (paiements cryptographiques, transactions, analyse de données) et pour aider au développement.

  4. L'utilité de l'AI+Web3 réside dans la complémentarité des deux : Web3 est censé lutter contre la centralisation de l'AI, tandis que l'AI devrait aider Web3 à élargir son audience.

AI+Web3 : Tours et places

Introduction

Au cours des deux dernières années, le développement de l'IA a semblé être mis sur "accélérer", cet effet papillon provoqué par Chatgpt a non seulement ouvert un nouveau monde à l'intelligence artificielle générative, mais a également déclenché une vague dans le Web3.

Avec le soutien du concept d'IA, le financement du marché des cryptomonnaies, qui ralentit, a clairement été stimulé. Selon les statistiques des médias, au cours du premier semestre 2024, 64 projets Web3+IA ont achevé leur financement, et le système d'exploitation basé sur l'intelligence artificielle Zyber365 a atteint un montant de financement record de 100 millions de dollars lors de sa série A.

Le marché secondaire est plus florissant, les données des sites d'agrégation de cryptomonnaies montrent qu'en un peu plus d'un an, la capitalisation totale du secteur de l'IA a atteint 48,5 milliards de dollars, avec un volume de transactions de près de 8,6 milliards de dollars en 24 heures ; les avancées des technologies d'IA ont clairement apporté des avantages, après la publication du modèle Sora de conversion de texte en vidéo d'une certaine entreprise, le prix moyen du secteur de l'IA a augmenté de 151 % ; l'effet de l'IA s'est également étendu à l'un des secteurs attirant des capitaux en cryptomonnaie, Meme : le premier concept de MemeCoin d'Agent AI ------ GOAT a rapidement gagné en popularité et a atteint une valorisation de 1,4 milliard de dollars, suscitant un véritable engouement pour les Memes d'IA.

La recherche et les sujets concernant AI+Web3 sont également très en vogue, passant de AI+Depin à AI Memecoin, puis aux actuels AI Agent et AI DAO. L'émotion FOMO ne parvient déjà plus à suivre la vitesse de rotation des nouveaux récits.

AI+Web3, cette combinaison de termes remplie d'argent chaud, de tendances et de fantasmes futurs, est inévitablement perçue comme un mariage arrangé orchestré par le capital. Il semble difficile de distinguer sous ce manteau flamboyant, si c'est le terrain des spéculateurs ou la veille de l'explosion de l'aube ?

Pour répondre à cette question, une réflexion clé pour les deux parties est : est-ce que cela s'améliorera avec l'autre ? Pouvons-nous bénéficier du modèle de l'autre ? Dans cet article, nous essayons également de nous appuyer sur les travaux des pionniers pour examiner ce schéma : comment le Web3 peut-il jouer un rôle à chaque étape de la pile technologique de l'IA, et qu'est-ce que l'IA peut apporter de nouveau au Web3 ?

Partie.1 Quelles opportunités pour Web3 sous la pile AI ?

Avant d'aborder ce sujet, nous devons comprendre la pile technologique des grands modèles d'IA :

Exprimer l'ensemble du processus dans un langage plus simple : le « grand modèle » est comme le cerveau humain. Dans les premières étapes, ce cerveau appartient à un bébé qui vient de naître, et il a besoin d'observer et d'absorber une quantité massive d'informations provenant de son environnement pour comprendre le monde. C'est la phase de « collecte » des données. Étant donné que les ordinateurs n'ont pas les sens visuels, auditifs et autres des humains, avant l'entraînement, les grandes quantités d'informations non étiquetées provenant de l'extérieur doivent être converties par « prétraitement » en un format d'information compréhensible et utilisable par l'ordinateur.

Après avoir entré les données, l'IA a construit un modèle capable de compréhension et de prédiction grâce à l'« entraînement », ce qui peut être considéré comme le processus par lequel un bébé comprend et apprend progressivement le monde extérieur. Les paramètres du modèle sont comme les capacités linguistiques d'un bébé qui s'ajustent continuellement au cours de son apprentissage. Lorsque le contenu appris commence à se spécialiser, ou lorsque des échanges avec d'autres personnes fournissent des retours d'information et des corrections, on entre dans la phase de « réglage fin » du grand modèle.

Lorsque les enfants grandissent et apprennent à parler, ils peuvent comprendre le sens et exprimer leurs sentiments et leurs pensées dans de nouvelles conversations. Cette phase est similaire au « raisonnement » des grands modèles d'IA, où le modèle peut prédire et analyser de nouvelles entrées de langage et de texte. Les bébés expriment leurs sentiments, décrivent des objets et résolvent divers problèmes grâce à leurs capacités linguistiques, ce qui est également similaire à l'application des grands modèles d'IA dans la phase de raisonnement pour diverses tâches spécifiques après avoir été formés et mis en service, comme la classification d'images et la reconnaissance vocale.

L'Agent IA est en train de devenir la prochaine forme de grand modèle ------ capable d'exécuter des tâches de manière autonome et de poursuivre des objectifs complexes, non seulement doté de capacités de réflexion, mais aussi capable de mémoriser, de planifier, et d'interagir avec le monde en utilisant des outils.

Actuellement, face aux points de douleur de l'IA à travers les différentes couches, le Web3 a commencé à former un écosystème multicouche et interconnecté, couvrant toutes les étapes du processus des modèles d'IA.

AI+Web3 : tours et places

I. Couche de base : Airbnb de la puissance de calcul et des données

Puissance de calcul

Actuellement, l'un des coûts les plus élevés de l'IA est la puissance de calcul et l'énergie nécessaires pour entraîner et exécuter des modèles.

Un exemple est que le LLAMA3 d'une certaine entreprise nécessite 16 000 H100GPU produits par une certaine entreprise (qui est une unité de traitement graphique haut de gamme conçue pour les charges de travail d'intelligence artificielle et de calcul haute performance). La version 80 Go de cette dernière coûte entre 30 000 et 40 000 dollars, ce qui nécessite un investissement en matériel informatique de 400 à 700 millions de dollars (GPU + puces réseau), tandis que l'entraînement mensuel nécessite 1,6 milliard de kilowattheures, avec des dépenses énergétiques mensuelles atteignant près de 20 millions de dollars.

La décompression de la puissance de calcul AI est également le premier domaine dans lequel Web3 se croise avec l'IA ------ DePin (réseau d'infrastructure physique décentralisé). Actuellement, un site de données a déjà répertorié plus de 1400 projets, parmi lesquels plusieurs projets représentent le partage de la puissance de calcul GPU.

La logique principale réside dans le fait que la plateforme permet aux individus ou aux entités possédant des ressources GPU inutilisées de contribuer à leur capacité de calcul de manière décentralisée et sans autorisation. Cela se fait par le biais d'un marché en ligne similaire à celui d'une certaine entreprise, où les acheteurs et les vendeurs peuvent interagir, augmentant ainsi le taux d'utilisation des ressources GPU sous-utilisées. Les utilisateurs finaux bénéficient donc de ressources de calcul efficaces à moindre coût. En même temps, le mécanisme de staking garantit que, en cas de violation du mécanisme de contrôle de la qualité ou d'interruption du réseau, les fournisseurs de ressources subissent des sanctions appropriées.

Ses caractéristiques résident dans :

  • Rassembler les ressources GPU inutilisées : les fournisseurs sont principalement des centres de données indépendants de taille petite à moyenne et des opérateurs de mines de cryptomonnaies, qui disposent de ressources de puissance de calcul excédentaires, avec un mécanisme de consensus de type PoS pour le matériel de minage, comme certaines machines de minage de projets spécifiques. Actuellement, certains projets s’efforcent également de lancer des équipements avec des seuils d'entrée plus bas, comme certains projets qui utilisent certains dispositifs pour établir un réseau de puissance de calcul pour l'inférence de grands modèles.

  • Faire face au marché de longue traîne de la puissance de calcul AI :

a. "Du point de vue technique", le marché de la puissance de calcul décentralisée est plus adapté aux étapes d'inférence. L'entraînement dépend davantage de la capacité de traitement de données apportée par des GPU de très grande taille, tandis que l'inférence nécessite relativement moins de performance de calcul GPU, comme certains projets qui se concentrent sur des tâches de rendu à faible latence et des applications d'inférence AI.

b. Du côté de la demande, les petits et moyens demandeurs de puissance de calcul ne formeront pas leur propre grand modèle de manière indépendante, mais choisiront plutôt d'optimiser et d'ajuster des modèles principaux, et ces scénarios sont naturellement adaptés aux ressources de calcul distribuées inactives.

  • Propriété décentralisée : La signification technique de la blockchain réside dans le fait que les propriétaires de ressources conservent toujours le contrôle de leurs ressources, ajustant de manière flexible en fonction de la demande, tout en générant des revenus.

Données

Les données sont la base de l'IA. Sans données, le calcul est aussi inutile que de la plante flottante, et la relation entre les données et le modèle est comme le dicton " Garbage in, Garbage out ". La quantité des données et la qualité des entrées déterminent la qualité de sortie du modèle final. Pour l'entraînement des modèles d'IA actuels, les données déterminent les capacités linguistiques, les capacités de compréhension, et même les valeurs et les performances humanisées du modèle. Actuellement, les défis liés aux besoins en données de l'IA se concentrent principalement sur les quatre aspects suivants :

  • Soif de données : l'entraînement des modèles d'IA dépend d'un grand volume de données. Les données publiques montrent qu'une certaine entreprise a atteint des trillions de paramètres pour l'entraînement d'un modèle.

  • Qualité des données : Avec la combinaison de l'IA et des différents secteurs, la temporalité des données, la diversité des données, la spécialisation des données verticales et l'intégration de nouvelles sources de données telles que les émotions des réseaux sociaux posent de nouvelles exigences à leur qualité.

  • Problèmes de confidentialité et de conformité : Actuellement, les pays et les entreprises prennent progressivement conscience de l'importance des ensembles de données de qualité et commencent à imposer des restrictions sur le scraping des ensembles de données.

  • Coûts de traitement des données élevés : volumes de données importants, processus de traitement complexes. Des documents publics montrent que plus de 30 % des coûts de R&D des entreprises d'IA sont consacrés à la collecte et au traitement des données de base.

Actuellement, les solutions web3 se manifestent dans les quatre domaines suivants :

  1. Collecte de données : la disponibilité des données du monde réel pouvant être récupérées gratuitement s'épuise rapidement, et les dépenses des entreprises d'IA pour les données augmentent d'année en année. Cependant, ces dépenses ne retournent pas aux véritables contributeurs des données, les plateformes profitant entièrement de la création de valeur apportée par les données, comme une plateforme qui a réalisé un revenu total de 203 millions de dollars grâce à un contrat de licence de données signé avec une entreprise d'IA.

Permettre aux utilisateurs qui contribuent réellement de participer également à la création de valeur générée par les données, et d'obtenir des données plus privées et plus précieuses à moindre coût grâce à un réseau distribué et à des mécanismes d'incitation, est la vision du Web3.

  • Un projet est une couche de données et un réseau décentralisés, permettant aux utilisateurs de faire fonctionner des nœuds, de contribuer à la bande passante inutilisée et de relayer le trafic pour capturer des données en temps réel sur l'ensemble d'Internet, tout en recevant des récompenses en jetons ;

  • Un certain projet a introduit un concept unique de pool de liquidité de données (DLP), permettant aux utilisateurs de télécharger leurs données privées (telles que les historiques d'achats, les habitudes de navigation, les activités sur les réseaux sociaux, etc.) dans un DLP spécifique et de choisir de manière flexible s'ils souhaitent autoriser l'utilisation de ces données par des tiers spécifiques ;

  • Dans un certain projet, les utilisateurs peuvent utiliser certaines étiquettes sur une certaine plateforme et @un certain compte pour réaliser la collecte de données.

  1. Prétraitement des données : Dans le processus de traitement des données par l'IA, les données collectées sont généralement bruyantes et contiennent des erreurs, elles doivent donc être nettoyées et converties en un format utilisable avant d'entraîner le modèle, ce qui implique des tâches répétitives de normalisation, de filtrage et de traitement des valeurs manquantes. Cette étape est l'un des rares moments où l'intervention humaine est nécessaire dans l'industrie de l'IA, ce qui a donné naissance à la profession de data annotator. Avec l'augmentation des exigences de qualité des données par les modèles, le niveau d'entrée pour les data annotators a également augmenté, et cette tâche est naturellement adaptée au mécanisme d'incitation décentralisé de Web3.
  • Actuellement, certains projets envisagent d'intégrer l'étape clé de l'annotation des données.

  • Un projet a proposé le concept de « Train2earn », mettant l'accent sur la qualité des données, les utilisateurs peuvent obtenir des récompenses en fournissant des données annotées, des commentaires ou d'autres formes d'entrée.

  • Un projet de marquage de données gamifie les tâches de marquage et permet aux utilisateurs de miser des points pour en gagner davantage.

  1. Confidentialité et sécurité des données : il est important de clarifier que la confidentialité des données et la sécurité des données sont deux concepts différents. La confidentialité des données concerne le traitement des données sensibles, tandis que la sécurité des données protège les informations contre les accès, la destruction et le vol non autorisés. Ainsi, les avantages des technologies de confidentialité Web3 et les scénarios d'application potentiels se manifestent dans deux domaines : (1) l'entraînement des données sensibles ; (2) la collaboration des données : plusieurs propriétaires de données peuvent participer ensemble à l'entraînement de l'IA sans avoir à partager leurs données brutes.

Les technologies de confidentialité actuellement courantes dans le Web3 incluent :

  • Environnement d'exécution de confiance ( TEE ), par exemple un projet;

  • Cryptographie homomorphe complète (FHE), par exemple certains projets;

  • La technologie de preuve à divulgation nulle de connaissance (zk), comme un projet utilisant la technologie zkTLS, génère des preuves de zéro connaissance pour le trafic HTTPS, permettant aux utilisateurs d'importer en toute sécurité des données d'activité, de réputation et d'identité depuis des sites externes sans exposer d'informations sensibles.

Cependant, ce domaine en est encore à ses débuts, la plupart des projets sont encore en phase d'exploration. Un des dilemmes actuels est que le coût de calcul est trop élevé, quelques exemples sont :

  • Un certain cadre nécessite environ 80 minutes pour générer une preuve d'un modèle 1M-nanoGPT.

  • Selon les données d'une certaine entreprise, le coût de zkML est supérieur de plus de 1000 fois à celui du calcul pur.

  1. Stockage des données : Une fois les données obtenues, il faut encore un endroit
AGENT2.3%
MEME-2.01%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 3
  • Partager
Commentaire
0/400
GateUser-ccc36bc5vip
· 08-01 08:45
L'argent court plus vite que moi.
Voir l'originalRépondre0
airdrop_huntressvip
· 08-01 08:43
C'est juste ça, un nouveau sujet pour se faire prendre pour des cons.
Voir l'originalRépondre0
gaslight_gasfeezvip
· 08-01 08:41
Encore un nouveau concept pour arnaquer de l'argent !
Voir l'originalRépondre0
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)