Accélérateur RAPIDS pour Apache Spark

L'accélérateur RAPIDS™ pour Apache Spark est un plug-in qui exploite les bibliothèques et les GPU RAPIDS pour accélérer les pipelines de traitement des données et d'apprentissage automatique sur Apache Spark. Il transforme les pipelines existants sans aucun changement de code.

Explorez les avantages de l'accélération

Accélération des délais de traitement

Accélérez les performances des tâches de préparation des données afin d'entraîner plus rapidement des modèles d'IA et d'accélérer l'analyse.

Réduction des coûts d’infrastructure

Faites plus avec moins : Spark sur les GPU NVIDIA® permet d'effectuer leurs tâches plus rapidement en utilisant moins de ressources matérielles qu'avec les CPU, ce qui permet de gagner du temps tout en réduisant leurs coûts d’exploitation sur site ou leurs coûts opérationnels dans le Cloud.

Réduction des délais de mise sur le marché

Bénéficiez rapidement des avantages sans modifications de code nécessaires. Les outils inclus identifient les meilleures tâches pour l'accélération GPU et calculent des configurations optimales.

Cas d'utilisation

Comment l'accélérateur RAPIDS est utilisé

Toutes sortes d'entreprises utilisent Apache Spark pour l'analyse des processus métier, le chargement de données dans des entrepôts de données et le prétraitement de données au début des pipelines d'apprentissage automatique.

Évolutivité du traitement des données

Les volumes croissants de données pèsent sur les ressources informatiques. L'accélération GPU améliore l'infrastructure de calcul afin qu'elle puisse traiter beaucoup plus de données. En accélérant ses opérations, Taboola a pu faire face à l'augmentation des volumes de données tout en respectant ses délais de traitement, et ce, sans avoir à agrandir son Data Center.

Pipelines d'IA

Les pipelines d'IA se composent de plusieurs étapes, notamment la préparation, la transformation, l'ingénierie des caractéristiques et l'extraction de données. L'accélération de ces opérations avec des GPU permet de réduire les délais d'entraînement et de réduire considérablement les coûts d'infrastructure. AT&T a réduit de 70 % les coûts et les délais de traitement de son pipeline d’IA.

Analyse en temps réel

Les entreprises s'appuient sur les données les plus récentes pour prendre des décisions opérationnelles essentielles. L'accélération GPU leur permet de travailler avec des informations à jour et d'obtenir des éclairages en temps réel. Grâce à des GPU, CapGemini a permis à un détaillant international de réduire le temps de traitement des transactions de plusieurs jours à quelques heures.

Assistance pour la migration à grande échelle

Projet Aether

Automatisez la qualification, les tests et la configuration de vos tâches Spark pour l'accélération GPU en utilisant l'IA pour optimiser les configurations et obtenir des performances maximales.  

Les délais de migration à grande échelle peuvent être réduits de plusieurs semaines, voire plusieurs mois à quelques heures, voire quelques jours, ce qui permet de réduire les délais de mise sur le marché et de réaliser des économies importantes. Postulez pour bénéficier de ce service gratuit en remplissant le formulaire de candidature.

Outil d'analyse du TCO

À quelle vitesse pouvez-vous aller ?

Évaluez vos propres charges de travail Apache Spark pour le potentiel d'accélération GPU et apprenez comment configurer un cluster pour des économies de coûts optimales.

Options de démarrage

Démarrer avec l'accélérateur RAPIDS pour Apache Spark

Découvrez comment faire passer l'analyse de données accélérée par GPU du développement à la production.

Développer

Commencez à utiliser les bibliothèques open source RAPIDS dès aujourd'hui pour accélérer les pipelines de Data Science. Explorez les dernières ressources techniques et lancez-vous avec l'accélérateur RAPIDS pour Apache Spark.

Déployer

Accélérez la Data Science avec NVIDIA AI Enterprise, une plateforme logicielle d'IA de bout en bout, sécurisée et conçue pour le Cloud. NVIDIA AI Enterprise fournit sécurité, facilité de gestion et stabilité des API pour atténuer les risques potentiels des logiciels open source.

Obtenez l'eBook gratuit pour en savoir plus

Pour débloquer la valeur des Big Data basés sur l'IA et en savoir plus sur la prochaine évolution d'Apache Spark, téléchargez l'eBook Accélérer Apache Spark 3.x : Exploiter les GPU NVIDIA pour entrer dans la nouvelle ère de l'analyse de données et de l'IA.

Demander une assistance gratuite