LAB

FABrIC Logo white

Détacher l’accélérateur tsunAImi tsn200ES

L’accélérateur runAI200™ est conçu pour l’inférence d’apprentissage profond en temps réel et les applications de calcul haute performance (HPC). Son architecture at-memory unique combine plus de 260 000 éléments de traitement, 511 processeurs RISC-V personnalisés et 204 Mo de SRAM dans la puce la plus efficace de sa catégorie, offrant 8 TOPs/W. Le kit de développement logiciel (SDK) imAIgine™ permet d’obtenir des performances en mode bouton-poussoir sur les réseaux d’apprentissage profond dans les cadres standard et un flux de développement de noyau personnalisé pour les applications de calcul à haute performance qui nécessitent un calcul arbitraire.

UntetherAI_tsunAImi

Fonctionnalités

  • 502 TOP INT8
  • 204MB SRAM sur puce
  • 75W TDP 40W typique
  • 8 TOPs/W
  • Architecture At-Memory
  • Tension et fréquence évolutives
  • Faible latence, lot natif = 1 PCIe Gen4 x16

Applications

Les dispositifs runAI200 sont conçus pour accélérer une multitude de charges de travail d’inférence IA et HPC, telles que les réseaux convolutifs basés sur la vision, les réseaux transformateurs pour le traitement du langage naturel, l’analyse des séries temporelles pour les applications financières et l’algèbre linéaire à usage général pour les applications de calcul à haute performance.

Marchés Applications Réseaux
Vision Classification, détection d’objets, segmentation sémantique ResNets, YOLO, SSD, Unets, Pose
Traitement du langage naturel Synthèse vocale, synthèse vocale, chatbots RNN, transformateurs, BERT
Technologie financière Ajustements de la valeur X, risque de crédit, équilibrage du portefeuille TCN, LSTM
Calculs de haute performance  (HPC) Modélisation du climat, inspection approfondie des paquets, simulations FFT, BLAS, calcul arbitraire

Kit de développement logiciel imAIgine

Le SDK imAIgine offre aux développeurs de puissants outils automatisés et des logiciels de soutien pour passer rapidement du modèle pilote à la production. Il est organisé en trois parties.

  • Le compilateur imAIgine
    • Importer directement des graphes TensorFlow, PyTorch ou ONNX
    • Quantificateur automatisé et performances d’extraction sans sacrifier la précision
    • Spécifier les niveaux de performance, l’utilisation du silicium et les objectifs de consommation d’énergie
  • La boîte à outils imAIgine
    • Évaluer les fonctionnalités et les performances à l’aide des nombreux outils de profilage et de simulation.
  • Le Runtime imAIgine
    • Fournit une API basée sur le langage C pour l’intégration dans votre environnement d’apprentissage profond.
    • Contrôler l’état et la température des cartes d’accélération tsunAImi® pour garantir leur bon fonctionnement et éviter les dommages thermiques.

Ressources

Communiquez avec nous

Yassine Hariri, PhD
Scientifique principal
IA/AM et systèmes embarqués

Votre recherche bénéficie-t-elle des produits et services offerts par CMC Microsystèmes ?

Plateformes de conception à source ouverte pour le développement accéléré du système

Retour en haut
Aller au contenu principal