Aller au contenu

Listes des datasets pour explorer l'IA

Classification d'Images

  • MNIST : Ensemble de données de chiffres manuscrits (0 à 9). Très simple et parfait pour les premiers pas en classification d'images.
  • CIFAR-10 : Ensemble de données d'images en couleur de 10 classes différentes (avions, voitures, oiseaux, chats, etc.). Un peu plus complexe que MNIST.

Classification de Texte

  • IMDb Movie Reviews : Ensemble de données de critiques de films étiquetées comme positives ou négatives. Idéal pour l'analyse de sentiments.
  • Reuters-21578 : Collection d'articles de presse Reuters classés par sujet. Utile pour la classification multi-classes de texte.

Traitement du Langage Naturel (NLP)

  • SimpleBooks116 : Collection de textes de livres pour l'entraînement de modèles de langage simples.