Listes des datasets pour explorer l'IA
Classification d'Images
- MNIST : Ensemble de données de chiffres manuscrits (0 à 9). Très simple et parfait pour les premiers pas en classification d'images.
- CIFAR-10 : Ensemble de données d'images en couleur de 10 classes différentes (avions, voitures, oiseaux, chats, etc.). Un peu plus complexe que MNIST.
Classification de Texte
- IMDb Movie Reviews : Ensemble de données de critiques de films étiquetées comme positives ou négatives. Idéal pour l'analyse de sentiments.
- Reuters-21578 : Collection d'articles de presse Reuters classés par sujet. Utile pour la classification multi-classes de texte.
Traitement du Langage Naturel (NLP)
- SimpleBooks116 : Collection de textes de livres pour l'entraînement de modèles de langage simples.