Les données TensorFlow

TensorFlow Datasets fournit de nombreux données publiques commetf.data.Datasets.

Unittests PyPI version Tutorial API Catalog

Documentation

Pour installer et utiliser TFDS, nous encourageons fortement à commencer avec notre Commencer guideEssayez interactivement dans un Livre Colab.

Notre documentation contient :

# !pip install tensorflow-datasets
import tensorflow_datasets as tfds
import tensorflow as tf

# Construct a tf.data.Dataset
ds = tfds.load('mnist', split='train', as_supervised=True, shuffle_files=True)

# Build your input pipeline
ds = ds.shuffle(1000).batch(128).prefetch(10).take(5)
for image, label in ds:
  pass

Les valeurs de base TFDS

TFDS a été construit avec ces principes en tête:

  • La simplicité: Les casques d'utilisation standard doivent fonctionner en dehors de la boîte
  • PerformanceTFDS suit Les meilleures pratiques et peut atteindre la vitesse de l'état-of-the-art
  • Déterminisme / Reproductivité: Tous les utilisateurs reçoivent les mêmes exemples dans le même Ordre
  • Customisabilité: Les utilisateurs avancés peuvent avoir un contrôle fine-grain

Si ces cas d'utilisation ne sont pas satisfaits, veuillez nous envoyer Le feedback.

Vous voulez un certain nombre de données?

L'ajout d'un ensemble de données est vraiment simple en suivant Notre guide.

Demander un ensemble de données en ouvrant un Demande de données sur GitHub.

Vote sur l’actualité Un ensemble de demandes En ajoutant une réaction à la question.

Citation

Veuillez inclure la citation suivante lors de l'utilisationtensorflow-datasetsPour A papier, en plus de toute citation spécifique aux données utilisées.

@misc{TFDS,
  title = {{TensorFlow Datasets}, A collection of ready-to-use datasets},
  howpublished = {\url{https://www.tensorflow.org/datasets}},
}

Réclamations

C'est une bibliothèque utilitaire qui télécharge et prépare des données publiques. ne pas héberger ou distribuer ces données, pour leur qualité ou leur honnêteté, ou prétendre que vous avez la licence d’utiliser les données.C’est votre responsabilité de déterminer si vous avez la permission d’utiliser le fichier sous le fichier de licence.

Si vous êtes propriétaire d'un ensemble de données et que vous souhaitez mettre à jour une partie de celui-ci (descriptif, citation, etc.), ou ne voulez pas que vos données soient inclus dans cette bibliothèque, veuillez vous connecter à travers un problème GitHub. merci pour votre Contribution à la communauté ML!

Si vous êtes intéressé à en apprendre davantage sur les pratiques AI responsables, y compris Veuillez consulter Google AILes pratiques responsables.

tensorflow/datasetsApache 2.0 est autorisé. voir le LICENSEle fichier.