Conception de tables extensibles et performantes

Article
06/01/2023

Conseil

Dans cet article, le contenu s’applique au stockage de Table Azure d’origine. Toutefois, les mêmes concepts s’appliquent à l’Azure Cosmos DB for Table le plus récent, qui offre des performances et une disponibilité plus élevées, une distribution globale et des index secondaires automatiques. Elle est également disponible en mode serverless basé sur la consommation. Il existe des différences de fonctionnalités entre l’API Table d’Azure Cosmos DB et celle du Stockage Table Azure. Pour plus d’informations, consultez Azure Cosmos DB for Table. Pour faciliter le développement, nous fournissons maintenant un Kit SDK Tables Azure unifié qui peut être utilisé pour cibler à la fois le stockage Table Azure et Azure Cosmos DB for Table.

Pour concevoir des tables scalables et performantes, vous devez prendre en compte un certain nombre de facteurs, comme les performances, la scalabilité et le coût. Si vous avez déjà conçu des schémas pour des bases de données relationnelles, ces considérations doivent vous être familières, mais bien qu’il existe quelques similitudes entre le modèle de stockage du service de Table Azure et les modèles relationnels, il existe également plusieurs différences importantes. Ces différences conduisent généralement à des conceptions différentes qui peuvent sembler absurdes ou incorrectes à une personne ayant une bonne connaissance des bases de données relationnelles, mais qui sont logiques pour une personne menant une conception pour un magasin de paires clé/valeur NoSQL comme celui du service de Table Azure. Un grand nombre des différences de conception reflètent le fait que le service de Table est conçu pour prendre en charge des applications à l’échelle du cloud qui peuvent contenir des milliards d’entités (ou lignes dans la terminologie de base de données relationnelle) de données ou pour des jeux de données devant prendre en charge des volumes de transactions très élevés. Par conséquent, vous devez concevoir différemment la façon dont vous stockez vos données et comprendre comment fonctionne le service de Table. Un magasin de données NoSQL bien conçu améliore la scalabilité de votre solution, pour un coût inférieur à celui d’une solution qui utilise une base de données relationnelle. Ce guide fournit une aide relative à ces sujets.

À propos du service de Table Azure

Cette section présente certaines des principales fonctionnalités du service de Table qui sont particulièrement adaptées aux conceptions orientées vers l'amélioration des performances et de l'extensibilité. Si vous ne connaissez pas le Stockage Azure et le service de Table, lisez d’abord Bien démarrer avec le stockage Table Azure à l’aide de .NET avant de lire le reste de cet article. Bien que ce guide porte sur le service de Table, il aborde également les services de File d’attente et Blob Azure, en expliquant comment les utiliser avec le service de Table.

Qu'est-ce que le service de Table ? Comme le laisse entendre son nom, le service de Table utilise un format tabulaire pour stocker des données. Selon la terminologie standard, chaque ligne de la table représente une entité et les colonnes stockent les différentes propriétés de cette entité. Chaque entité a une paire de clés qui permet de l’identifier de manière unique et une colonne d’horodatage que le service de Table utilise pour suivre les dernières mises à jour de l’entité. L’horodatage est appliqué automatiquement et vous ne pouvez pas le remplacer manuellement par une valeur arbitraire. Le service de Table utilise le dernier horodatage modifié (ou LMT, pour Last Modified Timestamp) afin de gérer l’accès concurrentiel optimiste.

Notes

Les opérations d’API REST du service de Table retournent également une valeur ETag dérivée du dernier horodatage modifié (LMT). Ce document utilise indifféremment les termes ETag et LMT, car ils font référence aux mêmes données sous-jacentes.

L'exemple suivant présente la conception d'une table simple pour stocker des entités relatives à des employés (Employee) ainsi qu'à leurs services (Department). Plusieurs des exemples présentés ultérieurement dans ce guide sont basés sur cette conception simple.

PartitionKey

RowKey

Timestamp

Marketing

00001

2014-08-22T00:50:32Z

FirstName	LastName	Age	E-mail
Don	Hall	34	donh@contoso.com

Marketing

00002

2014-08-22T00:50:34Z

FirstName	LastName	Age	E-mail
Juin	Cao	47	junc@contoso.com

Marketing

department

2014-08-22T00:50:30Z

DepartmentName	EmployeeCount
Marketing	153

Ventes

00010

2014-08-22T00:50:44Z

FirstName	LastName	Age	E-mail
Ken	Kwok	23	kenk@contoso.com

Jusqu’ici, ces données ressemblent à une table de base de données relationnelle, les principales différences étant les colonnes obligatoires et la possibilité de stocker plusieurs types d’entité dans la même table. Par ailleurs, chacune des propriétés définies par l’utilisateur, comme FirstName ou Age, est caractérisée par un type de données, par exemple, un nombre entier ou une chaîne, tout comme une colonne dans une base de données relationnelle. Bien que, contrairement à une base de données relationnelle, la nature sans schéma du service de Table signifie qu'une propriété n'a pas nécessairement besoin d'avoir les mêmes types de données pour chaque entité. Pour stocker des types de données complexes dans une seule propriété, vous devez utiliser un format sérialisé comme JSON ou XML. Pour plus d’informations sur les plages de dates et les types de données pris en charge, les règles d’affectation de noms et les contraintes de taille, consultez l’article Présentation du modèle de données du service de Table.

Le choix de la valeur de PartitionKey et de RowKey est fondamental pour une bonne conception de table. Toutes les entités stockées dans une table doivent avoir une combinaison unique de PartitionKey et RowKey. Comme avec les clés dans une table de base de données relationnelle, les valeurs de PartitionKey et RowKey sont indexées pour créer un index cluster afin de permettre des recherches rapides. Toutefois, le service de Table ne crée pas d’index secondaire, PartitionKey et RowKey sont par conséquent les seules propriétés indexées. Certains des modèles décrits dans Modèles de conception de table illustrent comment contourner cette limitation apparente.

Une table est constituée d’une ou plusieurs partitions et la plupart des décisions de conception que vous prenez consistent à choisir une valeur de PartitionKey et RowKey convenable pour optimiser votre solution. Une solution peut être constituée d’une seule table contenant toutes vos entités organisées en partitions, mais généralement, une solution a plusieurs tables. Les tables vous permettent d'organiser vos entités logiquement, de gérer l'accès aux données en utilisant des listes de contrôle d'accès, et de supprimer une table entière à l'aide d'une opération de stockage unique.

Partitions de table

Le nom du compte, le nom de la table et la valeur de PartitionKey identifient la partition dans le service de stockage où le service de Table stocke l’entité. Tout en appartenant au schéma d’adressage des entités, les partitions définissent une étendue pour les transactions (pour en savoir plus, consultez Transactions de groupe d’entités ci-dessous) et constituent la base de la méthode de mise à l’échelle du service de Table. Pour plus d’informations sur les partitions, voir Liste de contrôle des performances et de l’extensibilité pour le stockage Table.

Dans le service de Table, un nœud individuel traite une ou plusieurs partitions complètes et le service se met à l’échelle en équilibrant la charge des partitions de manière dynamique sur les nœuds. Si un nœud est en sous-charge, le service de Table peut fractionner la plage de partitions traitées par ce nœud en différents nœuds. En cas de réduction du trafic, le service peut fusionner les plages de partitions à partir des nœuds silencieux en un nœud unique.

Pour plus d’informations sur les détails internes du service de Table et notamment la façon dont le service gère les partitions, consultez la documentation Microsoft Azure Storage : service de stockage sur le cloud à haute disponibilité et à cohérence forte.

Transactions de groupe d’entités

Dans le service de Table, les transactions de groupe d'entités (EGT) constituent l'unique mécanisme intégré pour effectuer des mises à jour atomiques entre plusieurs entités. Les EGT sont également parfois appelées transactions par lots. Les EGT peuvent uniquement fonctionner sur des entités stockées dans la même partition (autrement dit, elles partagent la même clé de partition dans une table donnée). Par conséquent, chaque fois que vous avez besoin d’un comportement transactionnel atomique sur plusieurs entités, vous devez vérifier que ces entités sont dans la même partition. Ceci justifie souvent la conservation de plusieurs types d'entité dans la même table (et partition) au lieu de l'utilisation de plusieurs tables pour différents types d'entité. Une seule EGT peut traiter jusqu'à 100 entités. Si vous envoyez plusieurs EGT simultanées pour traitement, vérifiez bien que ces EGT ne fonctionnent pas sur des entités communes aux différentes EGT. Sinon, le traitement risque d’être retardé.

Les EGT représentent également un éventuel compromis à prendre en compte dans votre conception. Autrement dit, l’utilisation de plusieurs partitions augmente la scalabilité de votre application, car Azure a plus d’occasions d’équilibrer la charge des requêtes sur les nœuds. Toutefois, l’utilisation de plusieurs partitions peut limiter la capacité de votre application à effectuer des transactions atomiques et à assurer une cohérence forte pour vos données. Par ailleurs, il s’agit d’objectifs de scalabilité spécifiques au niveau d’une partition qui peuvent limiter le débit de transactions attendu pour un nœud unique. Pour plus d’informations sur les objectifs d’extensibilité pour les comptes de stockage Azure standard, voir objectifs d’extensibilité pour les comptes de stockage standard. Pour plus d’informations sur les objectifs de scalabilité concernant le service de Table, consultez Objectifs de scalabilité et de performances pour le stockage de tables.

Considérations relatives à la capacité

Le tableau suivant décrit les objectifs de capacité, de scalabilité et de performances pour le stockage Table.

Ressource	Cible
Nombre de tables dans un compte de stockage Azure	Limité uniquement par la capacité du compte de stockage
Nombre de partitions dans une table	Limité uniquement par la capacité du compte de stockage
Nombre d'entités dans une partition	Limité uniquement par la capacité du compte de stockage
Taille maximale d’une seule table	500 Tio
Taille maximale d’une entité unique, y compris toutes les valeurs de propriété	1 Mio
Nombre maximal de propriétés dans une entité de table	255 (notamment les trois propriétés système : PartitionKey, RowKey et Timestamp)
Taille totale maximale d’une propriété individuelle dans une entité	Varie en fonction du type de propriété. Pour plus d'informations, consultez Types de propriétés dans Présentation du modèle de données du service de Table.
Taille de la PartitionKey	Chaîne jusqu’à 1 Kio
Taille de la RowKey	Chaîne jusqu’à 1 Kio
Taille d’une transaction ETG	Une transaction peut inclure au plus 100 entités, et la charge utile doit être inférieure à 4 Mio. Une transaction de groupe d’entités peut inclure une mise à jour d’une entité une seule fois.
Nombre maximal de stratégies d’accès stockées par table	5
Taux de requête maximal par compte de stockage	20 000 transactions par seconde, en supposant que la taille d’entité est de 1 Kio
Débit cible pour une partition de table unique (entités de 1 Kio)	Jusqu'à 2 000 entités par seconde

Considérations relatives au coût

Le stockage Table est relativement peu coûteux, mais vous devez ajouter les estimations de coût de l’utilisation de capacité et de la quantité de transactions quand vous envisagez une solution qui utilise le service de Table. Toutefois, dans de nombreux scénarios, le stockage de données dénormalisées ou dupliquées pour améliorer les performances ou la scalabilité de votre solution est une approche appropriée. Pour plus d’informations sur la tarification, consultez la page Tarification Azure Storage.

Conception de tables extensibles et performantes

À propos du service de Table Azure

Partitions de table

Transactions de groupe d’entités

Considérations relatives à la capacité

Considérations relatives au coût

Étapes suivantes

Ressources supplémentaires