Depuis longtemps l’une des forces de la console d’administration d’un cluster Nutanix est sa capacité à fournir des statistiques sur l’utilisation des ressources (CPU,RAM, Storage). Avec la version 5.0 de Acropolis OS, Nutanix apporte un granularité des informations relatives à consommation du stockage particulièrement utile pour comprendre et analyser le comportement des applications.
Lorsqu’il s’agit de tester une nouvelle solution du marché embarquant du stockage, on est assez rapidement confronté aux tests de performance. Tout le monde veut savoir combien d’IOPS cette nouvelle solution est capable d’offrir. A grand coup de bench IOmeter, on essaie de tirer le plus d’IOPS possible sans forcément comprendre l’architecture sous jacente ni analyser les besoins des applications.
Avec AOS 5.0, Nutanix restitue directement dans la console d’administration Prism, des métriques précises sur l’utilisation du stockage au sein de la plateforme. Steven Poitras explique dans la video suivante l’architecture software de AOS. Il est notamment l’auteur à l’origine de la Nutanix Bible.
Lorsque l’on parle du stockage sur un environnement Nutanix, on fait immédiatement reference à Stargate qui est le module en charge de toutes les operations de lecture/écriture sur le file system distribué.
Ceci étant dit, Acropolis OS est orienté “VM-Centric”. Cela signifie que pour chaque VM présentes dans Prism, les statistiques de consommation de ressources sont directement disponibles sans avoir besoin de deployer une solution tierce faisant appel à des appliances virtuelles supplémentaires.
Dans le cas d’une infrastructure Nutanix/vSphere, Le CPU Ready est meme directement disponible dans Prism.
Si l’on fait un focus sur la partie stockage d’une VM, Prism remonte nativement toutes les statistiques d’utilisation du stockage par disque virtuel comme le montre cette capture.
Pour finir la vue “VM Centric” le traffic réseau en E/S de la vNIC d’une VM est également tracé.
Maintenant, grâce aux statistiques que Stargate est capable de collectés et de stocker dans Cassandra, l’onglet I/O Latency dans la vue VM permet de visualiser par VM:
- Les courbes de latence en lecture/écriture
- La distribution des IO par taille de block qui sont fait sur le stockage en lecture et en écriture
- La distribution de la latence en ms en lecture et en écriture
- Le % d’accès Random vs Sequentiel en lecture et écriture
Ces informations existent depuis longtemps au sein d’AOS mais n’étaient pas directement disponible depuis Prism. Pour obtenir ce niveau de détail, il fallait passer sur l’interface de management de Stargate. Avec AOS 5.0, Prism révèle très simplement la manière dont les VMs, et par extension les applications, consomment et utilisent le stockage.
- L’utilisation d’outil de benchmark de stockage tel qu’IOmeter sont souvent assez peu représentatif d’un environnement de production réel. Grace à cette vue dans Prism, on comprend rapidement qu’une application ne fait jamais qu’un seul type d’accès. Le cas d’une application faisant 100% d’accès avec des bloc de 4k ou 8k n’est quasiment jamais rencontré. C’est la raison pour laquelle, tester un système de stockage avec un outil de stress faisant 100% d’accès 4k ou 8k ou autre n’a finalement que peu de signification, au meme titre que la quantité d’IOPS obtenu.
- Lorsque l’on est dans une phase de développement d’une nouvelle application, ce type d’information sur l’utilisation du stockage donne le moyen aux équipes en charge de l’infrastructure d’aider les développeurs à améliorer, adapter le comportement de l’application. C’est souvent un moyen de rapproche, réconcilier les équipe infrastructures des équipes applicatives/métiers.