Le projet tardigrade protège votre vms contre les erreurs de l'hôte

Table des matières:

Vidéo: CET ANIMAL PEUT VOUS RENDRE IMMORTEL ? Vrai ou Faux #23 2024

Vidéo: CET ANIMAL PEUT VOUS RENDRE IMMORTEL ? Vrai ou Faux #23 2024
Anonim

Après plusieurs modifications et améliorations de la sécurité Azure au cours des derniers mois, Microsoft présente Project Tardigrade dans sa toute dernière tentative visant à rendre Azure plus fiable.

Le projet Tardigrade prévient les pannes de plate-forme

Project Tardigrade est un nouveau service qui vise à améliorer la résilience Azure. Il inclut des stratégies d'atténuation qui protègent les machines virtuelles Azure contre les défaillances de la plateforme.

Voici comment Mark Russinovich, directeur de la technologie chez Microsoft Azure, décrit les travaux en cours sur Azure:

Notre objectif est de donner aux organisations les moyens de gérer leur charge de travail de manière fiable sur Azure. Partant de ce principe, nous investissons en permanence dans l'évolution de la plate-forme Azure afin qu'elle résiste aux pannes, non seulement pour accroître la productivité de l'entreprise, mais également pour fournir une expérience client transparente.

Pour éviter tout impact sur vos charges de travail, le service permet aux composants de s'auto-réparer et de récupérer rapidement des défaillances potentielles, même en cas de défaillances critiques de l'hôte.

Comment fonctionne le projet Tardigrade?

Voici un exemple sur le fonctionnement du flux de travail de récupération Tardigrade:

  • Phase 1: cette étape n'a aucun impact sur les ordinateurs virtuels des clients en cours d'exécution. Il recycle simplement tous les services en cours d'exécution sur l'hôte. Dans les rares cas où le service défaillant ne redémarre pas correctement, nous passons à la phase 2.
  • Phase 2: notre service de diagnostics s'exécute sur l'hôte pour collecter systématiquement tous les journaux / vidages pertinents, afin de pouvoir diagnostiquer de manière approfondie le motif de l'échec en phase 1. Cette analyse complète nous permet de 'trouver la cause du problème' et d'éviter ainsi les récurrences. A l'avenir.
  • Phase 3: à un niveau élevé, nous réinitialisons le système d'exploitation dans un état sain avec un impact minimal sur le client afin d'atténuer le problème de l'hôte. Au cours de cette phase, nous préservons les états de chaque machine virtuelle en RAM, après quoi nous commençons à réinitialiser le système d'exploitation dans un état sain. Pendant que le système d'exploitation se réinitialise rapidement en dessous, l'exécution d'applications sur tous les ordinateurs virtuels hébergés sur le serveur "se fige" brièvement, car le processeur est temporairement suspendu. Cette expérience est similaire à une connexion réseau temporairement perdue mais rapidement rétablie en raison d'une nouvelle tentative de logique. Une fois le système d'exploitation réinitialisé, les machines virtuelles consomment leur état stocké et reprennent une activité normale, contournant ainsi tout redémarrage potentiel de la machine virtuelle.

Dans cet esprit, Project Tardigrade veillera à ce que la défaillance d'un seul composant de l'hôte n'affecte pas l'ensemble du système. En tant que tel, les machines virtuelles des clients ne seront pas affectées par les erreurs de l'hôte.

Microsoft travaille d'arrache-pied pour améliorer et étendre les différents scénarios de défaillance des hôtes afin de s'assurer que leur plate-forme de cloud computing est plus fiable que jamais.

Attendez-vous à de nouveaux développements et à d'autres implémentations de fiabilité dans un avenir proche.

Le projet tardigrade protège votre vms contre les erreurs de l'hôte

Le choix des éditeurs