5 paramètres à considérer pour améliorer la disponibilité de votre système d'information

30 juin 2017/Charlotte Petyt

Toutes les entreprises cherchent à améliorer la disponibilité de leur système d'information. Pour en assurer et maitriser la haute disponibilité, plusieurs facteurs doivent être pris en compte :

  • Le matériel
  • Le logiciel
  • L'environnement et les événements extérieurs
  • Les procédures
  • L'aspect humain

1# Les composants matériels

Pour déterminer la disponibilité d'un composant du système, il faut déterminer 2 paramètres le MTBF et le MTTR :

  • MTBF - Mean time between failure - correspond au temps moyen entre 2 pannes.
  • MTTR - Mean time to repair - correspond au temps nécessaire pour remettre le système en état.

Concernant les composants matériels, le MTBF est généralement fourni par le constructeur. Celui-ci réalise des tests permettant de déterminer statistiquement le temps moyen entre 2 pannes.

Le MTTR correspond quant à lui au temps nécessaire pour remettre en fonctionnement l'équipement physique, il représente le temps d'accès à l'équipement et le remplacement du composant défaillant.

Ces valeurs peuvent être réduites par la redondance des composants, par exemple. Ces éléments sont bien entendus à prendre en compte, notamment si l'entreprise est dans une réflexion de Cloud vs une infrastructure sur site .

Notons que dans le cas du Cloud Scalair mis en oeuvre, les composants matériels sont bien évidemment redondés.

2# Le logiciel

Les méthodes de calcul de disponibilité du logiciel et du matériel sont identiques, même si les causes des pannes sont différentes. La haute disponibilité d'un logiciel est souvent plus difficile à obtenir que celle du matériel, car elle n'est pas nécessairement améliorée par la redondance d'un composant. Les erreurs peuvent être liées à une logique incorrecte, une mauvaise donnée d'entrée, une mauvaise déclaration de données, etc...

Le taux d'erreur est déterminé par le nombre d'erreurs détectées divisé par la taille du logiciel (estimée en ligne de code par exemple).
Plusieurs facteurs peuvent jouer sur le taux d'erreurs d'un logiciel :

  • La complexité du logiciel.
  • La taille du logiciel.
  • L'expérience des développeurs.
  • Le pourcentage de code utilisé dans une version stable.
  • Le temps accordé aux tests & debugs avant la publication d'une nouvelle version.

On peut donc estimer le MTBF du logiciel en multipliant le taux d'erreur par le nombre de lignes de code exécutées par seconde.
Quant aux MTTR, le temps peut être très faible, la plupart des failles se résolvent par le redémarrage du système.

Prenons le cas du système de virtualisation, pour assurer la disponibilité du système, certains logiciels ont déjà fait leur preuve notamment pour assurer un certain niveau de disponibilité, c'est le cas de VMware pour la virtualisation des environnements. 

Notons que ces points doivent être aussi pris en compte du côté des développeurs dans la conception et l'évolution des logiciels métiers.

3# L'environnement et les événements extérieurs

L'environnement joue un rôle capital dans la disponibilité du système. Ces événements sont imprévisibles et difficilement prédicibles. Ils peuvent provoquer une indisponibilité du système de quelques heures à plusieurs mois, selon leur impact sur le système.

  • Les catastrophes naturelles : incidents, tremblements de terre, tornades, innondations, etc...
  • Les attaques informatiques : virus, ransomwares, etc... On observe depuis quelques années une recrudescence de ce type d'attaques.

On peut par exemple limiter l'impact de certaines catastrophes naturelles en s'appuyant sur des Datacenter de tier III ou IV.

Quant aux attaques informatiques, de nombreuses mesures permettent de limiter leur impact (sauvegarde, mise à jour, sensibilisation des utilisateurs, etc... ).

4# Les procédures

Selon une étude de Gartner de 2015, 80% des coupures de service trouvent leur origine dans les actions humaines et les problèmes de procédures. Parmi ces coupures, plus de 50% sont causées par des changements, configurations, etc...

L'intervention humaine n'est jamais sans risque d'erreurs. Il est donc nécessaire d'automatiser les procédures autant que possible et de définir les bonnes méthodes  pour améliorer la disponibilité du système face aux incidents.

5# Le facteur humain

Les erreurs humaines interviennent en grande partie lors des changements tels que des adjonctions, des modifications de configuration, etc.. Pour évaluer la disponibilité du système, il faut considérer l'aspect humain ainsi que la tâche elle-même :

  • La complexité de la tâche : ordinaire ou exceptionnelle.
  • Le stress:  c'est à dire le temps imparti pour executer la tâche. Une tâche complexe avec un temps d'execution très limité peut accentuer le facteur stress. 
  • L'expérience de la personne qui exécute la tâche.
  • La documentation liée à cette tâche.

Tous ces facteurs jouent un rôle déterminant dans la disponibilité du système d'information. S'adosser sur un partenaire va permettre de maîtriser une partie de ce facteurs et donc d'améliorer la disponibilité du système d'information.

New Call-to-action

Charlotte Petyt
À propos de Charlotte Petyt : Charlotte est ce qu’on appelle « une passionnée de Cloud ». Ce qui l’anime, c’est la compréhension des problématiques des entreprises autour de la transformation digitale et l’évolution du marché du Cloud. Depuis 5 ans, elle travaille sur l’évolution des produits Scalair et de son outil de supervision : le CS Manager.

À lire ensuite

L’engagement de disponibilité : un enjeu majeur pour l’entreprise

Le Cloud offre de réelles opportunités de croissance aux entreprises. Mais les interruptions de service peuvent...

7 acronymes à connaître lorsqu'on parle de disponibilité informatique

Lorsqu'on parle de disponibilité, on est souvent confronté à des acronymes dont les significations sont des...

5 paramètres à considérer pour améliorer la disponibilité de votre système d'information

Toutes les entreprises cherchent à améliorer la disponibilité de leur système d'information. Pour en assurer et...