SUN Database Machine – EXADATA V2 : Larry n'a peur de rien !

Contre tout pronostic Larry Ellison l’a fait, il a osé. Hier lors de son speech, il a annoncé une Database Machine 2 fois plus rapide que la première pour le datawarehousing, enterrant au passage les ventes potentielles de la machine HP.
Car malgré un positionnement présenté comme OLTP lors de l’invitation, Larry a martelé que la nouvelle Database Machine, Version 2, apporterait effectivement une performance inégalée pour de l’OLTP, ET renvoie aux oubliettes la machine de l’an dernier pour le Datawarehousing.
Si vous sortez un produit V2 deux fois plus rapide que le V1, en conditions comparables, c’est aussi dire « adieu la V1 ». Alors au revoir HP, j’ai rarement vu un produit de ce prix ($650k sans les licences) disparaitre aussi vite.
>> Mais non, la database machine V1 est encore vendue, encore au catalogue ! Et deux fois moins chère que la V2 !
Notre analyse vous démontrera pourtant qu’il n’en est rien, et retenez ce chiffre qui résume les capacités de la machine :

1 million de « random IOPS » (IO aléatoires par seconde).

Mais d’abord, alignons quelques données pour présenter cette nouvelle arme de guerre.

Sun Oracle Database Machine

Je vous ferai grace des chiffres du press release, ouvrons plutôt la boite. La Database Machine V2 c’est dans un rack tout intégré :

  • 8 serveurs Sun X4170, chacun équipé de 2 Intel Nehalem et de 72 Go Oracle_Exadata_V2_01RAM DDR3, soit au total 64 cœurs et 576 Go de mémoire (400 Go au total pour la SGA).
  • 14 Exadata Storage Servers (reposant sur des machines Sun X4275), chacun équipé de 12 disques classiques et non SSD, soit 168 disques de 2 To SATA ou 600 Go 15k SAS 6Gb/s, et 24 Go RAM
  • 56 modules FlashFire (4 par ESS), dont nous reparlerons plus bas
  • 4 Switches Infiniband SUN 36, équipés de liens QDR 40 Gbps, soit une bande totale réelle annoncée de plus de 50 GO/S sur le réseau de stockage. Chaque switch dispose d’un fond de panier pouvant encaisser 2.8 Tbps.
  • un switch Ethernet 48 ports pour l’administration, un KVM écran, etc.
  • Oracle Enterprise Linux, Oracle Exadata, Oracle Database, RAC, ASM

Si l’on compare ces chiffres, on dirait bien une DBMV1 boostée au nitrométhane, qui aurait en fait simplement suivi les évolutions des offres matérielles des OEM embarqués, et avec une étiquette SUN qui remplace HP. Quoi de plus logique en ces périodes de fusion annoncée entre les deux géants ? Grâce à cette machine, Oracle deviendra complètement maître de la production de son vaisseau amiral.
Mais finalement ou est la nouveauté ? Tout cela ne vaut pas le bruit ! Ils sont ou mes SSD ? Et l’OLTP là-dedans ?
Larry ne se déplace pas pour rien … et bien évidemment l’actualité ne se résume pas à un upgrade matériel sur une superbe machine de datawarehouse.

Exadata Smart Flash Cache et Sun FlashFire

L’OLTP force 10, c’est ce que va permettre la nouvelle architecture mise en œuvre, qui s’articule autour de deux nouveautés :

  • Les modules FLASHFIRE
  • Oracle 11gR2

Flashfire, c’est le petit nom donné par SUN à une technologie de CACHE FLASH intégrée au contrôleur de disque. Chaque module flashfire offre 96 GB de mémoire flash qui sera utilisé comme cache disque. 4 modules par ESS, cela donne un  total de 5,3 To de cache flash sur la baie ! Il existe aujourd’hui chez la concurrence des solutions similaires, et malgré les chiffres impressionnant, cela ne suffit pas pour faire la différence.
La force de cette solution réside dans la complémentarité Soft/Hard sur laquelle Oracle et SUN ont travaillé ensemble : le moteur moteur Oracle et le noyau Exadata Storage Server sont capable de traiter et optimiser les accès au données pour que l’utilisation du cache flash soit le plus efficace possible, et avec un tel volume de cache, tout est permis. Chez Oracle, cette technologie s’appelle Exadata Flash Smart Cache.
Elle permet une optimisation particulière de la gestion des caches qui ne se limite pas à conserver les derniers blocs chargés avec un algorithme LRU. En particulier, une indexation spéciale des extents dans le stockage est mise en œuvre par le noyau, laquelle permet de limiter les accès disques pour les clauses de filtrage dans les requêtes. La gestion de la conservation des blocs en cache est calculée avec des algorithmes prédictifs pour éviter de polluer le cache.
Le schéma suivant présente l’articulation des différents systèmes de cache et disque (en simplifié).
Exadata-archi

Compresser pour accélérer

Pour Exadata V2, Oracle a également fournit une nouvelle capacité de compression qui vient s’ajouter à l’option Advanced Compression disponible sur la base 11g « classique ». Cette nouvelle capacité de compression est aussi une caractéristique spécifique de la 11.2 qui a été ajoutée uniquement pour Exadata, elle permet selon les annonces un gain de :

  • 10 fois en mode Datawarehouse, soit un équivalent de 4 To de cache RAM et 53 To de cache flash
  • 15 fois en mode Archive, soit 6 To de cache RAM et 80 To de cache flash

Nous avons constaté lors de tests préliminaires des taux moyens à 18x, atteignant 50x !
Cette compression nouvelle dans Oracle 11gR2 s’appelle Hybrid Columnar Compression, mais cette fonctionnalité sera réservée pendant un temps à la Database Machine, elle offre la possibilité de compresser les données présentes dans les caches et sur les disques, et de traiter les blocs compressés en mémoire dans l’exécution des requêtes.  Ce mode de fonctionnement permet non seulement de gagner beaucoup d’espace de stockage, mais aussi d’accélérer le fonctionnement des requêtes !
Cette capacité, alliée à une gestion optimisée des caches, constitue la véritable valeur ajoutée d’Oracle sur cette offre.

Tous les bons ingrédients pour construire une Ferrari

Tout cela mis bout à bout, EXADATA V2 offre des fonctionnalités uniques offertes par la base Oracle et le matériel

  • Puissance globale de l’infrastructure, reposant sur des éléments X86 donc bon marché (essayez de comparer avec un E25000)
  • Infiniband QDR + protocole optimisé ZDP
  • 330 To de stockage brut en SATA, 100 To en SAS (la compression permet de dépasser ces valeurs en capacité de données réelles, malgré une redondance importante des disques)
  • Extensible « à l’infini »
  • Redondance totale (matérielle, logicielle) à tous les niveaux : disque, baie, serveur, switch, rack entier !
  • Multiplexing à tous les niveaux (disque, contrôleur, storage server, RAC !) : les données sont « infiniment réparties » pour limiter l’effet du bottleneck constitué par les IO du disque magnétique. Les nouveautés d’ASM en 11gR2 seront sans doute bienvenues pour cette offre !
  • Offloading des requêtes de la base vers le stockage, innovation de l’Exadata V1, lequel permet d’accélérer le data-mining et les requêtes BI « de 10 à 50 fois » (chiffres Oracle)
  • 400 Go de cache en mémoire RAM, partagée entre tous les nœuds du cluster grâce à Cache Fusion
  • 5,3 To de cache flash, utilisé intelligemment et compressé avec Hybrid Columnar Compression
  • 14% plus efficace en énergie

C’est grâce à cette architecture unique (matériel + logiciel) qu’Oracle peut annoncer le chiffre faramineux de 1 MIOPS ! Toujours d’après Larry, avec ces mécanismes de Cache flash et de compression, ils ont obtenu des résultats aux benchmarks TPC-H meilleurs que les bases « in-memory » !! Ne cherchez pas ces résultats sur le site TPC, ils sont visiblement pour l’instant uniquement dans les slides Oracle …
Pour reprendre l’expression de Larry, Exadata c’est du « brawny hardware running brainy software »

Parlons prix

Les prix publics annoncés (en dollars, nous n’avons pas encore les pricelists Euro à cette date) :

  • $1.1M pour la machine complète (8 serveurs, 14 baies, 3 switches)
  • $650k pour une demi machine (4 serveurs, 7 baies, 2 switches)
  • $350k pour un quart (2 serveurs, 3 baies, 2 switches)
  • $110k pour une brique de base (1 serveur, 1 switch, 1 baie)

Pour ce prix, la machine est livrée « plug-and play » selon Oracle, préinstallée.
Bien entendu, il faut ajouter le prix des licences Exadata Storage Server ($10k par disque, on peut ne licencier qu’une partie des disques) et Database ($70k pour 2 cœurs en incluant RAC, auquel il faut ajouter l’Advanced Compression à $11,5k qui est largement rentabilisé par les économies d’architecture, et Partitioning à $11,5k probablement)
L’addition reste salée, comme pour la V1 les licences plombent la note, et le matériel a augmenté …

Mais c’est moins cher !

Oui, paradoxalement, « c’est moins cher », beaucoup moins cher !! Je m’explique. Dans la mesure ou Exadata V2 est deux fois plus puissant que V1 (et au vu des caractéristiques, c’est probablement vrai), le calcul est facile.
Pour le prix d’un V1 ($650k prix public), vous avez une demi V2, soit la même capacité et la même puissance, vous diminuez votre facture électrique, mais surtout VOUS PAYEZ DEUX FOIS MOINS DE LICENCES !!!
Après cela, il reste peu de raisons (compatibilité de versions, etc.) d’acheter une V1 !
C’est ça, le mot de la fin pour aujourd’hui …. restez à l’antenne pour plus d’informations, je ne doute pas que nos deux spécialistes EXADATA arkzoyd et stforlong sauront vous captiver avec ce sujet dans les mois à venir.
Update : si vous regardez la nouvelle pricelist exadata, il n’y a plus la V1 ! CQFD

9 réflexions sur “SUN Database Machine – EXADATA V2 : Larry n'a peur de rien !”

  1. Ping : « EASYTEAM le blog », le premier blog en français autour des solutions technologiques Oracle | EASYTEAM

  2. Ping : HCC disponible pour les baies Pillar et ZFS ! | EASYTEAM

  3. Ping : HCC disponible pour les baies Pillar et ZFS ! « EASYTEAM LE BLOG

  4. Ping : Pendant les vacances, consultez les dix articles les plus lus du blog EASYTEAM « EASYTEAM LE BLOG

  5. Bonjour,
    Je crois qu’une petite coquille s’est glissé dans cet article (très intéressant au passage) 😉 :
    # $110 pour une brique de base (1 serveur, 1 switch, 1 baie)
    $110K je pense plutôt. Rien de grave en somme 😉
    Cordialement,
    Guireg

  6. Ping : « EASYTEAM le blog », le premier blog en français autour des solutions technologiques Oracle « EASYTEAM Le BLOG

  7. Ping : Database Machine : Round II « IT Corporate Solutions

Les commentaires sont fermés.