Hadoop

9 réponses
AuteurMessage

Rano |
Modérateur

Photo de Rano

Inscrit le : 13/04/2005

# Le 28/04/2014 à 11:32

Salut,

Vous avez déjà utilisé Hadoop ? Je commence à explorer tout ça. Mes solutions maisons fonctionnent dans la gestion de "beaucoup" de données réparties sur plusieurs serveurs, mais ce n'est pas optimal. Je me retrouve forcément avec des serveurs qui bossent un peu moins que les autres et j'ai des besoins de traitement "instantanée". Ces solutions de Big Data semblent être réellement bien pensées pour simplifier le développement.

Si j'ai bien compris, une solution basée sur Hadoop + Hive est ce qu'il y a de plus proche de Mysql. Vous avez essayé ?

Je commence juste à regarder ce qui se cache réellement derrière ce terme de "Big Data"

Chambres d'hote tavelOuvrir dans une nouvelle fenetre
Séjours en provenceOuvrir dans une nouvelle fenetre
Forum mariageOuvrir dans une nouvelle fenetre

Bool | Olivier
Modérateur

Photo de Bool

Inscrit le : 09/05/2005

# Le 28/04/2014 à 12:02

Hello,

pas testé non, mais intéressé par un retour d'expérience. Pour ma part j'ai commencé à jouer avec l'aspect stockage du «Big Data» via RadosGW essentiellement.
Coté BDD, je commence tout juste à jouer avec CouchBase (CouchDB), mais il n'y a pas de sharding. T'as la réplication, une très forte tolérance aux pannes, le côté MapReduce, mais en l'absence de sharding j'ai un doute sur les gros volumes de données.

daevel : infogérance et conseilOuvrir dans une nouvelle fenetre || moiOuvrir dans une nouvelle fenetre

krucial | Jean Christophe
Administrateur

Photo de krucial

Inscrit le : 09/03/2005

# Le 28/04/2014 à 14:17

Vous entendez quoi pas Big data en fait ?

JC - Mes sitesOuvrir dans une nouvelle fenetre | Affiliation devis travauxOuvrir dans une nouvelle fenetre | Cotes voitures anciennesOuvrir dans une nouvelle fenetre

Bool | Olivier
Modérateur

Photo de Bool

Inscrit le : 09/05/2005

# Le 28/04/2014 à 14:39

Pour moi c'est un ensemble de technos / tendances qui s'orientent faire la «scalabilité extrême». C'est à dire des technos qui sont pensées avant tout pour tourner sur des dizaines / centaines de serveurs (voir plus), afin de s'affranchir des problèmes de capacité / puissance des solutions habituelles.

Coté stockage par exemple, avec RadosGW tes fichiers sont éparpillés sur des dizaines de disques différents, pour permettre d'encaisser n'importe quel trafic (tant que le portefeuille suit), et l'accès se fait via une simple API Rest.
Avec ça, tu stockes facilement des To et des To, sans te poser de question.

Coté BDD du coup ça tourne beaucoup autour de principes comme MapReduce qui permet de répartir le travail d'un "SELECT" sur des dizaines de process/CPU/serveurs, afin d'avoir des temps de réponse de dingue, alors que tu interroges une BDD de plusieurs centaines de To quoi.

C'est le genre de technos qu'on retrouve derrière Google, Twitter, Amazon (AWS), Facebook, ou QwantOuvrir dans une nouvelle fenetre . Et OVH mise tout là dedans ces derniers temps.

daevel : infogérance et conseilOuvrir dans une nouvelle fenetre || moiOuvrir dans une nouvelle fenetre

krucial | Jean Christophe
Administrateur

Photo de krucial

Inscrit le : 09/03/2005

# Le 28/04/2014 à 14:42

Le nombre de clients interessés doit etre tout de même assez faible non ?

JC - Mes sitesOuvrir dans une nouvelle fenetre | Affiliation devis travauxOuvrir dans une nouvelle fenetre | Cotes voitures anciennesOuvrir dans une nouvelle fenetre

Bool | Olivier
Modérateur

Photo de Bool

Inscrit le : 09/05/2005

# Le 28/04/2014 à 14:50

C'est aussi une autre approche au problème de tolérance aux pannes, qui du coup concerne beaucoup plus de monde.

Maintenant en plus petit, sur Oogolo avec quelques dizaines de Go de BDD on a certaines requêtes SQL qui prennent 1 à 2 secondes, et qui profiteraient probablement de ce genre de technos.

daevel : infogérance et conseilOuvrir dans une nouvelle fenetre || moiOuvrir dans une nouvelle fenetre

krucial | Jean Christophe
Administrateur

Photo de krucial

Inscrit le : 09/03/2005

# Le 28/04/2014 à 14:56

Pareil pour moi tu me diras.

JC - Mes sitesOuvrir dans une nouvelle fenetre | Affiliation devis travauxOuvrir dans une nouvelle fenetre | Cotes voitures anciennesOuvrir dans une nouvelle fenetre

Rano | Jean
Modérateur

Photo de Rano

Inscrit le : 13/04/2005

# Le 28/04/2014 à 15:10

Oui, c'est ça, je pense que c'est profitable a partir de quelques dizaines ou centaines de Go déjà. Le gros avantage c'est vraiment la scalabilité sans se poser les questions qui arrivent quand tu dois par toi meme aller répartir dans 2, 3 ou 10 serveurs tes données pour que ça tienne. C'est bien gentil de scinder les tables par centaines mais on peut pas le faire pour tout selon ce qu'on fait avec et quand on peut c'est chiant

Avec Hadoop par exemple, apparemment tu te fais vraiment plus du tout chier avec ça. Tu manques de place ? T'ajoutes une machine et hadoop s'occupe de répartir toutes les données sur toutes les machines actives, avec redondances. Les requetes sont trop longues ? Pareil t'ajoute une machine. Et coté dev, tu changes rien, tu interroges le serveur master qui sait ou sont stockées les données et fait faire les calculs aux bons endroits.

Pour l'instant, ça me semble assez abstrait avec un petit côté "magique", mais pourquoi pas, il y en a qui ont du réussir à faire les choses comme il faut !

Chambres d'hote tavelOuvrir dans une nouvelle fenetre
Séjours en provenceOuvrir dans une nouvelle fenetre
Forum mariageOuvrir dans une nouvelle fenetre

Bool | Olivier
Modérateur

Photo de Bool

Inscrit le : 09/05/2005

# Le 28/04/2014 à 15:27

Je n'ai pas testé Hadoop donc, mais par exemple avec Ceph le coté «magique» il prend une claque quand le machin décide qu'il faut déplacer 30To de données parce que t'as ajouté un disque et que ça décale toutes ses règles

daevel : infogérance et conseilOuvrir dans une nouvelle fenetre || moiOuvrir dans une nouvelle fenetre

ratfou | Raphaël
Membre

Photo de ratfou

Inscrit le : 27/09/2008

# Le 28/04/2014 à 19:58

As-tu demandé conseil sur Hadoop auprès de quelques acteurs du domaine comme Pivotal par exemple ?
http://www.gopivotal.com/big-data/pivotal-hdOuvrir dans une nouvelle fenetre

TooLooLooOuvrir dans une nouvelle fenetre
Deviner un mot chaque jourOuvrir dans une nouvelle fenetre
Uni-TOuvrir dans une nouvelle fenetre
DropiziOuvrir dans une nouvelle fenetre

Répondre

Vous ne pouvez pas participer au forum, car votre inscription n'a pas été validée. Pour vous faire valider en tant que Membre, cliquez ici.

© MHN - Tous droits réservés | CNIL N°844440 | 19/04/2024 7:52:16 | Généré en 6.68ms | Contacts | Mentions légales |