- Comprendre les limites des SGBDR
- Quand passer du SGBDR à un système NoSQL
- Systèmes NoSQL
- Paradigmes du Big Data
- Architectures
- Solutions Hadoop
- Visualisation et exploration de la data
- Contribuer à ce guide
- les coûts de la montée en charge verticale
- les coûts en ressources humaines pour mettre en place un tel matériel et assurer son bon fonctionnement, ce qui implique plus de coûts pour héberger plus de données
- les bases de données relationnelles ne sont pas adaptées pour les traitements temps réel
- les prix des licences de logiciels comme Oracle s'ajoutant au prix des machines spécifiques
TODO
- Cohérence
- Disponibilité
- Tolérance au Partitionnement
- Voldemort
- Riak
- DynamoDB
- memcached
- Redis
- OrientDB
- MongoDB
- Elasticsearch
- CouchDB
- RavenDB
- OrientDB
- DocumentDB
- Cassandra
- HBase
- neo4j
- Druid
TODO
Inspiré de la programmation fonctionnelle. Séparation des données et des traitements
Référence : https://blog.matthewrathbone.com/2013/04/17/what-is-hadoop.html
- Job MapReduce Hadoop
- Spark
- Storm
- tolérant aux pannes
- scalable
- modèle d'accès immuable
- Déplacer les calculs vers les données
- simple à mettre en place
- gestion des fichiers par blocs
- réplication et distribution
- gestion des droits
- accès aux données en continu
- stockage des grands jeux de données
- Bash
- Librairies pour chaque langages.
- Rest avec HttpFS et WebHDFS
TODO
TODO
TODO
TODO
TODO
Ce guide est rédigé au format Markdown. N'hésiter pas à le corriger / complémenter par Pull Request.