Le Big Data est le nouveau domaine technologique créé par les géants du web pour faire face et gérer un volume de données sans cesse en expansion et permettre un accès rapide et en temps réel aux bases de données géantes.
le Big Data, dit aussi en français mégadonnées ou grandes données, regroupe une famille d'outils qui répondent à une triple problématiques :
- Volume de données important à traiter.
- Variété grande, d'informations (en provenance de plusieurs sources, non-structurées, structurées, Opendata...).
- Vélocité à atteindre, en termes de fréquence de création, de collecte, de traitement/analyse et de partage de données.
C'est ce qu'on appelle la règle dite des 3V.
Le Big Data utilise un certain nombre d'outils et de technologies pour l'optimisation des temps de traitement sur les bases de données, entre autres:
* L'utilisation des bases de données NoSQL, en lieu et place des bases de données SQL, car elles permettent d'implémenter des systèmes de stockage plus performants.
* L'utilisation du principe du traitement massivement parallèle, basé sur de nouvelles infrastructures de serveurs qui permettent la distribution et le traitement des informations à un niveau pouvant atteindre des milliers de noeuds, à titre d'exemple, on trouve parmi ces technologies, le framework Hadoop, ou encore Apache Spark.
* L'utilisation de la technique de stockage des données en mémoire (Memtables) afin de permettre l'accélération des vitesses de traitement des requêtes.
Aucun commentaire:
Enregistrer un commentaire