Spaces:

MaalyAbouOubeid
/

EcosystemBigData

Sleeping

App Files Files Community

fatimataba21 commited on May 15, 2025

Commit

361778e

1 Parent(s): 3a77c5d

ff

Browse files

Files changed (1) hide show

app.py +1 -1

app.py CHANGED Viewed

@@ -39,7 +39,7 @@ questions = [
 ["Q6", "Soit City la table vue en TP contenant les données ouvertes sur les villes du monde vues en TP city.csv (Country_Code, Name, AccentCity, Region, Population, Latitude, Longitude). Après l'exécution des Job MapReduce générés par Hive, à quoi ressembleront les répertoires Hive /user/hive/warehouse/external_city & /user/hive/warehouse/partitioned_city ?", ["Le répertoire /user/hive/warehouse/external_city n'existera pas", "Le répertoire /user/hive/warehouse/external_city existera et contiendra les données des villes", "Le répertoire /user/hive/warehouse/partitioned_city contiendra des sous répertoires de partitionnement des données des villes selon le country_code", "Le répertoire /user/hive/warehouse/partitioned_city n'existera pas"], ["Le répertoire /user/hive/warehouse/external_city n'existera pas", "Le répertoire /user/hive/warehouse/partitioned_city contiendra des sous répertoires de partitionnement des données des villes selon le country_code"]],
 ["Q7", "Which element of Big Data Platform can cost-effectively store and manage many petabytes of structured and unstructured information ?", ["Stream Computing", "Hadoop System", "Data Warehouse", "Contextual Discovery"], "Hadoop System"],
 ["Q8", "Qu'est ce qui rend l'accès aux données du Datalake Hadoop difficile ?", ["Les données sont localisées dans un système distribué", "Les données sont de formats multiples", "Hadoop requiert un schéma pré-défini", "Les données du DataLake Hadoop sont hautement structurées"], "Les données sont de formats multiples"],
-["Q9", "Data Flow Languages correspondent à (choisir la plus convenable)", ["x0 op x1 op x2. . . . op xn-1 op xn", "Map renvoie des paires < word, pageID > et Reduce renvoie < word, list(pageID) >", "[ op ( x0 ), . . . , op ( xn ) ]", "Traitements parallèles en Batch en mémoire sur des données réparties", "la modification d'une portion d'un fichier, l'on doit écraser le fichier", "Techniques de micro-batching", "Sort-Copy-Merge", "Map renvoie des paires <pageID,1> et Reduce renvoie <pageID, reduce(+)[ 1, . . . , 1 ]>", "couche de programmation médiatrice de type ETL", "Traitements parallèles en Batch sur des données au repos sur disques distribués"], "Traitements parallèles en Batch en mémoire sur des données réparties"],
 ["Q10", "Quelle architecture Big Data intègre d'une manière optimisée les deux architectures de Batch processing et de Stream Processing tout en mettant l'accent sur le dernier usage temps réel ?", ["SMACK", "AKKA", "LAMBDA", "RTAP (Real Time Analysis processing)", "KAPPA", "KAFKA", "Data Lake"], "LAMBDA"],
 ["Q11", "Shuffle", ["[op(x0),...,op(xn)]", "Traitements parallèles en Batch en mémoire sur des données réparties", "Techniques de micro-batching", "Map renvoie des paires <word, pageID> et Reduce renvoie <word, list(pageID)>", "couche de programmation médiatrice de type ETL entre zone production données & big data lake ou entre le big data lake & le datawarehousing ou le sandbox analytics", "x0 op x1 op x2 ... op xn-1 op xn", "Sort-Copy-Merge", "Traitements parallèles en Batch sur des données au repos sur disques distribués", "la modification d'une portion d'un fichier, on doit écraser le fichier", "Map renvoie des paires <pageID,1> et Reduce renvoie <pageID, reduce(+)[1,...,1]>"], "Sort-Copy-Merge"],
 ["Q12", "Quel composant constitue le framework logiciel de calcul distribué sur un cluster de machines bon marché de base (commodity hardware)", ["OLAP", "Parallel Processing", "Map Reduce", "Stream Processing"], "Map Reduce"],

 ["Q6", "Soit City la table vue en TP contenant les données ouvertes sur les villes du monde vues en TP city.csv (Country_Code, Name, AccentCity, Region, Population, Latitude, Longitude). Après l'exécution des Job MapReduce générés par Hive, à quoi ressembleront les répertoires Hive /user/hive/warehouse/external_city & /user/hive/warehouse/partitioned_city ?", ["Le répertoire /user/hive/warehouse/external_city n'existera pas", "Le répertoire /user/hive/warehouse/external_city existera et contiendra les données des villes", "Le répertoire /user/hive/warehouse/partitioned_city contiendra des sous répertoires de partitionnement des données des villes selon le country_code", "Le répertoire /user/hive/warehouse/partitioned_city n'existera pas"], ["Le répertoire /user/hive/warehouse/external_city n'existera pas", "Le répertoire /user/hive/warehouse/partitioned_city contiendra des sous répertoires de partitionnement des données des villes selon le country_code"]],
 ["Q7", "Which element of Big Data Platform can cost-effectively store and manage many petabytes of structured and unstructured information ?", ["Stream Computing", "Hadoop System", "Data Warehouse", "Contextual Discovery"], "Hadoop System"],
 ["Q8", "Qu'est ce qui rend l'accès aux données du Datalake Hadoop difficile ?", ["Les données sont localisées dans un système distribué", "Les données sont de formats multiples", "Hadoop requiert un schéma pré-défini", "Les données du DataLake Hadoop sont hautement structurées"], "Les données sont de formats multiples"],
+["Q9", "Data Flow Languages correspondent à (choisir la plus convenable)", ["x0 op x1 op x2. . . . op xn-1 op xn", "Map renvoie des paires < word, pageID > et Reduce renvoie < word, list(pageID) >", "[ op ( x0 ), . . . , op ( xn ) ]", "Traitements parallèles en Batch en mémoire sur des données réparties", "la modification d'une portion d'un fichier, l'on doit écraser le fichier", "Techniques de micro-batching", "Sort-Copy-Merge", "Map renvoie des paires <pageID,1> et Reduce renvoie <pageID, reduce(+)[ 1, . . . , 1 ]>", "couche de programmation médiatrice de type ETL", "Traitements parallèles en Batch sur des données au repos sur disques distribués"], "Traitements parallèles en Batch sur des données au repos sur disques distribués"],
 ["Q10", "Quelle architecture Big Data intègre d'une manière optimisée les deux architectures de Batch processing et de Stream Processing tout en mettant l'accent sur le dernier usage temps réel ?", ["SMACK", "AKKA", "LAMBDA", "RTAP (Real Time Analysis processing)", "KAPPA", "KAFKA", "Data Lake"], "LAMBDA"],
 ["Q11", "Shuffle", ["[op(x0),...,op(xn)]", "Traitements parallèles en Batch en mémoire sur des données réparties", "Techniques de micro-batching", "Map renvoie des paires <word, pageID> et Reduce renvoie <word, list(pageID)>", "couche de programmation médiatrice de type ETL entre zone production données & big data lake ou entre le big data lake & le datawarehousing ou le sandbox analytics", "x0 op x1 op x2 ... op xn-1 op xn", "Sort-Copy-Merge", "Traitements parallèles en Batch sur des données au repos sur disques distribués", "la modification d'une portion d'un fichier, on doit écraser le fichier", "Map renvoie des paires <pageID,1> et Reduce renvoie <pageID, reduce(+)[1,...,1]>"], "Sort-Copy-Merge"],
 ["Q12", "Quel composant constitue le framework logiciel de calcul distribué sur un cluster de machines bon marché de base (commodity hardware)", ["OLAP", "Parallel Processing", "Map Reduce", "Stream Processing"], "Map Reduce"],