#Instalación de librerías
install.packages("tidyverse")
library(tidyverse)
#Instalación de cluster y factorextra
install.packages("cluster")
install.packages("factoextra")
library(cluster)
library(factoextra)
install.packages("reshape2")
library(reshape2)

Installing package into ‘/usr/local/lib/R/site-library’
(as ‘lib’ is unspecified)

── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
✔ dplyr     1.1.4     ✔ readr     2.1.5
✔ forcats   1.0.0     ✔ stringr   1.5.1
✔ ggplot2   3.5.2     ✔ tibble    3.3.0
✔ lubridate 1.9.4     ✔ tidyr     1.3.1
✔ purrr     1.1.0     
── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
✖ dplyr::filter() masks stats::filter()
✖ dplyr::lag()    masks stats::lag()
ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
Installing package into ‘/usr/local/lib/R/site-library’
(as ‘lib’ is unspecified)

Installing package into ‘/usr/local/lib/R/site-library’
(as ‘lib’ is unspecified)

also installing the dependencies ‘rbibutils’, ‘Deriv’, ‘microbenchmark’, ‘Rdpack’, ‘doBy’, ‘SparseM’, ‘MatrixModels’, ‘minqa’, ‘nloptr’, ‘reformulas’, ‘RcppEigen’, ‘lazyeval’, ‘carData’, ‘Formula’, ‘pbkrtest’, ‘quantreg’, ‘lme4’, ‘crosstalk’, ‘estimability’, ‘mvtnorm’, ‘numDeriv’, ‘corrplot’, ‘viridis’, ‘car’, ‘DT’, ‘ellipse’, ‘emmeans’, ‘flashClust’, ‘leaps’, ‘multcompView’, ‘scatterplot3d’, ‘ggsci’, ‘cowplot’, ‘ggsignif’, ‘gridExtra’, ‘polynom’, ‘rstatix’, ‘plyr’, ‘abind’, ‘dendextend’, ‘FactoMineR’, ‘ggpubr’, ‘reshape2’, ‘ggrepel’


Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa

Installing package into ‘/usr/local/lib/R/site-library’
(as ‘lib’ is unspecified)


Attaching package: ‘reshape2’


The following object is masked from ‘package:tidyr’:

    smiths

#carga la tabla de datos en el entorno de R
df<-read.csv("/content/comidasrapidas.csv")
#Previsualización del archivo de datos (las seis primeras filas)
head(df)

#Conversión de las variables a factores
df$genero<-as.factor(df$genero)
df$nse<-as.factor(df$nse)
summary(df)

    genero      nse         promos          servicio         particip     
 Hombre:50   Alto :32   Min.   : 1.000   Min.   : 3.000   Min.   : 5.000  
 Mujer :54   Bajo :54   1st Qu.: 2.000   1st Qu.: 5.000   1st Qu.: 8.000  
             Medio:18   Median : 8.000   Median : 7.500   Median : 8.000  
                        Mean   : 6.365   Mean   : 7.385   Mean   : 8.327  
                        3rd Qu.: 9.000   3rd Qu.: 9.000   3rd Qu.: 9.000  
                        Max.   :10.000   Max.   :10.000   Max.   :10.000  
    ubicació        domicilios        rapidez         horarios     
 Min.   : 2.000   Min.   : 1.000   Min.   : 4.00   Min.   : 5.000  
 1st Qu.: 4.000   1st Qu.: 4.000   1st Qu.: 6.75   1st Qu.: 8.000  
 Median : 7.000   Median : 7.000   Median : 9.00   Median : 9.000  
 Mean   : 6.808   Mean   : 6.827   Mean   : 8.01   Mean   : 8.615  
 3rd Qu.: 9.250   3rd Qu.: 9.250   3rd Qu.: 9.00   3rd Qu.:10.000  
 Max.   :10.000   Max.   :10.000   Max.   :10.00   Max.   :10.000  
   moviliario       recomend           edad      
 Min.   : 0.00   Min.   : 5.000   Min.   :18.00  
 1st Qu.: 2.00   1st Qu.: 7.000   1st Qu.:33.00  
 Median : 8.00   Median : 9.000   Median :47.00  
 Mean   : 6.50   Mean   : 8.404   Mean   :45.39  
 3rd Qu.: 9.25   3rd Qu.:10.000   3rd Qu.:55.00  
 Max.   :10.00   Max.   :10.000   Max.   :72.00

#Omisión de variables no escalares: vamos a separar de la base de modelado de las columnas que no se usarán en el modelo
cluster1data<-subset(df, select=c(promos,servicio,particip,ubicació,domicilios,rapidez,horarios,moviliario,recomend,edad))
#Miramos las 6 primeras filas de nuestra base
head(cluster1data)
#Mostramos estadísticas de nuestra base
summary(cluster1data)
par(mfrow=c(3,3))
# Matriz de boxplots
boxplot(cluster1data$promos)
boxplot(cluster1data$servicio)
boxplot(cluster1data$particip)
boxplot(cluster1data$ubicació)
boxplot(cluster1data$domicilios)
boxplot(cluster1data$rapidez)
boxplot(cluster1data$horarios)
boxplot(cluster1data$moviliario)
boxplot(cluster1data$recomend)
boxplot(cluster1data$edad)

     promos          servicio         particip         ubicació     
 Min.   : 1.000   Min.   : 3.000   Min.   : 5.000   Min.   : 2.000  
 1st Qu.: 2.000   1st Qu.: 5.000   1st Qu.: 8.000   1st Qu.: 4.000  
 Median : 8.000   Median : 7.500   Median : 8.000   Median : 7.000  
 Mean   : 6.365   Mean   : 7.385   Mean   : 8.327   Mean   : 6.808  
 3rd Qu.: 9.000   3rd Qu.: 9.000   3rd Qu.: 9.000   3rd Qu.: 9.250  
 Max.   :10.000   Max.   :10.000   Max.   :10.000   Max.   :10.000  
   domicilios        rapidez         horarios        moviliario   
 Min.   : 1.000   Min.   : 4.00   Min.   : 5.000   Min.   : 0.00  
 1st Qu.: 4.000   1st Qu.: 6.75   1st Qu.: 8.000   1st Qu.: 2.00  
 Median : 7.000   Median : 9.00   Median : 9.000   Median : 8.00  
 Mean   : 6.827   Mean   : 8.01   Mean   : 8.615   Mean   : 6.50  
 3rd Qu.: 9.250   3rd Qu.: 9.00   3rd Qu.:10.000   3rd Qu.: 9.25  
 Max.   :10.000   Max.   :10.00   Max.   :10.000   Max.   :10.00  
    recomend           edad      
 Min.   : 5.000   Min.   :18.00  
 1st Qu.: 7.000   1st Qu.:33.00  
 Median : 9.000   Median :47.00  
 Mean   : 8.404   Mean   :45.39  
 3rd Qu.:10.000   3rd Qu.:55.00  
 Max.   :10.000   Max.   :72.00

#Descarte de valores nulos: sobre la base filtrada
cluster1data<-na.omit(cluster1data)

#Pasamos la base a valores estandarizados
cluster2data<-scale(cluster1data)
summary(cluster2data)
head(cluster2data)
boxplot.matrix(cluster2data) #funciona porque es una matriz resultante del scale

     promos           servicio           particip          ubicació       
 Min.   :-1.5340   Min.   :-1.95026   Min.   :-2.7859   Min.   :-1.64466  
 1st Qu.:-1.2481   1st Qu.:-1.06067   1st Qu.:-0.2738   1st Qu.:-0.96048  
 Median : 0.4673   Median : 0.05132   Median :-0.2738   Median : 0.06579  
 Mean   : 0.0000   Mean   : 0.00000   Mean   : 0.0000   Mean   : 0.00000  
 3rd Qu.: 0.7532   3rd Qu.: 0.71852   3rd Qu.: 0.5636   3rd Qu.: 0.83549  
 Max.   : 1.0391   Max.   : 1.16331   Max.   : 1.4010   Max.   : 1.09205  
   domicilios          rapidez           horarios         moviliario     
 Min.   :-1.98575   Min.   :-2.1783   Min.   :-2.9134   Min.   :-1.8688  
 1st Qu.:-0.96338   1st Qu.:-0.6843   1st Qu.:-0.4959   1st Qu.:-1.2938  
 Median : 0.05898   Median : 0.5380   Median : 0.3099   Median : 0.4313  
 Mean   : 0.00000   Mean   : 0.0000   Mean   : 0.0000   Mean   : 0.0000  
 3rd Qu.: 0.82576   3rd Qu.: 0.5380   3rd Qu.: 1.1158   3rd Qu.: 0.7907  
 Max.   : 1.08135   Max.   : 1.0813   Max.   : 1.1158   Max.   : 1.0063  
    recomend            edad        
 Min.   :-2.3449   Min.   :-1.8769  
 1st Qu.:-0.9671   1st Qu.:-0.8492  
 Median : 0.4107   Median : 0.1100  
 Mean   : 0.0000   Mean   : 0.0000  
 3rd Qu.: 1.0996   3rd Qu.: 0.6581  
 Max.   : 1.0996   Max.   : 1.8229

#Cálculo de las distancias
distancia1 <- get_dist(cluster2data)
fviz_dist(distancia1, gradient = list(low = "#00AFBB", mid = "white", high = "#FC4E07"))

#Diagrama de sedimentación para Kmeans: búsqueda de grupos óptimos
kmopt<-fviz_nbclust(cluster2data,FUNcluster = kmeans, k.max=15)
kmopt

#Se construye el cluster usando el método kmeans
clusterkm <- kmeans(x = cluster2data, centers = 2)
clusterkm

K-means clustering with 2 clusters of sizes 64, 40

Cluster means:
     promos   servicio   particip   ubicació domicilios    rapidez    horarios
1  0.744301  0.4544182  0.1972710  0.6003007  0.7086109  0.2494319  0.08329541
2 -1.190882 -0.7270691 -0.3156336 -0.9604811 -1.1337774 -0.3990910 -0.13327266
   moviliario   recomend       edad
1 -0.01347724  0.1092951  0.1175148
2  0.02156358 -0.1748722 -0.1880237

Clustering vector:
  1   2   3   4   5   6   7   8   9  10  11  12  13  14  15  16  17  18  19  20 
  2   2   2   2   2   2   2   2   2   2   2   2   2   2   2   2   2   2   2   2 
 21  22  23  24  25  26  27  28  29  30  31  32  33  34  35  36  37  38  39  40 
  2   2   2   2   2   2   2   2   2   2   2   2   2   2   2   2   2   2   2   2 
 41  42  43  44  45  46  47  48  49  50  51  52  53  54  55  56  57  58  59  60 
  1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1 
 61  62  63  64  65  66  67  68  69  70  71  72  73  74  75  76  77  78  79  80 
  1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1 
 81  82  83  84  85  86  87  88  89  90  91  92  93  94  95  96  97  98  99 100 
  1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1 
101 102 103 104 
  1   1   1   1 

Within cluster sum of squares by cluster:
[1] 425.0832 312.5558
 (between_SS / total_SS =  28.4 %)

Available components:

[1] "cluster"      "centers"      "totss"        "withinss"     "tot.withinss"
[6] "betweenss"    "size"         "iter"         "ifault"

#Diagrama de elipses para representar los clusters creados
fviz_cluster(object=clusterkm,data=cluster2data,ellipse.type="t",repel=TRUE)

#Se construye el cluster usando el método pam
clusterpam <- pam(x = cluster2data, k = 2)
clusterpam

Medoids:
   ID     promos   servicio   particip   ubicació domicilios    rapidez
18 18 -1.2480615 -1.5054608 -0.2737638 -1.3025703 -0.9633831 -1.0917541
65 65  0.7532353  0.7185154  0.5636314  0.7499647  0.7405598  0.5380415
    horarios moviliario   recomend       edad
18 0.3099364  0.4312716 -0.9670964 -0.3695911
65 0.3099364  0.7187860  0.4106848  0.1785369
Clustering vector:
  1   2   3   4   5   6   7   8   9  10  11  12  13  14  15  16  17  18  19  20 
  1   1   1   1   1   1   1   1   1   1   1   1   2   1   1   1   1   1   1   1 
 21  22  23  24  25  26  27  28  29  30  31  32  33  34  35  36  37  38  39  40 
  1   1   1   1   1   1   1   1   1   1   1   2   1   1   2   2   1   1   1   1 
 41  42  43  44  45  46  47  48  49  50  51  52  53  54  55  56  57  58  59  60 
  2   2   2   2   2   2   2   2   2   2   2   2   2   2   2   2   2   2   2   2 
 61  62  63  64  65  66  67  68  69  70  71  72  73  74  75  76  77  78  79  80 
  2   2   2   2   2   2   2   2   2   2   2   2   2   2   2   2   2   2   2   2 
 81  82  83  84  85  86  87  88  89  90  91  92  93  94  95  96  97  98  99 100 
  1   2   2   2   1   2   2   2   2   2   2   2   2   2   2   2   2   2   2   2 
101 102 103 104 
  1   2   2   2 
Objective function:
   build     swap 
2.862459 2.672613 

Available components:
 [1] "medoids"    "id.med"     "clustering" "objective"  "isolation" 
 [6] "clusinfo"   "silinfo"    "diss"       "call"       "data"

#Diagrama de elipses para representar los clusters creados
fviz_cluster(object = clusterpam, data = cluster2data, ellipse.type = "t",
             repel = TRUE) +
  theme_bw() +
  labs(title = "Resultados clustering con dos grupos") +
  theme(legend.position = "none")

#Se construye el cluster usando el método CLARA
clusterclara <- clara(x = cluster2data, k=2)
clusterclara

Call:	 clara(x = cluster2data, k = 2) 
Medoids:
       promos   servicio   particip   ubicació domicilios    rapidez  horarios
18 -1.2480615 -1.5054608 -0.2737638 -1.3025703 -0.9633831 -1.0917541 0.3099364
64  0.7532353  0.7185154  0.5636314  0.7499647  0.7405598  0.5380415 0.3099364
   moviliario   recomend        edad
18  0.4312716 -0.9670964 -0.36959113
64  0.7187860  0.4106848 -0.02701112
Objective function:	 2.673715
Clustering vector: 	 Named int [1:104] 1 1 1 1 1 1 1 1 1 1 1 1 2 1 1 1 1 1 ...
 - attr(*, "names")= chr [1:104] "1" "2" "3" "4" "5" "6" "7" ...
Cluster sizes:	    	 37 67 
Best sample:
 [1] 1   2   4   5   7   8   14  16  18  19  20  22  23  36  37  38  42  45  46 
[20] 48  52  54  55  57  60  62  63  64  67  70  73  75  76  77  78  79  86  88 
[39] 89  90  94  95  97  102

Available components:
 [1] "sample"     "medoids"    "i.med"      "clustering" "objective" 
 [6] "clusinfo"   "diss"       "call"       "silinfo"    "data"

#Diagrama de elipses para representar los clusters creados
fviz_cluster(object = clusterclara, data = cluster2data, ellipse.type = "t",
             repel = TRUE) +
  theme_bw() +
  labs(title = "Resultados clustering con dos grupos") +
  theme(legend.position = "none")

# 1. Calcular matriz de distancias
ds <- dist(cluster2data, method = "euclidean")

# 2. Crear el modelo jerárquico (esto no crea grupos aún)
hc <- hclust(ds, method = "ward.D")

# 3. Visualizar el dendrograma (estructura de agrupamiento)
plot(hc)

# 4. Cortar el dendrograma en k grupos → Aquí obtienes los clusters reales
clusterjerarquico <- cutree(hc, k = 2)

# Visualizar los clusters sobre componentes principales
fviz_cluster(list(data = cluster2data, cluster = clusterjerarquico))

# Unimos los datos originales con los grupos asignados por k-means
datosfinales <- cbind(df, clusterkm$cluster)

# Renombramos la nueva columna que indica el grupo
colnames(datosfinales)[13] <- "C-kmeans"

# Mostramos las primeras filas
head(datosfinales)

#Revisando características sobre variables escalares
aggregate(datosfinales$promos ~ datosfinales$"C-kmeans", FUN=mean)
aggregate(datosfinales$servicio ~ datosfinales$"C-kmeans", FUN=mean)
aggregate(datosfinales$particip ~ datosfinales$"C-kmeans", FUN=mean)
aggregate(datosfinales$ubicació ~ datosfinales$"C-kmeans", FUN=mean)
aggregate(datosfinales$rapidez ~ datosfinales$"C-kmeans", FUN=mean)
aggregate(datosfinales$horarios ~ datosfinales$"C-kmeans", FUN=mean)
aggregate(datosfinales$moviliario ~ datosfinales$"C-kmeans", FUN=mean)
aggregate(datosfinales$recomend ~ datosfinales$"C-kmeans", FUN=mean)
aggregate(datosfinales$edad ~ datosfinales$"C-kmeans", FUN=mean)

table(datosfinales$"C-kmeans")
#Comparación del cluster con las demás variables
table(datosfinales$genero,datosfinales$"C-kmeans")
#Comparación del cluster con las demás variables
table(datosfinales$nse,datosfinales$"C-kmeans")

 1  2 
64 40

        
          1  2
  Hombre 28 22
  Mujer  36 18

       
         1  2
  Alto   2 30
  Bajo  54  0
  Medio  8 10

# Unimos los datos originales con los grupos asignados por PAM
datosfinales <- cbind(datosfinales, clusterpam$cluster)

# Renombramos la nueva columna que indica el grupo
colnames(datosfinales)[14] <- "C-pam"

# Mostramos las primeras filas
head(datosfinales)

#Revisando características sobre variables escalares
aggregate(datosfinales$promos ~ datosfinales$"C-pam", FUN=mean)
aggregate(datosfinales$servicio ~ datosfinales$"C-pam", FUN=mean)
aggregate(datosfinales$particip ~ datosfinales$"C-pam", FUN=mean)
aggregate(datosfinales$ubicació ~ datosfinales$"C-pam", FUN=mean)
aggregate(datosfinales$rapidez ~ datosfinales$"C-pam", FUN=mean)
aggregate(datosfinales$horarios ~ datosfinales$"C-pam", FUN=mean)
aggregate(datosfinales$moviliario ~ datosfinales$"C-pam", FUN=mean)
aggregate(datosfinales$recomend ~ datosfinales$"C-pam", FUN=mean)
aggregate(datosfinales$edad ~ datosfinales$"C-pam", FUN=mean)

table(datosfinales$"C-pam")
#Comparación del cluster con las demás variables
table(datosfinales$genero,datosfinales$"C-pam")
#Comparación del cluster con las demás variables
table(datosfinales$nse,datosfinales$"C-pam")

 1  2 
39 65

        
          1  2
  Hombre 22 28
  Mujer  17 37

       
         1  2
  Alto  29  3
  Bajo   2 52
  Medio  8 10

# Unimos los datos originales con los grupos asignados por CLARA
datosfinales <- cbind(datosfinales, clusterclara$cluster)

# Renombramos la nueva columna que indica el grupo
colnames(datosfinales)[15] <- "C-clara"

# Mostramos las primeras filas
head(datosfinales)

#Revisando características sobre variables escalares
aggregate(datosfinales$promos ~ datosfinales$"C-clara", FUN=mean)
aggregate(datosfinales$servicio ~ datosfinales$"C-clara", FUN=mean)
aggregate(datosfinales$particip ~ datosfinales$"C-clara", FUN=mean)
aggregate(datosfinales$ubicació ~ datosfinales$"C-clara", FUN=mean)
aggregate(datosfinales$rapidez ~ datosfinales$"C-clara", FUN=mean)
aggregate(datosfinales$horarios ~ datosfinales$"C-clara", FUN=mean)
aggregate(datosfinales$moviliario ~ datosfinales$"C-clara", FUN=mean)
aggregate(datosfinales$recomend ~ datosfinales$"C-clara", FUN=mean)
aggregate(datosfinales$edad ~ datosfinales$"C-clara", FUN=mean)

table(datosfinales$"C-clara")
#Comparación del cluster con las demás variables
table(datosfinales$genero,datosfinales$"C-clara")
#Comparación del cluster con las demás variables
table(datosfinales$nse,datosfinales$"C-clara")

 1  2 
37 67

        
          1  2
  Hombre 21 29
  Mujer  16 38

       
         1  2
  Alto  28  4
  Bajo   1 53
  Medio  8 10

# Unimos el cluster jerárquico al data frame
datosfinales <- cbind(datosfinales, clusterjerarquico)

# Renombramos la nueva columna que indica el cluster jerárquico
colnames(datosfinales)[ncol(datosfinales)] <- "C-jerarquico"

# Mostramos las primeras filas
head(datosfinales)

#Revisando características sobre variables escalares
aggregate(datosfinales$promos ~ datosfinales$"C-jerarquico", FUN=mean)
aggregate(datosfinales$servicio ~ datosfinales$"C-jerarquico", FUN=mean)
aggregate(datosfinales$particip ~ datosfinales$"C-jerarquico", FUN=mean)
aggregate(datosfinales$ubicació ~ datosfinales$"C-jerarquico", FUN=mean)
aggregate(datosfinales$rapidez ~ datosfinales$"C-jerarquico", FUN=mean)
aggregate(datosfinales$horarios ~ datosfinales$"C-jerarquico", FUN=mean)
aggregate(datosfinales$moviliario ~ datosfinales$"C-jerarquico", FUN=mean)
aggregate(datosfinales$recomend ~ datosfinales$"C-jerarquico", FUN=mean)
aggregate(datosfinales$edad ~ datosfinales$"C-jerarquico", FUN=mean)

table(datosfinales$"C-jerarquico")
#Comparación del cluster con las demás variables
table(datosfinales$genero,datosfinales$"C-jerarquico")
#Comparación del cluster con las demás variables
table(datosfinales$nse,datosfinales$"C-jerarquico")

 1  2 
41 63

        
          1  2
  Hombre 23 27
  Mujer  18 36

       
         1  2
  Alto  29  3
  Bajo   1 53
  Medio 11  7

#Utilizando el metodo daisy
gower.dist <- daisy(df, metric = c("gower"))
d<-as.matrix(gower.dist)

#Creando gráfico de sedimentación
sedimentationmap<-fviz_nbclust(d,FUNcluster=pam,method="silhouette",k.max=15,diss=dist(d,method="manhattan"))
sedimentationmap

#Se construye el cluster usando el método kmeans
clusterkm2 <- kmeans(x = d, centers = 3)
clusterkm2

K-means clustering with 3 clusters of sizes 42, 27, 35

Cluster means:
          1         2         3         4         5         6         7
1 0.3614240 0.2891870 0.3248362 0.3169312 0.3748068 0.3177732 0.2889666
2 0.4065795 0.5391110 0.5620926 0.4543700 0.6426253 0.4785959 0.6039258
3 0.4833258 0.6021479 0.6111338 0.5250000 0.5328710 0.3792693 0.5012661
          8         9        10        11        12        13        14
1 0.3356156 0.3016797 0.2664000 0.3144768 0.3264529 0.3133493 0.3172588
2 0.3853632 0.4820579 0.4780848 0.4641551 0.5374698 0.4355575 0.5695637
3 0.4639607 0.5415571 0.5279856 0.5342593 0.4336382 0.3471441 0.4652343
         15        16        17        18        19        20        21
1 0.2885556 0.2918877 0.3203016 0.2495344 0.2779001 0.2567361 0.3108219
2 0.5034494 0.4843430 0.5658979 0.4609254 0.4824731 0.5407722 0.5450360
3 0.5709464 0.5390643 0.4692797 0.5180187 0.5500028 0.4319076 0.4497471
         22        23        24        25        26        27        28
1 0.3244168 0.3080105 0.3108219 0.2508572 0.2900106 0.2764891 0.3085144
2 0.5596108 0.4415675 0.5450360 0.4190987 0.4781293 0.5185614 0.5685042
3 0.6256289 0.4913042 0.4497471 0.4791563 0.5481510 0.4271192 0.4664755
         29        30        31        32        33        34        35
1 0.3533321 0.3122533 0.2874927 0.3286554 0.3202045 0.2804968 0.3501176
2 0.4900328 0.4930621 0.4239116 0.4299277 0.5033616 0.4161041 0.3713763
3 0.3928212 0.3881034 0.4773060 0.3295232 0.4037207 0.4735582 0.4431204
         36        37        38        39        40        41        42
1 0.3725309 0.3076069 0.3957761 0.3179537 0.3242888 0.3957677 0.4131839
2 0.3714449 0.3515546 0.6162907 0.3660608 0.4873469 0.3981804 0.3203340
3 0.4417271 0.4166805 0.5177586 0.4347140 0.3853953 0.3105061 0.2329047
         43        44        45        46        47        48        49
1 0.3691069 0.4249711 0.5112597 0.4603358 0.4581606 0.4526492 0.5350340
2 0.3499522 0.3086857 0.3596663 0.1703104 0.2526835 0.1642061 0.2781158
3 0.2537248 0.2121022 0.2799411 0.2671923 0.1793263 0.2616897 0.1964147
         50        51        52        53        54        55        56
1 0.3530024 0.4779704 0.5241365 0.4586603 0.4922876 0.5179117 0.3854392
2 0.3908616 0.2942799 0.2931499 0.2345422 0.1822788 0.2785045 0.3950111
3 0.2800718 0.2198353 0.3940530 0.1631447 0.2876949 0.2022172 0.2860947
         57        58        59        60        61        62        63
1 0.4804417 0.4654505 0.4597485 0.4798585 0.4703305 0.4293252 0.4714029
2 0.2510259 0.1579761 0.2662160 0.2624943 0.1853403 0.3300020 0.2382802
3 0.1769366 0.2496879 0.3791723 0.3645377 0.2969413 0.2356450 0.1627831
         64        65        66        67        68        69        70
1 0.4677285 0.4680960 0.4642012 0.4600125 0.4396133 0.4851007 0.4700213
2 0.2294782 0.2288495 0.1463735 0.1469450 0.3299448 0.1725966 0.2418467
3 0.1542293 0.1540971 0.2415309 0.2385327 0.2397455 0.2773334 0.1693087
         71        72        73        74        75        76        77
1 0.4600125 0.4598660 0.4605169 0.4812799 0.4411565 0.4666262 0.4994158
2 0.1469450 0.2797962 0.2025034 0.1796705 0.3040989 0.2721051 0.2535408
3 0.2385327 0.3866856 0.3176946 0.2794633 0.2123998 0.1940618 0.1768484
         78        79        80        81        82        83        84
1 0.4949919 0.4579549 0.4537221 0.3988872 0.4793688 0.5620034 0.4753674
2 0.2936528 0.1852852 0.1692701 0.3186622 0.1798897 0.2177592 0.3493256
3 0.2260459 0.2746173 0.2651729 0.2217649 0.2870336 0.3087604 0.2668506
         85        86        87        88        89        90        91
1 0.4551041 0.5553897 0.5540669 0.5525237 0.4628202 0.4184597 0.5601663
2 0.2788017 0.2830884 0.2805164 0.2735433 0.4451254 0.2807956 0.2777157
3 0.3615974 0.2051008 0.2023230 0.1968556 0.3648602 0.3729441 0.2038662
         92        93        94        95        96        97        98
1 0.5491434 0.5533321 0.5165743 0.4719136 0.4793840 0.5407365 0.5201016
2 0.1918104 0.1953540 0.1675191 0.3362940 0.2642384 0.2851917 0.2506238
3 0.2846863 0.2881255 0.2616264 0.2508718 0.3434845 0.2176581 0.1743248
         99       100       101       102       103       104
1 0.5318741 0.4646133 0.4743239 0.5473650 0.5103280 0.5540963
2 0.3120779 0.4133582 0.4051783 0.3147985 0.2064309 0.1977317
3 0.2398980 0.3253628 0.4881204 0.2461413 0.2947128 0.2987428

Clustering vector:
  1   2   3   4   5   6   7   8   9  10  11  12  13  14  15  16  17  18  19  20 
  1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1 
 21  22  23  24  25  26  27  28  29  30  31  32  33  34  35  36  37  38  39  40 
  1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1 
 41  42  43  44  45  46  47  48  49  50  51  52  53  54  55  56  57  58  59  60 
  3   3   3   3   3   2   3   2   3   3   3   2   3   2   3   3   3   2   2   2 
 61  62  63  64  65  66  67  68  69  70  71  72  73  74  75  76  77  78  79  80 
  2   3   3   3   3   2   2   3   2   3   2   2   2   2   3   3   3   3   2   2 
 81  82  83  84  85  86  87  88  89  90  91  92  93  94  95  96  97  98  99 100 
  3   2   2   3   2   3   3   3   1   2   3   2   2   2   3   2   3   3   3   3 
101 102 103 104 
  1   3   2   2 

Within cluster sum of squares by cluster:
[1] 41.11882 15.84828 24.17193
 (between_SS / total_SS =  61.7 %)

Available components:

[1] "cluster"      "centers"      "totss"        "withinss"     "tot.withinss"
[6] "betweenss"    "size"         "iter"         "ifault"

#Diagrama de elipses para representar los clusters creados
fviz_cluster(object=clusterkm2,data=d,ellipse.type="t",repel=TRUE)

#Se construye el cluster usando el método PAM
clusterpam2<-pam(d,k=3,metric="euclidean")

#Diagrama de elipses para representar los clusters creados
fviz_cluster(object=clusterpam2,data=d,ellipse.type="t",repel=TRUE)+theme_bw()+labs(title="Resultado análisis clúster") +theme(legend.position="none")

#Se construye el cluster usando el método CLARA
clusterclara2 <- clara(x = d, k=3)
clusterclara2

Call:	 clara(x = d, k = 3) 
Medoids:
           1         2         3         4         5         6         7
10 0.2907848 0.1522046 0.1299383 0.2702822 0.3043210 0.2630071 0.2077601
51 0.5339175 0.6022817 0.5966821 0.5481371 0.5210648 0.4228064 0.4788250
71 0.3802138 0.5295304 0.5239308 0.4372906 0.6149802 0.4357694 0.5974317
           8         9        10        11        12        13        14
10 0.2179453 0.1839947 0.0000000 0.2196649 0.2731481 0.3028219 0.2812169
51 0.5055225 0.5248126 0.5167438 0.5740631 0.3559414 0.3157077 0.4275904
71 0.3518188 0.4403329 0.4230049 0.4545745 0.4905974 0.3657077 0.5375551
          15        16        17         18        19        20        21
10 0.2250992 0.1629299 0.3667659 0.06830908 0.1926918 0.1408399 0.3374449
51 0.5506393 0.5458774 0.5089727 0.52718254 0.5089727 0.4330467 0.4642196
71 0.5112213 0.4588404 0.5695547 0.42109788 0.4911596 0.5059744 0.5525794
          22        23        24        25        26        27        28
10 0.2180004 0.2055225 0.3374449 0.1470128 0.1988646 0.2936177 0.2865190
51 0.6102072 0.5162478 0.4642196 0.4392196 0.5071208 0.3469356 0.4707011
71 0.5707892 0.3656305 0.5525794 0.3331349 0.5084436 0.5087522 0.5960979
          29        30        31        32        33        34        35
10 0.4241843 0.3331349 0.1954365 0.3871473 0.3525794 0.1593254 0.3420635
51 0.4585207 0.4508047 0.4945877 0.3714837 0.4443232 0.4992174 0.4526345
71 0.4571980 0.4494819 0.3504078 0.3430004 0.4979387 0.3766424 0.3253858
          36        37        38        39        40        41        42
10 0.3883598 0.2761023 0.3972994 0.2640653 0.3435957 0.4962632 0.4715719
51 0.4884369 0.3780313 0.5070988 0.4326609 0.3231481 0.3569885 0.2489638
71 0.3272377 0.3052800 0.6343474 0.3660825 0.4541005 0.4032848 0.3014330
          43        44        45         46        47         48        49
10 0.4366953 0.4953373 0.5377315 0.47917769 0.5433752 0.45695547 0.5993386
51 0.2443342 0.2134700 0.2604938 0.19082892 0.1494709 0.20502646 0.2109899
71 0.2727293 0.2480379 0.3395944 0.07469136 0.1666667 0.09259259 0.1979387
          50        51        52        53        54        55        56
10 0.3330688 0.5167438 0.5106592 0.5183752 0.5301036 0.5623016 0.4148589
51 0.2979608 0.0000000 0.3889771 0.1269400 0.3096561 0.1566689 0.1828373
71 0.3658620 0.2198413 0.2728395 0.1262346 0.1546296 0.2146054 0.3365410
          57         58        59        60        61        62         63
10 0.5387456 0.44306658 0.5398589 0.4535714 0.5197972 0.4843034 0.52177028
51 0.1689153 0.23990300 0.4033620 0.3837412 0.2999669 0.3251213 0.15194004
71 0.1157407 0.02006173 0.2644731 0.2591380 0.1610780 0.3195657 0.09876543
           64         65         66        67        68        69        70
10 0.50325176 0.50170855 0.42917769 0.4230049 0.4889330 0.5069555 0.5236221
51 0.13342152 0.12879189 0.20132275 0.2198413 0.2772817 0.1568783 0.1235450
71 0.08641975 0.09104938 0.01851852 0.0000000 0.3365410 0.0962963 0.1407407
          71        72        73        74        75        76        77
10 0.4230049 0.4781305 0.4776455 0.4895503 0.5188713 0.4276345 0.5603505
51 0.2198413 0.3743496 0.2022597 0.2586089 0.2084546 0.2244709 0.1905203
71 0.0000000 0.3095348 0.1788911 0.1265101 0.2553682 0.1712963 0.1404321
          78         79         80        81        82        83        84
10 0.5520172 0.33349868 0.39923942 0.3707231 0.4791777 0.5746473 0.6078042
51 0.2062610 0.29700176 0.26459436 0.2670966 0.3074956 0.3529652 0.3152888
71 0.2413580 0.08950617 0.09969136 0.2615410 0.1456790 0.1516424 0.3287809
          85        86        87        88        89        90        91
10 0.4463404 0.6348325 0.6302028 0.6178571 0.5605379 0.4791005 0.6317460
51 0.4204916 0.2464837 0.2418541 0.2202491 0.3896274 0.3865851 0.2063602
71 0.2816027 0.2118276 0.2071980 0.2071980 0.4914793 0.2679784 0.2210869
          92        93         94        95        96        97        98
10 0.5437831 0.5499559 0.48668430 0.5386684 0.4932540 0.5940917 0.5607584
51 0.2943232 0.2881504 0.24031085 0.3270172 0.3525904 0.2557429 0.1724096
71 0.1331239 0.1392967 0.07602513 0.3386574 0.2297509 0.2605930 0.1439264
          99       100       101       102       103       104
10 0.5582892 0.5781305 0.4868166 0.6095238 0.3910053 0.5709436
51 0.2575948 0.3510472 0.5665234 0.2452491 0.3359899 0.3504960
71 0.2809634 0.3979608 0.4133488 0.2988646 0.1470128 0.1769511
Objective function:	 0.99502
Clustering vector: 	 Named int [1:104] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ...
 - attr(*, "names")= chr [1:104] "1" "2" "3" "4" "5" "6" "7" ...
Cluster sizes:	    	 40 43 21 
Best sample:
 [1] 2  4  6  7  8  10 14 20 22 30 32 33 34 35 45 46 50 51 53 56 58 61 63 64 65
[26] 67 68 70 71 72 73 75 79 80 84 87 88 89 90 91 93 94 95 96 97 99

Available components:
 [1] "sample"     "medoids"    "i.med"      "clustering" "objective" 
 [6] "clusinfo"   "diss"       "call"       "silinfo"    "data"

#Diagrama de elipses para representar los clusters creados
fviz_cluster(object = clusterclara2, data = d, ellipse.type = "t",
             repel = TRUE) +
  theme_bw() +
  labs(title = "Resultados clustering con dos grupos") +
  theme(legend.position = "none")

# 1. Calcular matriz de distancias
distance <- dist(d, method = "euclidean")

# 2. Crear el modelo jerárquico (esto no crea grupos aún)
hc2 <- hclust(distance, method = "ward.D")

# 3. Visualizar el dendrograma (estructura de agrupamiento)
plot(hc2)

# 4. Cortar el dendrograma en k grupos → Aquí obtienes los clusters reales
clusterjerarquico2 <- cutree(hc2, k = 3)

# Visualizar los clusters sobre componentes principales
fviz_cluster(list(data = d, cluster = clusterjerarquico2))

# Unimos los datos originales con los grupos asignados por k-means
datosfinales <- cbind(datosfinales, clusterkm2$cluster)

# Renombramos la nueva columna que indica el grupo
colnames(datosfinales)[17] <- "C-kmeans2"

# Mostramos las primeras filas
head(datosfinales)

#Revisando características sobre variables escalares
aggregate(datosfinales$promos ~ datosfinales$"C-kmeans2", FUN=mean)
aggregate(datosfinales$servicio ~ datosfinales$"C-kmeans2", FUN=mean)
aggregate(datosfinales$particip ~ datosfinales$"C-kmeans2", FUN=mean)
aggregate(datosfinales$ubicació ~ datosfinales$"C-kmeans2", FUN=mean)
aggregate(datosfinales$rapidez ~ datosfinales$"C-kmeans2", FUN=mean)
aggregate(datosfinales$horarios ~ datosfinales$"C-kmeans2", FUN=mean)
aggregate(datosfinales$moviliario ~ datosfinales$"C-kmeans2", FUN=mean)
aggregate(datosfinales$recomend ~ datosfinales$"C-kmeans2", FUN=mean)
aggregate(datosfinales$edad ~ datosfinales$"C-kmeans2", FUN=mean)

table(datosfinales$"C-kmeans2")
#Comparación del cluster con las demás variables
table(datosfinales$genero,datosfinales$"C-kmeans2")
#Comparación del cluster con las demás variables
table(datosfinales$nse,datosfinales$"C-kmeans2")

 1  2  3 
42 27 35

        
          1  2  3
  Hombre 23 27  0
  Mujer  19  0 35

       
         1  2  3
  Alto  30  0  2
  Bajo   0 24 30
  Medio 12  3  3

# Unimos los datos originales con los grupos asignados por PAM
datosfinales <- cbind(datosfinales, clusterpam2$cluster)

# Renombramos la nueva columna que indica el grupo
colnames(datosfinales)[18] <- "C-pam2"

# Mostramos las primeras filas
head(datosfinales)

#Revisando características sobre variables escalares
aggregate(datosfinales$promos ~ datosfinales$"C-pam2", FUN=mean)
aggregate(datosfinales$servicio ~ datosfinales$"C-pam2", FUN=mean)
aggregate(datosfinales$particip ~ datosfinales$"C-pam2", FUN=mean)
aggregate(datosfinales$ubicació ~ datosfinales$"C-pam2", FUN=mean)
aggregate(datosfinales$rapidez ~ datosfinales$"C-pam2", FUN=mean)
aggregate(datosfinales$horarios ~ datosfinales$"C-pam2", FUN=mean)
aggregate(datosfinales$moviliario ~ datosfinales$"C-pam2", FUN=mean)
aggregate(datosfinales$recomend ~ datosfinales$"C-pam2", FUN=mean)
aggregate(datosfinales$edad ~ datosfinales$"C-pam2", FUN=mean)

table(datosfinales$"C-pam2")
#Comparación del cluster con las demás variables
table(datosfinales$genero,datosfinales$"C-pam2")
#Comparación del cluster con las demás variables
table(datosfinales$nse,datosfinales$"C-pam2")

 1  2  3 
39 24 41

        
          1  2  3
  Hombre 22 10 18
  Mujer  17 14 23

       
         1  2  3
  Alto  30  2  0
  Bajo   0 13 41
  Medio  9  9  0

# Unimos los datos originales con los grupos asignados por CLARA
datosfinales <- cbind(datosfinales, clusterclara2$cluster)

# Renombramos la nueva columna que indica el grupo
colnames(datosfinales)[19] <- "C-clara2"

# Mostramos las primeras filas
head(datosfinales)

#Revisando características sobre variables escalares
aggregate(datosfinales$promos ~ datosfinales$"C-clara2", FUN=mean)
aggregate(datosfinales$servicio ~ datosfinales$"C-clara2", FUN=mean)
aggregate(datosfinales$particip ~ datosfinales$"C-clara2", FUN=mean)
aggregate(datosfinales$ubicació ~ datosfinales$"C-clara2", FUN=mean)
aggregate(datosfinales$rapidez ~ datosfinales$"C-clara2", FUN=mean)
aggregate(datosfinales$horarios ~ datosfinales$"C-clara2", FUN=mean)
aggregate(datosfinales$moviliario ~ datosfinales$"C-clara2", FUN=mean)
aggregate(datosfinales$recomend ~ datosfinales$"C-clara2", FUN=mean)
aggregate(datosfinales$edad ~ datosfinales$"C-clara2", FUN=mean)

table(datosfinales$"C-clara2")
#Comparación del cluster con las demás variables
table(datosfinales$genero,datosfinales$"C-clara2")
#Comparación del cluster con las demás variables
table(datosfinales$nse,datosfinales$"C-clara2")

 1  2  3 
40 43 21

        
          1  2  3
  Hombre 23  6 21
  Mujer  17 37  0

       
         1  2  3
  Alto  30  2  0
  Bajo   0 34 20
  Medio 10  7  1

# Unimos el cluster jerárquico al data frame
datosfinales <- cbind(datosfinales, clusterjerarquico2)

# Renombramos la nueva columna que indica el cluster jerárquico
colnames(datosfinales)[ncol(datosfinales)] <- "C-jerarquico2"

# Mostramos las primeras filas
head(datosfinales)

#Revisando características sobre variables escalares
aggregate(datosfinales$promos ~ datosfinales$"C-jerarquico2", FUN=mean)
aggregate(datosfinales$servicio ~ datosfinales$"C-jerarquico2", FUN=mean)
aggregate(datosfinales$particip ~ datosfinales$"C-jerarquico2", FUN=mean)
aggregate(datosfinales$ubicació ~ datosfinales$"C-jerarquico2", FUN=mean)
aggregate(datosfinales$rapidez ~ datosfinales$"C-jerarquico2", FUN=mean)
aggregate(datosfinales$horarios ~ datosfinales$"C-jerarquico2", FUN=mean)
aggregate(datosfinales$moviliario ~ datosfinales$"C-jerarquico2", FUN=mean)
aggregate(datosfinales$recomend ~ datosfinales$"C-jerarquico2", FUN=mean)
aggregate(datosfinales$edad ~ datosfinales$"C-jerarquico2", FUN=mean)

table(datosfinales$"C-jerarquico2")
#Comparación del cluster con las demás variables
table(datosfinales$genero,datosfinales$"C-jerarquico2")
#Comparación del cluster con las demás variables
table(datosfinales$nse,datosfinales$"C-jerarquico2")

 1  2  3 
33 32 39

        
          1  2  3
  Hombre 22  7 21
  Mujer  11 25 18

       
         1  2  3
  Alto  25  7  0
  Bajo   0 15 39
  Medio  8 10  0

#Instalación de librerías para análisis factorial
install.packages("psych")
install.packages("polycor")
install.packages("ggcorrplot")
library(psych)
library(polycor)
library(ggcorrplot)

Installing package into ‘/usr/local/lib/R/site-library’
(as ‘lib’ is unspecified)

also installing the dependencies ‘mnormt’, ‘GPArotation’


Installing package into ‘/usr/local/lib/R/site-library’
(as ‘lib’ is unspecified)

also installing the dependency ‘admisc’


Installing package into ‘/usr/local/lib/R/site-library’
(as ‘lib’ is unspecified)


Attaching package: ‘psych’


The following objects are masked from ‘package:ggplot2’:

    %+%, alpha


Attaching package: ‘polycor’


The following object is masked from ‘package:psych’:

    polyserial

#hetcor(items)$correlations
ggcorrplot(hetcor(df)$correlations,type="lower",hc.order=T)

#Prueba de Bartlett
cortest.bartlett(hetcor(df)$correlations)

Warning message in cortest.bartlett(hetcor(df)$correlations):
“n not specified, 100 used”

#Se realiza prueba KMO
KMO(hetcor(df)$correlations)

Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = hetcor(df)$correlations)
Overall MSA =  0.67
MSA for each item = 
    genero        nse     promos   servicio   particip   ubicació domicilios 
      0.25       0.67       0.70       0.65       0.50       0.83       0.65 
   rapidez   horarios moviliario   recomend       edad 
      0.73       0.58       0.75       0.68       0.68

#Se hace el diagrama de sedimentación
scree(hetcor(df)$correlations)

#Puntuaciones factoriales
matcor1<-hetcor(df)$correlations
mf1<-fa(matcor1,nfactors=4)
mf1

Loading required namespace: GPArotation

Factor Analysis using method =  minres
Call: fa(r = matcor1, nfactors = 4)
Standardized loadings (pattern matrix) based upon correlation matrix
             MR1   MR2   MR4   MR3    h2    u2 com
genero      0.10  0.17 -0.08 -0.02 0.038 0.962 2.2
nse         0.04 -0.01  0.79 -0.14 0.636 0.364 1.1
promos      0.88  0.05  0.14 -0.10 0.887 0.113 1.1
servicio    0.25  0.00  0.54  0.36 0.742 0.258 2.2
particip    0.17 -0.02 -0.11  0.72 0.576 0.424 1.2
ubicació    0.67  0.06  0.17  0.21 0.745 0.255 1.4
domicilios  0.98  0.01 -0.07  0.06 0.939 0.061 1.0
rapidez     0.16  0.84 -0.04 -0.13 0.744 0.256 1.1
horarios   -0.10  0.66  0.00  0.09 0.441 0.559 1.1
moviliario -0.29  0.29  0.17  0.44 0.334 0.666 2.9
recomend   -0.06  0.73  0.03  0.11 0.561 0.439 1.1
edad        0.12  0.31 -0.05 -0.20 0.128 0.872 2.1

                       MR1  MR2  MR4  MR3
SS loadings           2.59 1.93 1.18 1.08
Proportion Var        0.22 0.16 0.10 0.09
Cumulative Var        0.22 0.38 0.47 0.56
Proportion Explained  0.38 0.28 0.17 0.16
Cumulative Proportion 0.38 0.67 0.84 1.00

 With factor correlations of 
     MR1  MR2  MR4  MR3
MR1 1.00 0.24 0.48 0.25
MR2 0.24 1.00 0.16 0.18
MR4 0.48 0.16 1.00 0.18
MR3 0.25 0.18 0.18 1.00

Mean item complexity =  1.5
Test of the hypothesis that 4 factors are sufficient.

df null model =  66  with the objective function =  5.89
df of  the model are 24  and the objective function was  0.46 

The root mean square of the residuals (RMSR) is  0.03 
The df corrected root mean square of the residuals is  0.05 

Fit based upon off diagonal values = 0.99
Measures of factor score adequacy             
                                                   MR1  MR2  MR4  MR3
Correlation of (regression) scores with factors   0.98 0.91 0.88 0.85
Multiple R square of scores with factors          0.97 0.84 0.78 0.73
Minimum correlation of possible factor scores     0.93 0.67 0.56 0.46

#Omisión de variables con poca correlación
df_correlacionados<-select(df,c(-genero) )
head(df_correlacionados)

#Prueba de Bartlett
cortest.bartlett(hetcor(df_correlacionados)$correlations)

Warning message in cortest.bartlett(hetcor(df_correlacionados)$correlations):
“n not specified, 100 used”

#Se realiza la prueba KMO
KMO(hetcor(df_correlacionados)$correlations)

Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = hetcor(df_correlacionados)$correlations)
Overall MSA =  0.71
MSA for each item = 
       nse     promos   servicio   particip   ubicació domicilios    rapidez 
      0.69       0.71       0.69       0.53       0.87       0.69       0.73 
  horarios moviliario   recomend       edad 
      0.66       0.75       0.68       0.74

#Se realiza el diagrama de sedimentación
scree(hetcor(df_correlacionados)$correlations)

#Puntuaciones factoriales
matcor2<-hetcor(df_correlacionados)$correlations
mf2<-fa(matcor2,nfactors=3)
mf2

Factor Analysis using method =  minres
Call: fa(r = matcor2, nfactors = 3)
Standardized loadings (pattern matrix) based upon correlation matrix
             MR1   MR2   MR3   h2    u2 com
nse         0.48 -0.04  0.05 0.23 0.775 1.0
promos      0.96  0.05 -0.17 0.92 0.076 1.1
servicio    0.66 -0.06  0.42 0.68 0.323 1.7
particip    0.23 -0.01  0.50 0.34 0.663 1.4
ubicació    0.82  0.04  0.16 0.76 0.236 1.1
domicilios  0.90  0.02 -0.04 0.81 0.195 1.0
rapidez     0.10  0.88 -0.11 0.82 0.184 1.1
horarios   -0.09  0.63  0.14 0.42 0.582 1.1
moviliario -0.12  0.25  0.56 0.39 0.613 1.5
recomend   -0.03  0.70  0.18 0.55 0.451 1.1
edad        0.06  0.31 -0.19 0.12 0.877 1.7

                       MR1  MR2  MR3
SS loadings           3.20 1.87 0.95
Proportion Var        0.29 0.17 0.09
Cumulative Var        0.29 0.46 0.55
Proportion Explained  0.53 0.31 0.16
Cumulative Proportion 0.53 0.84 1.00

 With factor correlations of 
     MR1  MR2  MR3
MR1 1.00 0.26 0.16
MR2 0.26 1.00 0.14
MR3 0.16 0.14 1.00

Mean item complexity =  1.3
Test of the hypothesis that 3 factors are sufficient.

df null model =  55  with the objective function =  5.7
df of  the model are 25  and the objective function was  0.69 

The root mean square of the residuals (RMSR) is  0.04 
The df corrected root mean square of the residuals is  0.07 

Fit based upon off diagonal values = 0.98
Measures of factor score adequacy             
                                                   MR1  MR2  MR3
Correlation of (regression) scores with factors   0.98 0.93 0.83
Multiple R square of scores with factors          0.95 0.86 0.70
Minimum correlation of possible factor scores     0.91 0.73 0.39

#Elaboramos el diagrama del análisis factorial
fa.diagram(mf1)

#Elaboramos el diagrama del análisis factorial
fa.diagram(mf2)

Fase	Actividades principales	Duración estimada	Responsable(s)
1. Recolección y exploración	- Consolidar base de encuestas - Verificar calidad y estructura de datos - Análisis exploratorio (EDA)	1–2 semanas	Analista de datos
2. Preparación de datos	- Normalización/escalado de variables - Codificación de variables categóricas - Análisis factorial exploratorio (EFA)	1–2 semanas	Analista de datos
3. Modelado – Clustering	- Aplicar K-means / jerárquico - Probar distintos k (n° de clusters) - Evaluar con silueta, varianza, interpretabilidad	2 semanas	Analista de datos
4. Evaluación de resultados	- Interpretar factores y segmentos - Validar coherencia con stakeholders - Ajustar modelos si es necesario	1 semana	Analista de datos + Gerente/Marketing
5. Implementación y comunicación	- Construir perfiles de clientes - Recomendaciones estratégicas - Preparar informe ejecutivo y presentación	1–2 semanas	Analista + Equipo de negocio
6. Revisión y seguimiento	- Monitorear métricas clave (satisfacción, recomendación, ingresos) - Refinar modelos con nuevos datos	Continuo	Gerente + Analista (según avance)

Variable	Tipo de Dato	Descripción	Valores/Ejemplo
`genero`	Categórica	Género del encuestado.	`Masculino`, `Femenino`
`nse`	Ordinal	Nivel socioeconómico (estrato).	`Alto`, `Medio`, `Bajo`
`edad`	Entero	Edad del encuestado.	`18`, `25`, `40`
`promos`	Escala (1 a 10)	Calificación de la calidad de las promociones.	`1`, `5`, `10`
`servicio`	Escala (1 a 10)	Calificación del servicio al cliente.	`1`, `7`, `9`
`particip`	Escala (1 a 10)	Calificación de la participación del restaurante en actividades comunitarias.	`2`, `6`, `10`
`ubicacio`	Escala (1 a 10)	Calificación de la ubicación de los restaurantes.	`3`, `8`, `10`
`domicilios`	Escala (1 a 10)	Calificación del servicio de domicilios.	`4`, `7`, `10`
`rapidez`	Escala (1 a 10)	Calificación de la rapidez y agilidad del servicio.	`5`, `8`, `10`
`horarios`	Escala (1 a 10)	Calificación de los horarios de atención.	`2`, `6`, `9`
`mobiliario`	Escala (1 a 10)	Calificación del mobiliario del lugar (mesas, ambiente).	`3`, `7`, `10`
`recomienda`	Escala (1 a 10)	Recomendacion de familiares y amigos	`3`, `5`, `9`

	promos	servicio	particip	ubicació	domicilios	rapidez	horarios	moviliario	recomend	edad
1	-1.533961	-0.1710751	-0.2737638	1.092054	-1.304172	-0.548488898	1.1157711	0.7187860	-0.9670964	-1.8769432
2	-1.533961	-1.9502560	-0.2737638	-1.644659	-1.304172	-2.178284481	-0.4958983	-0.1437572	-0.2782058	-1.3973312
3	-1.533961	-1.0606655	0.5636314	-1.644659	-1.304172	-2.178284481	-0.4958983	1.0063004	-2.3448776	-1.4658472
4	-1.533961	0.2737201	-0.2737638	-1.644659	-1.304172	-0.005223704	-1.3017330	-0.1437572	-0.2782058	-1.6713952
5	-1.533961	-1.0606655	0.5636314	-1.644659	-1.304172	-2.178284481	-0.4958983	1.0063004	-2.3448776	-1.8084272
6	-1.533961	-0.1710751	-0.2737638	1.092054	-1.304172	-0.548488898	1.1157711	0.7187860	-0.9670964	-0.6436551

datosfinales$"C-kmeans"	datosfinales$promos
<int>	<dbl>
1	8.96875
2	2.20000

datosfinales$"C-kmeans"	datosfinales$servicio
<int>	<dbl>
1	8.40625
2	5.75000

	genero	nse	promos	servicio	particip	ubicació	domicilios	rapidez	horarios	moviliario	recomend	edad
	<chr>	<chr>	<int>	<int>	<int>	<int>	<int>	<int>	<int>	<int>	<int>	<int>
1	Hombre	Medio	1	7	8	10	3	7	10	9	7	18
2	Hombre	Alto	1	3	8	2	3	4	8	6	8	25
3	Hombre	Alto	1	5	9	2	3	4	8	10	5	24
4	Hombre	Medio	1	8	8	2	3	8	7	6	8	21
5	Mujer	Medio	1	5	9	2	3	4	8	10	5	19
6	Mujer	Alto	1	7	8	10	3	7	10	9	7	36

	genero	nse	promos	servicio	particip	ubicació	domicilios	rapidez	horarios	moviliario	recomend	edad	C-kmeans
	<fct>	<fct>	<int>	<int>	<int>	<int>	<int>	<int>	<int>	<int>	<int>	<int>	<int>
1	Hombre	Medio	1	7	8	10	3	7	10	9	7	18	2
2	Hombre	Alto	1	3	8	2	3	4	8	6	8	25	2
3	Hombre	Alto	1	5	9	2	3	4	8	10	5	24	2
4	Hombre	Medio	1	8	8	2	3	8	7	6	8	21	2
5	Mujer	Medio	1	5	9	2	3	4	8	10	5	19	2
6	Mujer	Alto	1	7	8	10	3	7	10	9	7	36	2

A data.frame: 2 × 2
datosfinales$"C-kmeans"	datosfinales$particip
<int>	<dbl>
1	8.5625
2	7.9500

A data.frame: 2 × 2
datosfinales$"C-kmeans"	datosfinales$ubicació
<int>	<dbl>
1	8.5625
2	4.0000

A data.frame: 2 × 2
datosfinales$"C-kmeans"	datosfinales$rapidez
<int>	<dbl>
1	8.46875
2	7.27500

A data.frame: 2 × 2
datosfinales$"C-kmeans"	datosfinales$horarios
<int>	<dbl>
1	8.71875
2	8.45000

CASO EXPERIENCIA DE PRODUCTO (Taller 3)

MODELOS CONSIDERANDO SOLAMENTE VARIABLES ESCALARES

Fase 1: Comprensión del negocio 📈

1. Contexto comercial

2. Objetivos comerciales

3. Criterios de rendimiento comercial

4. Evaluación de situación actual

5. Requisitos, supuestos y restricciones

6. Análisis costo/beneficio

7. Objetivos de Data Mining

8. Criterios de rendimiento de los modelos

9. Plan del proyecto

Fase 2. Comprensión de los datos 📊

1. Recolección inicial de los datos

2. Descripción de los datos

3. Exploración de los datos

4. Verificación de la calidad de los datos

Fase 3: Preparación de los datos ⬆️

Cargue de datos

Tipología de las variables

Selección de los datos

Depuración de los datos

Transformación de los datos

Fase 4.1: Modelado 🧠

Paso 1: determinar número de clústers (silueta de cohesión)

Paso 2: Crear diagrama de sedimentación

Modelo 1A

Identificación modelo 1A

Estimación modelo 1A

Diagnóstico modelo 1A

Modelo 1B

Identificación modelo 1B

Estimación modelo 1B

Diagnóstico modelo 1B

Modelo 1C

Identificación modelo 1C

Estimación modelo 1C

Diagnóstico modelo 1C

Modelo 1D

Identificación modelo 1D

Estimación modelo 1D

Diagnóstico modelo 1D

Fase 5.1: Evaluación 📝

Evaluación modelo 1A

Evaluación modelo 1B

Evaluación modelo 1C

Evaluación modelo 1D

Fase 6.1: Distribución 🚛

Planeación de la distribución

Creación de medios de distribución

Distribución de resultados

EMPLEANDO MÉTODO DAISY- CONSIDERANDO VARIABLES CATEGÓRICAS

Fase 4.2: Modelado 🧠

Modelo 2A

Identificación modelo 2A

Estimación modelo 2A

Diagnóstico modelo 2A

Modelo 2B

Identificación modelo 2B

Estimación modelo 2B

Diagnóstico modelo 2B

Modelo 2C

Identificación modelo 2C

Estimación modelo 2C

Diagnóstico modelo 2C

Modelo 2D

Identificación modelo 2D

Estimación modelo 2D

Diagnóstico modelo 2D

Fase 5.2: Evaluación 📝

Evaluación modelo 2A

Evaluación modelo 2B

Evaluación modelo 2C

Evaluación modelo 2D

Fase 6.2: Distribución 🚛

ANÁLISIS FACTORIAL PARA IDENTIFICAR SEGMENTOS CLAVE

Fase 4.3: Modelado 🧠

Modelo 3A

Correlaciones policóricas

Prueba de esfericidad de Bartlett