kebincontreras's picture
Update
712ed64 verified
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.decomposition import PCA
from sklearn.manifold import TSNE
from sklearn.preprocessing import StandardScaler, normalize
# Función para aplicar Min-Max a cada columna
def min_max_normalize(column):
return (column - column.min()) / (column.max() - column.min())
# Función para aplicar Normax
def normax_normalize(column):
return column / column.max()
# Cargar el archivo de Excel desde la ruta especificada
file_path = r"C:\Users\USUARIO\Documents\Indonecia\Rice_Spectral.xlsx"
data = pd.read_excel(file_path, sheet_name="Spectral")
# Asegurarse de que los valores de "Location" sean numéricos
data['Location'] = pd.to_numeric(data['Location'], errors='coerce')
# Separar los datos de los números de onda (Wavenumbers)
wavenumbers = data['Location'].dropna() # Eliminar posibles NaN en wavenumbers
# Filtrar las columnas que pertenecen a Java y Bangka Belitung
java_columns = [col for col in data.columns if "Java" in col]
belitung_columns = [col for col in data.columns if "Bangka Belitung" in col]
# Asegurarse de que todas las columnas de datos sean numéricas
data[java_columns] = data[java_columns].apply(pd.to_numeric, errors='coerce')
data[belitung_columns] = data[belitung_columns].apply(pd.to_numeric, errors='coerce')
# Aplicar normalización Min-Max y Normax
data_minmax = data.copy()
data_normax = data.copy()
data_minmax[java_columns] = data_minmax[java_columns].apply(min_max_normalize)
data_minmax[belitung_columns] = data_minmax[belitung_columns].apply(min_max_normalize)
data_normax[java_columns] = data_normax[java_columns].apply(normax_normalize)
data_normax[belitung_columns] = data_normax[belitung_columns].apply(normax_normalize)
# Preparar los datos para PCA y t-SNE
all_columns = java_columns + belitung_columns
# Normalización de datos (Min-Max)
spectral_data_minmax = data_minmax[all_columns].dropna().transpose()
# Estandarización de datos
scaler = StandardScaler()
spectral_data_standardized = scaler.fit_transform(spectral_data_minmax)
# Normalización Normax
spectral_data_normax = data_normax[all_columns].dropna().transpose()
# PCA
pca_minmax = PCA(n_components=2).fit_transform(spectral_data_minmax)
pca_normax = PCA(n_components=2).fit_transform(spectral_data_normax)
pca_standardized = PCA(n_components=2).fit_transform(spectral_data_standardized)
# t-SNE
tsne_minmax = TSNE(n_components=2, random_state=42).fit_transform(spectral_data_minmax)
tsne_normax = TSNE(n_components=2, random_state=42).fit_transform(spectral_data_normax)
tsne_standardized = TSNE(n_components=2, random_state=42).fit_transform(spectral_data_standardized)
# Crear subplots
fig, axs = plt.subplots(3, 2, figsize=(14, 18))
# Gráfico de PCA Min-Max
axs[0, 0].scatter(pca_minmax[:len(java_columns), 0], pca_minmax[:len(java_columns), 1], color='blue', label='Java')
axs[0, 0].scatter(pca_minmax[len(java_columns):, 0], pca_minmax[len(java_columns):, 1], color='green', label='Bangka Belitung')
axs[0, 0].set_title('PCA Min-Max')
axs[0, 0].legend()
# Gráfico de t-SNE Min-Max
axs[0, 1].scatter(tsne_minmax[:len(java_columns), 0], tsne_minmax[:len(java_columns), 1], color='blue', label='Java')
axs[0, 1].scatter(tsne_minmax[len(java_columns):, 0], tsne_minmax[len(java_columns):, 1], color='green', label='Bangka Belitung')
axs[0, 1].set_title('t-SNE Min-Max')
axs[0, 1].legend()
# Gráfico de PCA Normax
axs[1, 0].scatter(pca_normax[:len(java_columns), 0], pca_normax[:len(java_columns), 1], color='blue', label='Java')
axs[1, 0].scatter(pca_normax[len(java_columns):, 0], pca_normax[len(java_columns):, 1], color='green', label='Bangka Belitung')
axs[1, 0].set_title('PCA Normax')
axs[1, 0].legend()
# Gráfico de t-SNE Normax
axs[1, 1].scatter(tsne_normax[:len(java_columns), 0], tsne_normax[:len(java_columns), 1], color='blue', label='Java')
axs[1, 1].scatter(tsne_normax[len(java_columns):, 0], tsne_normax[len(java_columns):, 1], color='green', label='Bangka Belitung')
axs[1, 1].set_title('t-SNE Normax')
axs[1, 1].legend()
# Gráfico de PCA Estandarizado
axs[2, 0].scatter(pca_standardized[:len(java_columns), 0], pca_standardized[:len(java_columns), 1], color='blue', label='Java')
axs[2, 0].scatter(pca_standardized[len(java_columns):, 0], pca_standardized[len(java_columns):, 1], color='green', label='Bangka Belitung')
axs[2, 0].set_title('PCA Estandarizado')
axs[2, 0].legend()
# Gráfico de t-SNE Estandarizado
axs[2, 1].scatter(tsne_standardized[:len(java_columns), 0], tsne_standardized[:len(java_columns), 1], color='blue', label='Java')
axs[2, 1].scatter(tsne_standardized[len(java_columns):, 0], tsne_standardized[len(java_columns):, 1], color='green', label='Bangka Belitung')
axs[2, 1].set_title('t-SNE Estandarizado')
axs[2, 1].legend()
# Ajustar los subplots
plt.tight_layout()
plt.show()