Spaces:

kebincontreras
/

Rice_Classification_Geographic

Build error

App Files Files Community

kebincontreras commited on Oct 6, 2024

Commit

712ed64

verified ·

1 Parent(s): 2d7d2e6

Update

Browse files

Files changed (9) hide show

.gitignore +162 -0
README.md +1 -12
SVM.py +104 -0
Spectra copy 2.py +125 -0
Spectra copy.py +107 -0
Spectra.py +82 -0
create_model.py +39 -0
main.py +0 -0
requirements.txt +0 -0

.gitignore ADDED Viewed

	@@ -0,0 +1,162 @@

+# Byte-compiled / optimized / DLL files
+__pycache__/
+*.py[cod]
+*$py.class
+# C extensions
+*.so
+# Distribution / packaging
+.Python
+build/
+develop-eggs/
+dist/
+downloads/
+eggs/
+.eggs/
+lib/
+lib64/
+parts/
+sdist/
+var/
+wheels/
+share/python-wheels/
+*.egg-info/
+.installed.cfg
+*.egg
+MANIFEST
+# PyInstaller
+#  Usually these files are written by a python script from a template
+#  before PyInstaller builds the exe, so as to inject date/other infos into it.
+*.manifest
+*.spec
+# Installer logs
+pip-log.txt
+pip-delete-this-directory.txt
+# Unit test / coverage reports
+htmlcov/
+.tox/
+.nox/
+.coverage
+.coverage.*
+.cache
+nosetests.xml
+coverage.xml
+*.cover
+*.py,cover
+.hypothesis/
+.pytest_cache/
+cover/
+# Translations
+*.mo
+*.pot
+# Django stuff:
+*.log
+local_settings.py
+db.sqlite3
+db.sqlite3-journal
+# Flask stuff:
+instance/
+.webassets-cache
+# Scrapy stuff:
+.scrapy
+# Sphinx documentation
+docs/_build/
+# PyBuilder
+.pybuilder/
+target/
+# Jupyter Notebook
+.ipynb_checkpoints
+# IPython
+profile_default/
+ipython_config.py
+# pyenv
+#   For a library or package, you might want to ignore these files since the code is
+#   intended to run in multiple environments; otherwise, check them in:
+# .python-version
+# pipenv
+#   According to pypa/pipenv#598, it is recommended to include Pipfile.lock in version control.
+#   However, in case of collaboration, if having platform-specific dependencies or dependencies
+#   having no cross-platform support, pipenv may install dependencies that don't work, or not
+#   install all needed dependencies.
+#Pipfile.lock
+# poetry
+#   Similar to Pipfile.lock, it is generally recommended to include poetry.lock in version control.
+#   This is especially recommended for binary packages to ensure reproducibility, and is more
+#   commonly ignored for libraries.
+#   https://python-poetry.org/docs/basic-usage/#commit-your-poetrylock-file-to-version-control
+#poetry.lock
+# pdm
+#   Similar to Pipfile.lock, it is generally recommended to include pdm.lock in version control.
+#pdm.lock
+#   pdm stores project-wide configurations in .pdm.toml, but it is recommended to not include it
+#   in version control.
+#   https://pdm.fming.dev/latest/usage/project/#working-with-version-control
+.pdm.toml
+.pdm-python
+.pdm-build/
+# PEP 582; used by e.g. github.com/David-OConnor/pyflow and github.com/pdm-project/pdm
+__pypackages__/
+# Celery stuff
+celerybeat-schedule
+celerybeat.pid
+# SageMath parsed files
+*.sage.py
+# Environments
+.env
+.venv
+env/
+venv/
+ENV/
+env.bak/
+venv.bak/
+# Spyder project settings
+.spyderproject
+.spyproject
+# Rope project settings
+.ropeproject
+# mkdocs documentation
+/site
+# mypy
+.mypy_cache/
+.dmypy.json
+dmypy.json
+# Pyre type checker
+.pyre/
+# pytype static type analyzer
+.pytype/
+# Cython debug symbols
+cython_debug/
+# PyCharm
+#  JetBrains specific template is maintained in a separate JetBrains.gitignore that can
+#  be found at https://github.com/github/gitignore/blob/main/Global/JetBrains.gitignore
+#  and can be added to the global gitignore or merged into this file.  For a more nuclear
+#  option (not recommended) you can uncomment the following to ignore the entire idea folder.
+#.idea/

README.md CHANGED Viewed

@@ -1,12 +1 @@
----
-title: Rice Classification Geographic
-emoji: 🐢
-colorFrom: blue
-colorTo: blue
-sdk: gradio
-sdk_version: 4.44.1
-app_file: app.py
-pinned: false
----
-Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference


1	+ # rice_clasification_indonecia

SVM.py ADDED Viewed

	@@ -0,0 +1,104 @@

+import seaborn as sns
+import pandas as pd
+import matplotlib.pyplot as plt
+from sklearn.decomposition import PCA
+from sklearn.manifold import TSNE
+from sklearn.preprocessing import StandardScaler
+from sklearn.svm import SVC
+from sklearn.metrics import accuracy_score, f1_score, precision_score, recall_score, confusion_matrix, classification_report
+from sklearn.model_selection import train_test_split
+# Función para aplicar Min-Max a cada columna
+def min_max_normalize(column):
+    return (column - column.min()) / (column.max() - column.min())
+# Función para aplicar Normax
+def normax_normalize(column):
+    return column / column.max()
+# Cargar el archivo de Excel desde la ruta especificada
+file_path = r"C:\Users\USUARIO\Documents\Indonecia\Rice_Spectral.xlsx"
+data = pd.read_excel(file_path, sheet_name="Spectral")
+# Asegurarse de que los valores de "Location" sean numéricos
+data['Location'] = pd.to_numeric(data['Location'], errors='coerce')
+# Separar los datos de los números de onda (Wavenumbers)
+wavenumbers = data['Location'].dropna()  # Eliminar posibles NaN en wavenumbers
+# Filtrar las columnas que pertenecen a Java y Bangka Belitung
+java_columns = [col for col in data.columns if "Java" in col]
+belitung_columns = [col for col in data.columns if "Bangka Belitung" in col]
+# Asegurarse de que todas las columnas de datos sean numéricas
+data[java_columns] = data[java_columns].apply(pd.to_numeric, errors='coerce')
+data[belitung_columns] = data[belitung_columns].apply(pd.to_numeric, errors='coerce')
+# Aplicar normalización Min-Max y Normax
+data_minmax = data.copy()
+data_normax = data.copy()
+data_minmax[java_columns] = data_minmax[java_columns].apply(min_max_normalize)
+data_minmax[belitung_columns] = data_minmax[belitung_columns].apply(min_max_normalize)
+data_normax[java_columns] = data_normax[java_columns].apply(normax_normalize)
+data_normax[belitung_columns] = data_normax[belitung_columns].apply(normax_normalize)
+# Preparar los datos para PCA y t-SNE
+all_columns = java_columns + belitung_columns
+# Normalización de datos (Min-Max)
+spectral_data_minmax = data_minmax[all_columns].dropna().transpose()
+# Estandarización de datos
+scaler = StandardScaler()
+spectral_data_standardized = scaler.fit_transform(spectral_data_minmax)
+# Calcular el valor máximo permitido para n_components
+n_samples, n_features = spectral_data_minmax.shape
+n_components = min(n_samples, n_features)
+# PCA para reducir a un máximo de n_components antes de t-SNE
+pca_50_standardized = PCA(n_components=n_components).fit_transform(spectral_data_standardized)
+# t-SNE después de reducir a n_components con PCA
+tsne_standardized = TSNE(n_components=2, random_state=42).fit_transform(pca_50_standardized)
+# Asignar etiquetas a las muestras: 0 para Java y 1 para Bangka Belitung
+labels = [0] * len(java_columns) + [1] * len(belitung_columns)
+# Dividir los datos t-SNE en entrenamiento y prueba
+X_train, X_test, y_train, y_test = train_test_split(tsne_standardized, labels, test_size=0.3, random_state=42)
+# Entrenar un modelo SVM
+svm_model = SVC(kernel='linear')
+svm_model.fit(X_train, y_train)
+# Realizar predicciones
+y_pred = svm_model.predict(X_test)
+# Calcular las métricas
+accuracy = accuracy_score(y_test, y_pred)
+precision = precision_score(y_test, y_pred)
+recall = recall_score(y_test, y_pred)
+f1 = f1_score(y_test, y_pred)
+conf_matrix = confusion_matrix(y_test, y_pred)
+class_report = classification_report(y_test, y_pred)
+# Mostrar resultados
+print(f"Accuracy: {accuracy * 100:.2f}%")
+print(f"Precision: {precision:.2f}")
+print(f"Recall: {recall:.2f}")
+print(f"F1-Score: {f1:.2f}")
+print("\nMatriz de Confusión:")
+print(conf_matrix)
+print("\nReporte de Clasificación:")
+print(class_report)
+# Visualización de la matriz de confusión
+plt.figure(figsize=(6, 4))
+sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues', xticklabels=['Java', 'Bangka Belitung'], yticklabels=['Java', 'Bangka Belitung'])
+plt.title('Matriz de Confusión')
+plt.ylabel('Etiqueta Real')
+plt.xlabel('Etiqueta Predicha')
+plt.show()

Spectra copy 2.py ADDED Viewed

	@@ -0,0 +1,125 @@

+import os
+import pandas as pd
+import matplotlib.pyplot as plt
+from sklearn.decomposition import PCA
+from sklearn.manifold import TSNE
+from sklearn.preprocessing import StandardScaler, normalize
+# Función para aplicar Min-Max a cada columna
+def min_max_normalize(column):
+    return (column - column.min()) / (column.max() - column.min())
+# Función para aplicar Normax
+def normax_normalize(column):
+    return column / column.max()
+# Obtener la ruta del directorio donde se encuentra el script
+current_dir = os.path.dirname(os.path.abspath(__file__))
+# Construir la ruta completa al archivo Excel
+file_path = os.path.join(current_dir, "Rice_Spectral.xlsx")
+# Leer el archivo Excel
+data = pd.read_excel(file_path, sheet_name="Spectral")
+# Asegurarse de que los valores de "Location" sean numéricos
+data['Location'] = pd.to_numeric(data['Location'], errors='coerce')
+# Separar los datos de los números de onda (Wavenumbers)
+wavenumbers = data['Location'].dropna()  # Eliminar posibles NaN en wavenumbers
+# Filtrar las columnas que pertenecen a Java y Bangka Belitung
+java_columns = [col for col in data.columns if "Java" in col]
+belitung_columns = [col for col in data.columns if "Bangka Belitung" in col]
+# Asegurarse de que todas las columnas de datos sean numéricas
+data[java_columns] = data[java_columns].apply(pd.to_numeric, errors='coerce')
+data[belitung_columns] = data[belitung_columns].apply(pd.to_numeric, errors='coerce')
+# Aplicar normalización Min-Max y Normax
+data_minmax = data.copy()
+data_normax = data.copy()
+data_minmax[java_columns] = data_minmax[java_columns].apply(min_max_normalize)
+data_minmax[belitung_columns] = data_minmax[belitung_columns].apply(min_max_normalize)
+data_normax[java_columns] = data_normax[java_columns].apply(normax_normalize)
+data_normax[belitung_columns] = data_normax[belitung_columns].apply(normax_normalize)
+# Preparar los datos para PCA y t-SNE
+all_columns = java_columns + belitung_columns
+# Normalización de datos (Min-Max)
+spectral_data_minmax = data_minmax[all_columns].dropna().transpose()
+# Estandarización de datos
+scaler = StandardScaler()
+spectral_data_standardized = scaler.fit_transform(spectral_data_minmax)
+# Normalización Normax
+spectral_data_normax = data_normax[all_columns].dropna().transpose()
+# Calcular el valor máximo permitido para n_components
+n_samples, n_features = spectral_data_minmax.shape
+n_components = min(n_samples, n_features)
+# PCA para reducir a un máximo de n_components antes de t-SNE
+pca_50_minmax = PCA(n_components=n_components).fit_transform(spectral_data_minmax)
+pca_50_normax = PCA(n_components=n_components).fit_transform(spectral_data_normax)
+pca_50_standardized = PCA(n_components=n_components).fit_transform(spectral_data_standardized)
+# PCA
+pca_minmax = PCA(n_components=2).fit_transform(spectral_data_minmax)
+pca_normax = PCA(n_components=2).fit_transform(spectral_data_normax)
+pca_standardized = PCA(n_components=2).fit_transform(spectral_data_standardized)
+# t-SNE después de reducir a n_components con PCA
+tsne_minmax = TSNE(n_components=2, random_state=42).fit_transform(pca_50_minmax)
+tsne_normax = TSNE(n_components=2, random_state=42).fit_transform(pca_50_normax)
+tsne_standardized = TSNE(n_components=2, random_state=42).fit_transform(pca_50_standardized)
+# Crear subplots
+fig, axs = plt.subplots(3, 2, figsize=(14, 18))
+# Gráfico de PCA Min-Max
+axs[0, 0].scatter(pca_minmax[:len(java_columns), 0], pca_minmax[:len(java_columns), 1], color='blue', label='Java')
+axs[0, 0].scatter(pca_minmax[len(java_columns):, 0], pca_minmax[len(java_columns):, 1], color='green', label='Bangka Belitung')
+axs[0, 0].set_title('PCA Min-Max')
+axs[0, 0].legend()
+# Gráfico de t-SNE Min-Max
+axs[0, 1].scatter(tsne_minmax[:len(java_columns), 0], tsne_minmax[:len(java_columns), 1], color='blue', label='Java')
+axs[0, 1].scatter(tsne_minmax[len(java_columns):, 0], tsne_minmax[len(java_columns):, 1], color='green', label='Bangka Belitung')
+axs[0, 1].set_title('t-SNE Min-Max')
+axs[0, 1].legend()
+# Gráfico de PCA Normax
+axs[1, 0].scatter(pca_normax[:len(java_columns), 0], pca_normax[:len(java_columns), 1], color='blue', label='Java')
+axs[1, 0].scatter(pca_normax[len(java_columns):, 0], pca_normax[len(java_columns):, 1], color='green', label='Bangka Belitung')
+axs[1, 0].set_title('PCA Normax')
+axs[1, 0].legend()
+# Gráfico de t-SNE Normax
+axs[1, 1].scatter(tsne_normax[:len(java_columns), 0], tsne_normax[:len(java_columns), 1], color='blue', label='Java')
+axs[1, 1].scatter(tsne_normax[len(java_columns):, 0], tsne_normax[len(java_columns):, 1], color='green', label='Bangka Belitung')
+axs[1, 1].set_title('t-SNE Normax')
+axs[1, 1].legend()
+# Gráfico de PCA Estandarizado
+axs[2, 0].scatter(pca_standardized[:len(java_columns), 0], pca_standardized[:len(java_columns), 1], color='blue', label='Java')
+axs[2, 0].scatter(pca_standardized[len(java_columns):, 0], pca_standardized[len(java_columns):, 1], color='green', label='Bangka Belitung')
+axs[2, 0].set_title('PCA Estandarizado')
+axs[2, 0].legend()
+# Gráfico de t-SNE Estandarizado
+axs[2, 1].scatter(tsne_standardized[:len(java_columns), 0], tsne_standardized[:len(java_columns), 1], color='blue', label='Java')
+axs[2, 1].scatter(tsne_standardized[len(java_columns):, 0], tsne_standardized[len(java_columns):, 1], color='green', label='Bangka Belitung')
+axs[2, 1].set_title('t-SNE Estandarizado')
+axs[2, 1].legend()
+# Ajustar los subplots
+plt.tight_layout()
+plt.show()

Spectra copy.py ADDED Viewed

	@@ -0,0 +1,107 @@

+import pandas as pd
+import matplotlib.pyplot as plt
+from sklearn.decomposition import PCA
+from sklearn.manifold import TSNE
+from sklearn.preprocessing import StandardScaler, normalize
+# Función para aplicar Min-Max a cada columna
+def min_max_normalize(column):
+    return (column - column.min()) / (column.max() - column.min())
+# Función para aplicar Normax
+def normax_normalize(column):
+    return column / column.max()
+# Cargar el archivo de Excel desde la ruta especificada
+file_path = r"C:\Users\USUARIO\Documents\Indonecia\Rice_Spectral.xlsx"
+data = pd.read_excel(file_path, sheet_name="Spectral")
+# Asegurarse de que los valores de "Location" sean numéricos
+data['Location'] = pd.to_numeric(data['Location'], errors='coerce')
+# Separar los datos de los números de onda (Wavenumbers)
+wavenumbers = data['Location'].dropna()  # Eliminar posibles NaN en wavenumbers
+# Filtrar las columnas que pertenecen a Java y Bangka Belitung
+java_columns = [col for col in data.columns if "Java" in col]
+belitung_columns = [col for col in data.columns if "Bangka Belitung" in col]
+# Asegurarse de que todas las columnas de datos sean numéricas
+data[java_columns] = data[java_columns].apply(pd.to_numeric, errors='coerce')
+data[belitung_columns] = data[belitung_columns].apply(pd.to_numeric, errors='coerce')
+# Aplicar normalización Min-Max y Normax
+data_minmax = data.copy()
+data_normax = data.copy()
+data_minmax[java_columns] = data_minmax[java_columns].apply(min_max_normalize)
+data_minmax[belitung_columns] = data_minmax[belitung_columns].apply(min_max_normalize)
+data_normax[java_columns] = data_normax[java_columns].apply(normax_normalize)
+data_normax[belitung_columns] = data_normax[belitung_columns].apply(normax_normalize)
+# Preparar los datos para PCA y t-SNE
+all_columns = java_columns + belitung_columns
+# Normalización de datos (Min-Max)
+spectral_data_minmax = data_minmax[all_columns].dropna().transpose()
+# Estandarización de datos
+scaler = StandardScaler()
+spectral_data_standardized = scaler.fit_transform(spectral_data_minmax)
+# Normalización Normax
+spectral_data_normax = data_normax[all_columns].dropna().transpose()
+# PCA
+pca_minmax = PCA(n_components=2).fit_transform(spectral_data_minmax)
+pca_normax = PCA(n_components=2).fit_transform(spectral_data_normax)
+pca_standardized = PCA(n_components=2).fit_transform(spectral_data_standardized)
+# t-SNE
+tsne_minmax = TSNE(n_components=2, random_state=42).fit_transform(spectral_data_minmax)
+tsne_normax = TSNE(n_components=2, random_state=42).fit_transform(spectral_data_normax)
+tsne_standardized = TSNE(n_components=2, random_state=42).fit_transform(spectral_data_standardized)
+# Crear subplots
+fig, axs = plt.subplots(3, 2, figsize=(14, 18))
+# Gráfico de PCA Min-Max
+axs[0, 0].scatter(pca_minmax[:len(java_columns), 0], pca_minmax[:len(java_columns), 1], color='blue', label='Java')
+axs[0, 0].scatter(pca_minmax[len(java_columns):, 0], pca_minmax[len(java_columns):, 1], color='green', label='Bangka Belitung')
+axs[0, 0].set_title('PCA Min-Max')
+axs[0, 0].legend()
+# Gráfico de t-SNE Min-Max
+axs[0, 1].scatter(tsne_minmax[:len(java_columns), 0], tsne_minmax[:len(java_columns), 1], color='blue', label='Java')
+axs[0, 1].scatter(tsne_minmax[len(java_columns):, 0], tsne_minmax[len(java_columns):, 1], color='green', label='Bangka Belitung')
+axs[0, 1].set_title('t-SNE Min-Max')
+axs[0, 1].legend()
+# Gráfico de PCA Normax
+axs[1, 0].scatter(pca_normax[:len(java_columns), 0], pca_normax[:len(java_columns), 1], color='blue', label='Java')
+axs[1, 0].scatter(pca_normax[len(java_columns):, 0], pca_normax[len(java_columns):, 1], color='green', label='Bangka Belitung')
+axs[1, 0].set_title('PCA Normax')
+axs[1, 0].legend()
+# Gráfico de t-SNE Normax
+axs[1, 1].scatter(tsne_normax[:len(java_columns), 0], tsne_normax[:len(java_columns), 1], color='blue', label='Java')
+axs[1, 1].scatter(tsne_normax[len(java_columns):, 0], tsne_normax[len(java_columns):, 1], color='green', label='Bangka Belitung')
+axs[1, 1].set_title('t-SNE Normax')
+axs[1, 1].legend()
+# Gráfico de PCA Estandarizado
+axs[2, 0].scatter(pca_standardized[:len(java_columns), 0], pca_standardized[:len(java_columns), 1], color='blue', label='Java')
+axs[2, 0].scatter(pca_standardized[len(java_columns):, 0], pca_standardized[len(java_columns):, 1], color='green', label='Bangka Belitung')
+axs[2, 0].set_title('PCA Estandarizado')
+axs[2, 0].legend()
+# Gráfico de t-SNE Estandarizado
+axs[2, 1].scatter(tsne_standardized[:len(java_columns), 0], tsne_standardized[:len(java_columns), 1], color='blue', label='Java')
+axs[2, 1].scatter(tsne_standardized[len(java_columns):, 0], tsne_standardized[len(java_columns):, 1], color='green', label='Bangka Belitung')
+axs[2, 1].set_title('t-SNE Estandarizado')
+axs[2, 1].legend()
+# Ajustar los subplots
+plt.tight_layout()
+plt.show()

Spectra.py ADDED Viewed

	@@ -0,0 +1,82 @@

+import pandas as pd
+import matplotlib.pyplot as plt
+from sklearn.decomposition import PCA
+from sklearn.manifold import TSNE
+# Función para aplicar Min-Max a cada columna
+def min_max_normalize(column):
+    return (column - column.min()) / (column.max() - column.min())
+# Cargar el archivo de Excel desde la ruta especificada
+file_path = r"C:\Users\USUARIO\Documents\Indonecia\Rice_Spectral.xlsx"
+data = pd.read_excel(file_path, sheet_name="Spectral")
+# Asegurarse de que los valores de "Location" sean numéricos
+data['Location'] = pd.to_numeric(data['Location'], errors='coerce')
+# Separar los datos de los números de onda (Wavenumbers)
+wavenumbers = data['Location'].dropna()  # Eliminar posibles NaN en wavenumbers
+# Filtrar las columnas que pertenecen a Java y Bangka Belitung
+java_columns = [col for col in data.columns if "Java" in col]
+belitung_columns = [col for col in data.columns if "Bangka Belitung" in col]
+# Asegurarse de que todas las columnas de datos sean numéricas
+data[java_columns] = data[java_columns].apply(pd.to_numeric, errors='coerce')
+data[belitung_columns] = data[belitung_columns].apply(pd.to_numeric, errors='coerce')
+# Aplicar normalización Min-Max a cada firma espectral
+data[java_columns] = data[java_columns].apply(min_max_normalize)
+data[belitung_columns] = data[belitung_columns].apply(min_max_normalize)
+# Graficar las firmas espectrales normalizadas
+plt.figure(figsize=(10, 6))
+# Graficar las firmas de Java en un color
+for column in java_columns:
+    plt.plot(wavenumbers, data[column].dropna(), color='blue', label='Java' if 'Java' in column else "")
+# Graficar las firmas de Bangka Belitung en otro color
+for column in belitung_columns:
+    plt.plot(wavenumbers, data[column].dropna(), color='green', label='Bangka Belitung' if 'Bangka Belitung' in column else "")
+# Etiquetas y título
+plt.title('Firmas Espectrales Normalizadas (Min-Max) de Muestras de Arroz')
+plt.xlabel('Número de Onda (Wavenumber)')
+plt.ylabel('Reflectancia Espectral Normalizada')
+plt.legend(['Java', 'Bangka Belitung'])
+# Mostrar la gráfica
+plt.show()
+# Preparar los datos para PCA y t-SNE
+all_columns = java_columns + belitung_columns
+spectral_data = data[all_columns].dropna().transpose()  # Transponer para tener las firmas en filas
+# PCA: Análisis de Componentes Principales
+pca = PCA(n_components=2)
+pca_result = pca.fit_transform(spectral_data)
+# Graficar PCA
+plt.figure(figsize=(8, 6))
+plt.scatter(pca_result[:len(java_columns), 0], pca_result[:len(java_columns), 1], color='blue', label='Java')
+plt.scatter(pca_result[len(java_columns):, 0], pca_result[len(java_columns):, 1], color='green', label='Bangka Belitung')
+plt.title('PCA de Firmas Espectrales')
+plt.xlabel('Componente Principal 1')
+plt.ylabel('Componente Principal 2')
+plt.legend()
+plt.show()
+# t-SNE: Embedding de Vecinos Estocásticos Distribuidos
+tsne = TSNE(n_components=2, random_state=42)
+tsne_result = tsne.fit_transform(spectral_data)
+# Graficar t-SNE
+plt.figure(figsize=(8, 6))
+plt.scatter(tsne_result[:len(java_columns), 0], tsne_result[:len(java_columns), 1], color='blue', label='Java')
+plt.scatter(tsne_result[len(java_columns):, 0], tsne_result[len(java_columns):, 1], color='green', label='Bangka Belitung')
+plt.title('t-SNE de Firmas Espectrales')
+plt.xlabel('Componente t-SNE 1')
+plt.ylabel('Componente t-SNE 2')
+plt.legend()
+plt.show()

create_model.py ADDED Viewed

	@@ -0,0 +1,39 @@

+import pandas as pd
+from sklearn.model_selection import train_test_split
+from sklearn.svm import SVC
+from sklearn.metrics import classification_report
+import os
+import joblib
+# Rutas relativas para el archivo Excel y la ubicación del modelo
+excel_path = os.path.join('data', 'Rice_Spectral_2.xlsx')
+model_path = os.path.join('model', 'svm_model.joblib')
+# Cargar datos desde Excel especificando que los decimales están separados por comas
+data = pd.read_excel(excel_path, sheet_name="Spectral", decimal=',')
+# Asignar etiquetas: '0' para Java y '1' para Bangka Belitung
+labels = [0 if "Java" in col else 1 for col in data.columns]
+# Transponer el DataFrame para tener las firmas en filas y las características en columnas
+data_transposed = data.T
+# Dividir los datos en conjuntos de entrenamiento y prueba
+X_train, X_test, y_train, y_test = train_test_split(data_transposed, labels, test_size=0.001, random_state=42)
+# Crear y entrenar el modelo SVM
+svm_model = SVC(kernel='linear', random_state=42)
+svm_model.fit(X_train, y_train)
+# Evaluar el modelo
+y_pred = svm_model.predict(X_test)
+report = classification_report(y_test, y_pred)
+print("Evaluación del Modelo:")
+print(report)
+# Asegurarse de que el directorio para guardar el modelo existe
+os.makedirs('model', exist_ok=True)
+# Guardar el modelo en la carpeta del modelo
+joblib.dump(svm_model, model_path)
+print(f"Modelo guardado en {model_path}")

main.py ADDED Viewed

File without changes

requirements.txt ADDED Viewed

Binary file (3.23 kB). View file