Upload folder using huggingface_hub

Browse files

Files changed (5) hide show

config.json +39 -0
generation_config.json +6 -0
medicine predictor/medical_recomendation.py +212 -0
model.safetensors +3 -0
training_args.bin +3 -0

config.json ADDED Viewed

	@@ -0,0 +1,39 @@

+{
+  "_name_or_path": "gpt2",
+  "activation_function": "gelu_new",
+  "architectures": [
+    "GPT2LMHeadModel"
+  ],
+  "attn_pdrop": 0.1,
+  "bos_token_id": 50256,
+  "embd_pdrop": 0.1,
+  "eos_token_id": 50256,
+  "initializer_range": 0.02,
+  "layer_norm_epsilon": 1e-05,
+  "model_type": "gpt2",
+  "n_ctx": 1024,
+  "n_embd": 768,
+  "n_head": 12,
+  "n_inner": null,
+  "n_layer": 12,
+  "n_positions": 1024,
+  "reorder_and_upcast_attn": false,
+  "resid_pdrop": 0.1,
+  "scale_attn_by_inverse_layer_idx": false,
+  "scale_attn_weights": true,
+  "summary_activation": null,
+  "summary_first_dropout": 0.1,
+  "summary_proj_to_labels": true,
+  "summary_type": "cls_index",
+  "summary_use_proj": true,
+  "task_specific_params": {
+    "text-generation": {
+      "do_sample": true,
+      "max_length": 50
+    }
+  },
+  "torch_dtype": "float32",
+  "transformers_version": "4.47.1",
+  "use_cache": true,
+  "vocab_size": 50257
+}

generation_config.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+  "_from_model_config": true,
+  "bos_token_id": 50256,
+  "eos_token_id": 50256,
+  "transformers_version": "4.47.1"
+}

medicine predictor/medical_recomendation.py ADDED Viewed

	@@ -0,0 +1,212 @@

+# -*- coding: utf-8 -*-
+"""Medical Recomendation
+Automatically generated by Colab.
+Original file is located at
+    https://colab.research.google.com/#fileId=https%3A//storage.googleapis.com/kaggle-colab-exported-notebooks/medical-recomendation-bdc9e8f5-dc04-4b0d-899b-76151393f750.ipynb%3FX-Goog-Algorithm%3DGOOG4-RSA-SHA256%26X-Goog-Credential%3Dgcp-kaggle-com%2540kaggle-161607.iam.gserviceaccount.com/20250105/auto/storage/goog4_request%26X-Goog-Date%3D20250105T163440Z%26X-Goog-Expires%3D259200%26X-Goog-SignedHeaders%3Dhost%26X-Goog-Signature%3D5f5edfc6179d91a128626c6c369d548e8371ff02ec6ab300764df5e5763928d98eb94faa3f3754b73d8cbfbca8f734df4b630c9f8a6520c811a366bf273ce121a32bc10bd6e0e61fb1169f3394260d7a21669fde4e46d4733e405b9df204bbc22ed3e86c3868e249f5f36197a99430999180fc7d6cda561cfeba0c1a874175426fca7775518c5c46275376390d75492c2deaa164a4fa096cd33ce0bbdc7b95c952846e3a4bea9230588bf1481c24bef89559057f4974519bd4d1b6933423c7ffe2201c7fec3dccb0c3b3983d5d34b0f74c799f6cf1f5de6bbc61812e36acaee18ed0b43de1a92f62a1ce36d5225e8b96e6b05440463d9f9914322a7ab6d7e8a0
+"""
+# IMPORTANT: RUN THIS CELL IN ORDER TO IMPORT YOUR KAGGLE DATA SOURCES,
+# THEN FEEL FREE TO DELETE THIS CELL.
+# NOTE: THIS NOTEBOOK ENVIRONMENT DIFFERS FROM KAGGLE'S PYTHON
+# ENVIRONMENT SO THERE MAY BE MISSING LIBRARIES USED BY YOUR
+# NOTEBOOK.
+import kagglehub
+noorsaeed_medicine_recommendation_system_dataset_path = kagglehub.dataset_download('noorsaeed/medicine-recommendation-system-dataset')
+print('Data source import complete.')
+# This Python 3 environment comes with many helpful analytics libraries installed
+# It is defined by the kaggle/python Docker image: https://github.com/kaggle/docker-python
+# For example, here's several helpful packages to load
+import numpy as np # linear algebra
+import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)
+# Input data files are available in the read-only "../input/" directory
+# For example, running this (by clicking run or pressing Shift+Enter) will list all files under the input directory
+import os
+for dirname, _, filenames in os.walk('/kaggle/input'):
+    for filename in filenames:
+        print(os.path.join(dirname, filename))
+# You can write up to 20GB to the current directory (/kaggle/working/) that gets preserved as output when you create a version using "Save & Run All"
+# You can also write temporary files to /kaggle/temp/, but they won't be saved outside of the current session
+import  pandas as pd
+dataset = pd.read_csv('/kaggle/input/Training.csv')
+dataset
+dataset.shape
+from sklearn.model_selection import train_test_split
+from sklearn.preprocessing import LabelEncoder
+X = dataset.drop('prognosis', axis=1)
+y = dataset['prognosis']
+# ecoding prognonsis
+le = LabelEncoder()
+le.fit(y)
+Y = le.transform(y)
+X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size=0.3, random_state=20)
+from sklearn.datasets import make_classification
+from sklearn.model_selection import train_test_split
+from sklearn.svm import SVC
+from sklearn.ensemble import RandomForestClassifier, GradientBoostingClassifier
+from sklearn.neighbors import KNeighborsClassifier
+from sklearn.naive_bayes import MultinomialNB
+from sklearn.metrics import accuracy_score, confusion_matrix
+import numpy as np
+# Create a dictionary to store models
+models = {
+    'SVC': SVC(kernel='linear'),
+    'RandomForest': RandomForestClassifier(n_estimators=100, random_state=42),
+    'GradientBoosting': GradientBoostingClassifier(n_estimators=100, random_state=42),
+    'KNeighbors': KNeighborsClassifier(n_neighbors=5),
+    'MultinomialNB': MultinomialNB()
+}
+for model_name, model in models.items():
+    # Train the model
+    model.fit(X_train, y_train)
+    # Test the model
+    predictions = model.predict(X_test)
+    # Calculate accuracy
+    accuracy = accuracy_score(y_test, predictions)
+    print(f"{model_name} Accuracy: {accuracy}")
+    # Calculate confusion matrix
+    cm = confusion_matrix(y_test, predictions)
+    print(f"{model_name} Confusion Matrix:")
+    print(np.array2string(cm, separator=', '))
+    print("\n" + "="*40 + "\n")
+# selecting svc
+svc = SVC(kernel='linear')
+svc.fit(X_train,y_train)
+ypred = svc.predict(X_test)
+test_accuracy = accuracy_score(y_test,ypred)
+train_pred = svc.predict(X_train)
+train_accuracy = accuracy_score(y_train, train_pred)
+train_accuracy
+if train_accuracy - test_accuracy > 0.1:  # 10% gap threshold
+    print("The model is likely overfitting.")
+else:
+    print("The model generalizes well.")
+# Plotting
+import matplotlib.pyplot as plt
+# Plotting as a line chart
+labels = ['Training Accuracy', 'Test Accuracy']
+accuracies = [train_accuracy, test_accuracy]
+plt.figure(figsize=(8, 5))
+plt.plot(labels, accuracies, marker='o', color='blue', label="Accuracy")
+# Adding details to the plot
+plt.title('Overfitting Check: Training vs Test Accuracy', fontsize=14)
+plt.ylabel('Accuracy', fontsize=12)
+plt.ylim(0, 1)
+plt.grid(alpha=0.4)
+plt.legend(fontsize=12)
+# Display the accuracies as text on the plot
+for i, acc in enumerate(accuracies):
+    plt.text(i, acc + 0.02, f"{acc:.2f}", ha='center', fontsize=12)
+plt.show()
+# save svc
+import pickle
+pickle.dump(svc,open('svc.pkl','wb'))
+# load model
+svc = pickle.load(open('svc.pkl','rb'))
+# test 1:
+print("predicted disease :",svc.predict(X_test.iloc[0].values.reshape(1,-1)))
+print("Actual Disease :", y_test[0])
+# test 2:
+print("predicted disease :",svc.predict(X_test.iloc[100].values.reshape(1,-1)))
+print("Actual Disease :", y_test[100])
+sym_des = pd.read_csv('/kaggle/input/symtoms_df.csv')
+precautions = pd.read_csv('/kaggle/input/precautions_df.csv')
+workout = pd.read_csv('/kaggle/input/workout_df.csv')
+description = pd.read_csv('/kaggle/input/description.csv')
+medications = pd.read_csv('/kaggle/input/medications.csv')
+diets = pd.read_csv('/kaggle/input/diets.csv')
+def helper(dis):
+    desc = description[description['Disease'] == predicted_disease]['Description']
+    desc = " ".join([w for w in desc])
+    pre = precautions[precautions['Disease'] == dis][['Precaution_1', 'Precaution_2', 'Precaution_3', 'Precaution_4']]
+    pre = [col for col in pre.values]
+    med = medications[medications['Disease'] == dis]['Medication']
+    med = [med for med in med.values]
+    die = diets[diets['Disease'] == dis]['Diet']
+    die = [die for die in die.values]
+    wrkout = workout[workout['disease'] == dis] ['workout']
+    return desc,pre,med,die,wrkout
+symptoms_dict = {'itching': 0, 'skin_rash': 1, 'nodal_skin_eruptions': 2, 'continuous_sneezing': 3, 'shivering': 4, 'chills': 5, 'joint_pain': 6, 'stomach_pain': 7, 'acidity': 8, 'ulcers_on_tongue': 9, 'muscle_wasting': 10, 'vomiting': 11, 'burning_micturition': 12, 'spotting_ urination': 13, 'fatigue': 14, 'weight_gain': 15, 'anxiety': 16, 'cold_hands_and_feets': 17, 'mood_swings': 18, 'weight_loss': 19, 'restlessness': 20, 'lethargy': 21, 'patches_in_throat': 22, 'irregular_sugar_level': 23, 'cough': 24, 'high_fever': 25, 'sunken_eyes': 26, 'breathlessness': 27, 'sweating': 28, 'dehydration': 29, 'indigestion': 30, 'headache': 31, 'yellowish_skin': 32, 'dark_urine': 33, 'nausea': 34, 'loss_of_appetite': 35, 'pain_behind_the_eyes': 36, 'back_pain': 37, 'constipation': 38, 'abdominal_pain': 39, 'diarrhoea': 40, 'mild_fever': 41, 'yellow_urine': 42, 'yellowing_of_eyes': 43, 'acute_liver_failure': 44, 'fluid_overload': 45, 'swelling_of_stomach': 46, 'swelled_lymph_nodes': 47, 'malaise': 48, 'blurred_and_distorted_vision': 49, 'phlegm': 50, 'throat_irritation': 51, 'redness_of_eyes': 52, 'sinus_pressure': 53, 'runny_nose': 54, 'congestion': 55, 'chest_pain': 56, 'weakness_in_limbs': 57, 'fast_heart_rate': 58, 'pain_during_bowel_movements': 59, 'pain_in_anal_region': 60, 'bloody_stool': 61, 'irritation_in_anus': 62, 'neck_pain': 63, 'dizziness': 64, 'cramps': 65, 'bruising': 66, 'obesity': 67, 'swollen_legs': 68, 'swollen_blood_vessels': 69, 'puffy_face_and_eyes': 70, 'enlarged_thyroid': 71, 'brittle_nails': 72, 'swollen_extremeties': 73, 'excessive_hunger': 74, 'extra_marital_contacts': 75, 'drying_and_tingling_lips': 76, 'slurred_speech': 77, 'knee_pain': 78, 'hip_joint_pain': 79, 'muscle_weakness': 80, 'stiff_neck': 81, 'swelling_joints': 82, 'movement_stiffness': 83, 'spinning_movements': 84, 'loss_of_balance': 85, 'unsteadiness': 86, 'weakness_of_one_body_side': 87, 'loss_of_smell': 88, 'bladder_discomfort': 89, 'foul_smell_of urine': 90, 'continuous_feel_of_urine': 91, 'passage_of_gases': 92, 'internal_itching': 93, 'toxic_look_(typhos)': 94, 'depression': 95, 'irritability': 96, 'muscle_pain': 97, 'altered_sensorium': 98, 'red_spots_over_body': 99, 'belly_pain': 100, 'abnormal_menstruation': 101, 'dischromic _patches': 102, 'watering_from_eyes': 103, 'increased_appetite': 104, 'polyuria': 105, 'family_history': 106, 'mucoid_sputum': 107, 'rusty_sputum': 108, 'lack_of_concentration': 109, 'visual_disturbances': 110, 'receiving_blood_transfusion': 111, 'receiving_unsterile_injections': 112, 'coma': 113, 'stomach_bleeding': 114, 'distention_of_abdomen': 115, 'history_of_alcohol_consumption': 116, 'fluid_overload.1': 117, 'blood_in_sputum': 118, 'prominent_veins_on_calf': 119, 'palpitations': 120, 'painful_walking': 121, 'pus_filled_pimples': 122, 'blackheads': 123, 'scurring': 124, 'skin_peeling': 125, 'silver_like_dusting': 126, 'small_dents_in_nails': 127, 'inflammatory_nails': 128, 'blister': 129, 'red_sore_around_nose': 130, 'yellow_crust_ooze': 131}
+diseases_list = {15: 'Fungal infection', 4: 'Allergy', 16: 'GERD', 9: 'Chronic cholestasis', 14: 'Drug Reaction', 33: 'Peptic ulcer diseae', 1: 'AIDS', 12: 'Diabetes ', 17: 'Gastroenteritis', 6: 'Bronchial Asthma', 23: 'Hypertension ', 30: 'Migraine', 7: 'Cervical spondylosis', 32: 'Paralysis (brain hemorrhage)', 28: 'Jaundice', 29: 'Malaria', 8: 'Chicken pox', 11: 'Dengue', 37: 'Typhoid', 40: 'hepatitis A', 19: 'Hepatitis B', 20: 'Hepatitis C', 21: 'Hepatitis D', 22: 'Hepatitis E', 3: 'Alcoholic hepatitis', 36: 'Tuberculosis', 10: 'Common Cold', 34: 'Pneumonia', 13: 'Dimorphic hemmorhoids(piles)', 18: 'Heart attack', 39: 'Varicose veins', 26: 'Hypothyroidism', 24: 'Hyperthyroidism', 25: 'Hypoglycemia', 31: 'Osteoarthristis', 5: 'Arthritis', 0: '(vertigo) Paroymsal  Positional Vertigo', 2: 'Acne', 38: 'Urinary tract infection', 35: 'Psoriasis', 27: 'Impetigo'}
+def get_predicted_value(patient_symptoms):
+    input_vector = np.zeros(len(symptoms_dict))
+    for item in patient_symptoms:
+        input_vector[symptoms_dict[item]] = 1
+    return diseases_list[svc.predict([input_vector])[0]]
+symptoms = input("Enter your symptoms.......")
+user_symptoms = [s.strip() for s in symptoms.split(',')]
+user_symptoms = [symptom.strip("[]' ") for symptom in user_symptoms]
+predicted_disease = get_predicted_value(user_symptoms)
+desc, pre, med, die, wrkout = helper(predicted_disease)
+print("=================predicted disease============")
+print(predicted_disease)
+print("=================description==================")
+print(desc)
+print("=================precautions==================")
+i = 1
+for p_i in pre[0]:
+    print(i, ": ", p_i)
+    i += 1
+print("=================medications==================")
+for m_i in med:
+    print(i, ": ", m_i)
+    i += 1
+print("=================workout==================")
+for w_i in wrkout:
+    print(i, ": ", w_i)
+    i += 1
+print("=================diets==================")
+for d_i in die:
+    print(i, ": ", d_i)
+    i += 1

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c7d00560d8910fbed77ffad4065dee5011c41ba401b1064e749c498ba9e20373
+size 497774208

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2937d5ad2e6a4434c87e5560f7e335c52695ce9d8ca7f7c49e96bc58d565728f
+size 5304