{ "cells": [ { "cell_type": "code", "execution_count": 1, "id": "5833cc45", "metadata": {}, "outputs": [], "source": [ "import pandas as pd" ] }, { "cell_type": "code", "execution_count": 2, "id": "d9dcd566", "metadata": {}, "outputs": [], "source": [ "data = pd.read_csv(\"diabetic_data.csv\")" ] }, { "cell_type": "code", "execution_count": 3, "id": "02314335", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
| \n", " | encounter_id | \n", "patient_nbr | \n", "race | \n", "gender | \n", "age | \n", "weight | \n", "admission_type_id | \n", "discharge_disposition_id | \n", "admission_source_id | \n", "time_in_hospital | \n", "... | \n", "citoglipton | \n", "insulin | \n", "glyburide-metformin | \n", "glipizide-metformin | \n", "glimepiride-pioglitazone | \n", "metformin-rosiglitazone | \n", "metformin-pioglitazone | \n", "change | \n", "diabetesMed | \n", "readmitted | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "2278392 | \n", "8222157 | \n", "Caucasian | \n", "Female | \n", "[0-10) | \n", "? | \n", "6 | \n", "25 | \n", "1 | \n", "1 | \n", "... | \n", "No | \n", "No | \n", "No | \n", "No | \n", "No | \n", "No | \n", "No | \n", "No | \n", "No | \n", "NO | \n", "
| 1 | \n", "149190 | \n", "55629189 | \n", "Caucasian | \n", "Female | \n", "[10-20) | \n", "? | \n", "1 | \n", "1 | \n", "7 | \n", "3 | \n", "... | \n", "No | \n", "Up | \n", "No | \n", "No | \n", "No | \n", "No | \n", "No | \n", "Ch | \n", "Yes | \n", ">30 | \n", "
| 2 | \n", "64410 | \n", "86047875 | \n", "AfricanAmerican | \n", "Female | \n", "[20-30) | \n", "? | \n", "1 | \n", "1 | \n", "7 | \n", "2 | \n", "... | \n", "No | \n", "No | \n", "No | \n", "No | \n", "No | \n", "No | \n", "No | \n", "No | \n", "Yes | \n", "NO | \n", "
| 3 | \n", "500364 | \n", "82442376 | \n", "Caucasian | \n", "Male | \n", "[30-40) | \n", "? | \n", "1 | \n", "1 | \n", "7 | \n", "2 | \n", "... | \n", "No | \n", "Up | \n", "No | \n", "No | \n", "No | \n", "No | \n", "No | \n", "Ch | \n", "Yes | \n", "NO | \n", "
| 4 | \n", "16680 | \n", "42519267 | \n", "Caucasian | \n", "Male | \n", "[40-50) | \n", "? | \n", "1 | \n", "1 | \n", "7 | \n", "1 | \n", "... | \n", "No | \n", "Steady | \n", "No | \n", "No | \n", "No | \n", "No | \n", "No | \n", "Ch | \n", "Yes | \n", "NO | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 101761 | \n", "443847548 | \n", "100162476 | \n", "AfricanAmerican | \n", "Male | \n", "[70-80) | \n", "? | \n", "1 | \n", "3 | \n", "7 | \n", "3 | \n", "... | \n", "No | \n", "Down | \n", "No | \n", "No | \n", "No | \n", "No | \n", "No | \n", "Ch | \n", "Yes | \n", ">30 | \n", "
| 101762 | \n", "443847782 | \n", "74694222 | \n", "AfricanAmerican | \n", "Female | \n", "[80-90) | \n", "? | \n", "1 | \n", "4 | \n", "5 | \n", "5 | \n", "... | \n", "No | \n", "Steady | \n", "No | \n", "No | \n", "No | \n", "No | \n", "No | \n", "No | \n", "Yes | \n", "NO | \n", "
| 101763 | \n", "443854148 | \n", "41088789 | \n", "Caucasian | \n", "Male | \n", "[70-80) | \n", "? | \n", "1 | \n", "1 | \n", "7 | \n", "1 | \n", "... | \n", "No | \n", "Down | \n", "No | \n", "No | \n", "No | \n", "No | \n", "No | \n", "Ch | \n", "Yes | \n", "NO | \n", "
| 101764 | \n", "443857166 | \n", "31693671 | \n", "Caucasian | \n", "Female | \n", "[80-90) | \n", "? | \n", "2 | \n", "3 | \n", "7 | \n", "10 | \n", "... | \n", "No | \n", "Up | \n", "No | \n", "No | \n", "No | \n", "No | \n", "No | \n", "Ch | \n", "Yes | \n", "NO | \n", "
| 101765 | \n", "443867222 | \n", "175429310 | \n", "Caucasian | \n", "Male | \n", "[70-80) | \n", "? | \n", "1 | \n", "1 | \n", "7 | \n", "6 | \n", "... | \n", "No | \n", "No | \n", "No | \n", "No | \n", "No | \n", "No | \n", "No | \n", "No | \n", "No | \n", "NO | \n", "
101766 rows × 50 columns
\n", "| \n", " | encounter_id | \n", "patient_nbr | \n", "admission_type_id | \n", "discharge_disposition_id | \n", "admission_source_id | \n", "time_in_hospital | \n", "num_lab_procedures | \n", "num_procedures | \n", "num_medications | \n", "number_outpatient | \n", "number_emergency | \n", "number_inpatient | \n", "number_diagnoses | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| count | \n", "1.017660e+05 | \n", "1.017660e+05 | \n", "101766.000000 | \n", "101766.000000 | \n", "101766.000000 | \n", "101766.000000 | \n", "101766.000000 | \n", "101766.000000 | \n", "101766.000000 | \n", "101766.000000 | \n", "101766.000000 | \n", "101766.000000 | \n", "101766.000000 | \n", "
| mean | \n", "1.652016e+08 | \n", "5.433040e+07 | \n", "2.024006 | \n", "3.715642 | \n", "5.754437 | \n", "4.395987 | \n", "43.095641 | \n", "1.339730 | \n", "16.021844 | \n", "0.369357 | \n", "0.197836 | \n", "0.635566 | \n", "7.422607 | \n", "
| std | \n", "1.026403e+08 | \n", "3.869636e+07 | \n", "1.445403 | \n", "5.280166 | \n", "4.064081 | \n", "2.985108 | \n", "19.674362 | \n", "1.705807 | \n", "8.127566 | \n", "1.267265 | \n", "0.930472 | \n", "1.262863 | \n", "1.933600 | \n", "
| min | \n", "1.252200e+04 | \n", "1.350000e+02 | \n", "1.000000 | \n", "1.000000 | \n", "1.000000 | \n", "1.000000 | \n", "1.000000 | \n", "0.000000 | \n", "1.000000 | \n", "0.000000 | \n", "0.000000 | \n", "0.000000 | \n", "1.000000 | \n", "
| 25% | \n", "8.496119e+07 | \n", "2.341322e+07 | \n", "1.000000 | \n", "1.000000 | \n", "1.000000 | \n", "2.000000 | \n", "31.000000 | \n", "0.000000 | \n", "10.000000 | \n", "0.000000 | \n", "0.000000 | \n", "0.000000 | \n", "6.000000 | \n", "
| 50% | \n", "1.523890e+08 | \n", "4.550514e+07 | \n", "1.000000 | \n", "1.000000 | \n", "7.000000 | \n", "4.000000 | \n", "44.000000 | \n", "1.000000 | \n", "15.000000 | \n", "0.000000 | \n", "0.000000 | \n", "0.000000 | \n", "8.000000 | \n", "
| 75% | \n", "2.302709e+08 | \n", "8.754595e+07 | \n", "3.000000 | \n", "4.000000 | \n", "7.000000 | \n", "6.000000 | \n", "57.000000 | \n", "2.000000 | \n", "20.000000 | \n", "0.000000 | \n", "0.000000 | \n", "1.000000 | \n", "9.000000 | \n", "
| max | \n", "4.438672e+08 | \n", "1.895026e+08 | \n", "8.000000 | \n", "28.000000 | \n", "25.000000 | \n", "14.000000 | \n", "132.000000 | \n", "6.000000 | \n", "81.000000 | \n", "42.000000 | \n", "76.000000 | \n", "21.000000 | \n", "16.000000 | \n", "