Devocean-06
/

Spam_Filter-gemma

@@ -5,7 +5,7 @@ language:
 pipeline_tag: text-generation
 ---
 <p align="left">
-  <img src="<data:image/jpeg;base64,/9j/4AAQSkZJRgABAQAAAQABAAD/2wCEAAkGBxMREhMSEhMVFRUVGBUXGBYVERgWGBgWFRcXFxYYFxUYHSgiGBomGxMWITEhJSkrOi4vGCAzODMtNygtLisBCgoKDg0OGxAQGy0lICUvLS0vMC8tLS0tLTUtLS0vLS4vLS0tLS0tLS0rLS0tLS0tLSstLS0tLS0tLS0tLS0tLf/AABEIAOEA4QMBIgACEQEDEQH/xAAbAAEAAwEBAQEAAAAAAAAAAAAABAUGAwIBB//EAEUQAAICAQMBBAYGBggEBwAAAAECAAMRBBIhMQUTQVEGIjJhcYEUI0JSYpEzU3KCobEHJDRDc4OSohWTo9IWVGSVpMHC/8QAGQEBAAMBAQAAAAAAAAAAAAAAAAIDBAEF/8QAJxEBAAICAgICAgAHAAAAAAAAAAECAxESMQQhQVEiYRMjMjNxgZH/2gAMAwEAAhEDEQA/AP3GIiAiIgIiICIiAiIgIiICIiAiIgIiICIiAiIgIiICIiAiIgIiICIiAiIgIiICIiAiJ8zA+xOGt1a01tY5wqDJ4yfgAOST0AHUnE+6PVJbWltZDI6hlI8VYZB/IwO0REBERAREQEREBERARE8ucAn3QPUTNeiPpDZqEqXUKq2WVJarICEcFVLDaclHUuPVycjkHqFt+1u16dKm+5wo5wACzsQMkIigs5wCcAGc27NZidSnROenuDorrnDAMMjBwwyMjw6zpOuEREBESNrtfXSAbGxn2VVWdmx12ogLN8hAkxK3s7t2i+xqkZhYo3Guyp6n28esq2KCy8gbhkZOJ57WvY2VadWKd4LHZgPW7uoorKrfZYtcnPluxzgjk2iI2aWkTLa6k6T6+qy0qg3WVPc9qvWOXwLCSrhckFSMkAHIM1AMjS8W6dmNPsSl/wCJX2r3lCV939g2swNg+9hR6iHqDySDnA8ZfY/aPfoSUNboxR0LBtrAA8MPaUgqwPHDDIByB2LxM6g1KfMn29psawWKxR2pXa69R3TvuBHRl+uXKng/EAjU3swViq7mAJVS20E44G7Bxk+MwF+p1OptHfWrp7K1b6hKMuofbkmy0kWrlAA6KBnPWLz6WYY3dN1Xaz6h6qLE2tXm6wjmt9pAqKE843EttPKmsdRhmuvQ040qV4x3TWVYPgK7GVPkUCsPcwlTShCgFixAwWIAJ95CgD8hHZ+t+i3lmOKbyocnpXcAERz5KyhUJ8CqHxYiFb7n20ZcMRT8WxiIlrEREQEREBERARE5arUpUpex1RR1Z2CgfEngQOsrvSDXdxp7bBywUhAftWP6ta/N2UfOQbfSms/2dHvPgyrsq9x718Bl96bvhKS/T2X3JqNQ+TWD3dKfoaiwwXGRmyzBK7zjgnCrk5ja8Qux4bWnr0hlXQUUabb3mn7r61lLJUFXYcgEF3atmAUEcNkkDG77rezu8YUgtZdqj3dlrnL9x1vORgIvdhgAoADOvHMtxKi16kvJW29r8Y2Us9jKrHIzUgIRcgcsAOBk8Smstt6RqZ+X6IBjgT7Mx2Db2hvTvEPcnO76S1QuHHqlPo+VI49lsHnrxg6eaHmzGpIiIcJQNq1XXWV2HDNVUas49ZFazvQnmQxXcPJkl/InaPZtOoUJdWtighgGXOGHRlPgeeokb15Rp2J0oe1mDX6UJzaLVK46ivpeTjomwkEnjJQdcS47Z7Oa4I1dnd21ncj43LyMMjrkbkI6jI5AIIIErV7Kq0WorvqQIloFFpySdxbOnYljn2mZPf3q+U0cjTHxrqXZncsnoqb9VdfTqNiJQ6Kyplu+DVpYPWbGxPWKlcEnaRkDrq3XIIPQ8fnKnRPjW6pMf3Wmsz57jen8O5H5y3kq1ivTkztkKe2foxXR3pYLEXCFKLbltqTCrYO6RtvVQVbGG4GQQTddg6dh3ljqVNjAhWxuCKoUbgOhJyceAIB5yJ87I+st1Go8GYUp+xQWBPzta34gLLaRriittw7NvWiV/bPZKalNrEqynNdi+3W3mpP5EHgjgiWESxGJ0wuk1TbnqtwLa22PjpuwGBXP2WVlYe5gDzmSnQEEEAggggjIIPBBB6iU3p3r/o+rufaW+p0zbV4LO1l6YDHjOEXj3Sf2Tr1vrSxDkMoYHzDDIP8AGZ7V09bHfnWJ+XTRam/R8VZvo/UM4FlY8qLGOGH4HIxnhgAFmh7M9IdPedivts5+qtU128cE92+Cwz9pcjyMppx1WlS1dtiK69cMAQCOhGeh94nYyTHam/jVt7j02kTFabU6nTAd05vrH9zc2XA44r1B5Jxnizdk/aXrLvT+lekavvHuSkA7WW9lqdG+6yuevkRkHggkEGWxaJY74rU7XUSls9KdMOjWuPOrSai0fnXW3E5H0v0/3dV/7dq/D/KktocZX8gdrdsVaYDvCSzcJWg3WOfwoPAZGWOAOpIHMqNb6Z0hB3K2va7BKq7NPdRuc5PLW1jCgBmYjPqqcAnANbpdJtZrHbvLrMd5aRgnHRVH2Kxk4QdOpySSYWvpbiwzef0lWdqaq7OSumU9FTFluPxWMNinrkKrY8GMir2fXuDsu9x0e1ja4+DOSV+WJKiUzaZb6YqV6gnmywKMmeL7ggyfymC7X9Kme1O6I7pXQMxHDqzBW2nwUAk7vEgY49rtKTbpObRX3LWO1uquTTUsa94ZrLB7SUpgMV8N7FlUZ6ZLc7cTcdl9mU6asVUVhEHOB1JPVmY8sx6liSTMx/R8u6zW2Y5V6qB+ylS25/1alh8hNnLqRqHneRfleY+iIiSUEREBERA5avTrajVuMqwIPOOvkfA+/wAJD7M1pO6m0/W1AbvDchzstHubac+TBh4ZljMj6Sdn167UIjAlNNuFmGI7w2hT9HfHtV4CO6ng/V9eROTOna1mZ1DlqvSIfTK7dNVZqK3otUtWa1V2rsqas1va6h1xZZ6wyDkYJ5xK1fpTvQUpXbTqriK6kuQe0+cuHUlHCKrOQrE4XHiJKs06sUYjmskrgkYypU8DqMMeD7j4CcNbpEtRq7F3KccdOQcqwI5VgQCGHIIBHMjzaP4ETC/0GkWmtKk9lFCjPJwoxyfE++d5R+jWuc79Ncxa2nGHIANtTZ2WHHG7gq2MespOAGEvJNnmNToiIhx+Qf0pOfpRHm1I+S03EfxJkH0K7S7tjQTxlnT4E5sT5Mdw9zH7ss/6V6D9JU44xQ35jU1kfmU/1CYoFgQynaynKnyI8x4jqCPEEiX0xxkxTH7bMVuOpfsAOZX2dqbrO5oQ3WA4cqQK6v8AFs5w34AC3uA5kDsB7ddSjENVSRzhiHs89rjlaeuGGC/htHta7R6VKkWutVRVGFVQFUDyAHSYIq0Xv9Ix7NDqBYze8I7ICfiDnHuz8Z10fZ1NPNVSIT1ZUAY/Fup+ZkqJJVM77fSZx1CgidGbEh33Z4E5MpUiZlA1G0PUW65ZV8sspY/PajfmfOSJE7VqZqyUGXQixB95qyGC58NwBX96d9NetiLYhyjqGU+asMg/kZBf8uk533BRk/L3z1Y4UZMwHpX281rmmokKMixwcf5aHz+8w6dBznbPHSb21Ba0VjcuXpP2335NaN6mSHYH2sfYU/c8z49Omc0TrnA+8yL82dVH859AxwOAJM7Go7zU1L4KWtbjwQYX/qPWfkZ6nCuLHOmSZm9vb9X/AKPUwNafPUg//G04/wDqa2Z30Fr/AKuz/rLbWH7Kt3an5isH5zRTDHTLknd5/wAkRE6gREQERECL2pq+5pstxnYpIHmQPVX5nA+cp9Bp+7QKTluWZvvO5LO3zYk/OSPSg5WmvP6S6vp4irNxHw+p/jEhZowx62TkZ1Mj2tgZkJaKq7tCw1vXqFB3UE7gPtUvgXJ05wAHA8WqUeM2QOeRMpYeZa+i1uaBXnmlmq+S81/9Nk/OSxz8KvJprVlvERLGRhv6Tuzi61WKOSHqz4Cw7baC3u307f35i+yeyq9ZYmV+rULZYCMZznZUw95B3DyUg+1P130g0KX6a2uxtilSd/GUZfWWwZ8VZQ3ymM9GNF3WnUsqrZb9dbtGB3toBbj3cL+6M8zk5JpExHy1+P8AlGvpfU2BRJAsGJVCqy5jXUQuPbtI3BMjO1VPtWEEHB4UEE54Vo2t7KqTU0Ly7VVPYXsO+wu7d2jbj0wouG1cAb+gwMURK201m3GO16bgJyfVeUiROclsY4ensJnmInEwSlvuOjZiQPo7ktnoKbGOX3eVbMd2fBi2eCMWfYnZlDWX1vUjFWFyvtAdRqC+4CwesPrK7D16OB4SRr+xLEUmh2sAH6G1t2QP1dx9YN/iFgcAZXJM5yiJ0p/jRFtWhh/Sb0ibBrq3E87rFUslQ8fWAID48+nU+AOTpUYAXkeGDnPvz4/GfpeksUqCnA5GNu0qQSGUr9lgcgjzlX2h2CjFraQEtPJHStz+Nfsk/fHPnuxibMGeuP1Mf7WZMM2/KJ2zGn7OZuTwJcdhaA4Jq/SagrXUevq+ttfHljfafwqPKcKh32U5VRnvsnGwKSHQkdGOCODwMnPTP6R6I9jbf6zYCGK7akIxsrOCSR4M2F+AAHBLZtz5OX4wzzaKV5f8aLRaVaa0qQYRFVVHkFGB/KdoiUsJERAREQERECj7eP12mHl3zdPJAvy/SfxnqcPSbi3St77U+bIH/lUZ4N/T5yq0+2zDXdHvU24EjvbkTw7ZM8yuZaq1iIJK9GnxfqE8GSmz97162/hXXIskdif2r40t/B0/7v4yWP8AqV+TH8uWmiIl7zVR6XPjR6gH7SFP+YRX/wDqUerdhhUxvdgiZ6bmzgkeIABYjyUy59Mq92jtz0BqY/BLUc/wUyt0FYfVLnnukdx7mcitW/096P3pVkasFuNLSutBo1prWtM4UdT1Yk5ZmPizEkk+ZMpfSSspbTqP7vDU2e7vGRqnJ+6GVk/zgegM0U8W1hlKsAysCCCMggjBBB6jEoiVdbTE7Z6J5s7Hvo4pIuqHRHfbcg54W1vVtHQAPtI8XacDqivD06hT5fRrLP8AfSHX+Mk3VzUn5SYM51s7Y2U3Nnzr7rHvPfFTj4AybV2MbP0+Nv6pSSrf4jEAsPwgAee4TkzEFs1Y/b76OVZD3+FuwJ/hIDsOPxM7sPcyy4gxKpncsMzudyyfpDoO7tOpThX2rePhhUux94cK3muD9gCRpqNRWHDKwyrAqR5gjBH5GZDQ52BWJLIWrYnqWqY1k/Mpn5yWO2403+Lf1xRNXpErb6RlsI6XMhP1Z2MpclfE7QTycZAOMifqc/Mu203abUDzptHzKED+JE/S61wAPICasfTP5sRFo09RESxiIiICIiAiIgUvpan1As/U2V2H3KDtsPyrdzKzPhNPrNMLa3rb2XVkPwYEH+cx+gdigD+2uUf9uslHx7iVJHuIlWSPlt8S3dUiIiVNhOvYzf1xR5UWn87Kf+0ziTiffRAF9Vq7fsKlFI/bHeWv/ttqk8fajyP7ctdERL3muOs0y21vW3KurKfgwIP85j/RbUZvIf8ASdya24I9fTXFLCM+Ba0EeYOZtpj/AEiq+ialNZ0qdlFv4WK93n4Muz96lR1eV5I3C3HPdftb6ns8uSe/vU/Z2Oqhfgu3Dfvhp40OpsDmm7BfBZLFGBagIBJX7NikgMBwcqw6lVnqcjI5B8pG7R05dPUwLEIesnoHGeD7mBZT7mMyctmkqIiRdJX6vtZEY1or3WjBNdQBKg9C7MQlfByNzAnwBkjXbyu2slWb1Q4AOwHq/PGQAcZ8duY7P0NdCCutcKMnkklmPtM7Hl3J5LHJJnXEIPrXz6mnqHhussvbH4lVawp9wZvjJ9ZYIO8KlvEopVfkpJI4x4mdjI1r5nLS7EOcyjfp9UPAXDH71FDn/c7TViZWqwMXt8LHZ/ivCof+WiTuLuWvxo/N2bTb2opHW2xN3urrPe2Z9xCBPjYJvZmvRPRlydW49pdlIPUVEhmf3d4VU4+6iHgkiaWbqRqGXycnO8kREkoIiICIiAiIgJj/AEjqOmv77+51BUP+C8AKh+Dqqr+0ijq82E4a3SJdW1VihkcEMD4g/wAj7/CcmNxpPHeaW5QyC6xT4w2sQeMp9bpLNLaKLjuDZ7m7wtUc7W8rlA5H2gNw+0FSia6etS1bxuEvVa3PTgTR+g2n26RHPW8tecjBxYcoCPMV7B8pjzpe/ZNOD+mYVnnHqYLW4Pge7V8e/E/T1UAAAYA4AHkJZjhj8y/VX2IiWMROWr0yWo1dihkcEMp6EGdYgYrQ2P2Yfo+pcnTDA0+pc8BScCi9sYRlyoVzwwOM5GDpg+ZL1FC2KyOoZWBVlYAqwPBBB4IxMvrOzG0CBtPYg064Hcai3aFyeBTe2SnkK2yOgBSZsmH5qnFvtYL2qq8XK9TAc5rdq/3blXYR5cg+YHSeKO1dIuVW+heSxXvkByTkkjPXMqNH6aaZmCWO2msPRNSpp3ckZSxvUsGRwVYzQC4kZzkH5iUTOu4T05jtigutaWrY7fZrYWEDn1mC52JwfWOB4dSAZhcCRQ2OnHwEEyE2+ndPdlmZzkfXa6qhd11iVrxy7hRzwAM9ST4CVido6jVEppKLFT/zN6GpP8utxvf3MVx8Z2tLW6d3EPvpB2gADSrAErm1s4FdXOST4MwyB5Dc3gM/Ox+wzqcPau3T4GEIIa79pT7NXT1Ty3jheGsezfRKtCGvbvmDCzBHqd4DkOQSS7AgEFicYGAuBjRzZjxRWC2bVeNfnuSIiXM5ERAREQEREBERAREQI3aPZ9eoraq5A6NjIPmDkEHqrAgEEcggET801WNN3wd2ZKrjWGcZfbhXy5UchVYsWxwiknoSf1SQ17MpFrXite8YYZscngLz4ZwqjPXCgdBI2ja3FlnHO2Aq7JsuuZBTW4StH3d8UtXvHfBr9U45oUhgwIIHlP0HsxbRVWLiDYFAcjoWHU9B/KZjtXs//h9i6nTIdnCsgbgD2VrG44SpsgADAR1Q8KzmarRatLkWys5VungQQcEEHkMCCCD0IInKxr07lyzknbvERJqSImY7S1X0u19Ov9nqO20/rrOppB/Vrxv8ydng4nJnTtazadQlW9tG4ldLtKAkNeeVyOoqX+8I6Fs7QfvEFRwo7PRW7wgvZz9bYd9nPXDH2B+FcD3SUowABwBwAOAAOgAnwnEhM7aqY4h8tAIIPSZq3sesEsiBSTklCa2PvLJgk/OXWouzwOk4SuZa8caj2qe4ZQB3l4x/6m4/xZiZ8fTl+C9ze76Rdj8g+JNo1nejNFb3L99Nqof2bLCquPeuZ9s1FifpNPci/eAS1fmKmZh8duJD07zxRPUJHoai6djp2VcsC9VpGbGUe0ljnl3Xdwx5KnzUk6+YDtHVAVLqqyG7ki9Snrbgme8VSOu6s2J+9N8rAgEdDzNFJ3Dz/Ix8beupfYiJNQREQEREBERAREQEREBERAREQPNtYZSrAMrAggjIIPBBB6jEyNmlu7Oc2VnvKD7Qc9FHA7x/BlAwLjwQALMYFs2ETkxsQuze1K7wdhwwxurbh1z03L5eRGQeoJHMmzOdqeiqOQ9Dd068qPW2DJBPdlGDUk4+wQpydytK6rtDtLTcXV98oA9bYbOfH67Tpkj46dfiZzcx27pbemfbDaXT5r/S2MtVeMHaXOGswfBF3Nz5AeMrtAi0qEQYUdOcnzJJPLEkkknqSSZHt1z653qNaKy6e4qFexiLGasIWFlVZU5U44Pj0xI/ZPaiXVpYp9Vhke49CrDwYEEEeBBlV7b6bPFrExP2ujqvjOL2kzkHHmPzg2DzEhtrimnqctHoRqvXsG6jPqIR6t2Ptv8Aerz7K9GxuORtnPSJ9KbAH9XUkO56WsOO6TzTPtt042jOW26SV3tr1DPmyb/GCIiUs6g7f0Hdh9RWvXm+sDixBwbAv6xV8vaUYOSFxdeh1u7Q6Q7t/wBTWN+c7tqhd2fHOM/OdQ3InD0LQDQ6baMKawyDyR/WRfkpA+U1+Pbe4QyWnUQuoiJpVEREBERAREQEREBERAREQEREBERAREQKbtL1dVp28HS6r971LVH+mqz8pntb2TWl7KWakWvurtQjHeMcvTajAqcnlWPJDFAV2ru1fbWia6ohCBYpD1segsTlc452nlTj7LGUVGtTVo4ZMEepdRYAWrbGSli9D1yD0YYIJBBmXPus7hbjmd+kP/w/qQT/AFmgjwzo7AfmRqMH8hO1Xoxu/tFzWDxrrTuaz4+sAzOenTfggnIM+UjVLaKtMyXKMl1vLfUrt9UDULk5JxhGVjgk7gAAe+s12rqCM+kICuptaq9LaxUcq7ZbZYdobfgJn1APEyERktG4W2z26mVxXWFAVQAAAAAMAAcAADoJ9nt8cEdPdK3tvVNXUe7VmschK1QKWLt4qHIU7VDPgkcIZTrc6Q2nzhrNWtS7mPkBgZJJ6Ko+0x8AJB1V+tZSadJsx+uuQPjI5WussHOMkKbEzjGRnM49k1iwd5vNzjKlimwoftIKjzUfMH1umSeJ21LV7giYlE7TuuWiznGo1JFVSjkVtYCqAY9rYC1jN47WPQADaaXTrWiVqMKiqqj3KAB/ATO9iac36j6Qf0VIeur8djcW2j8IA7tT45s8CCdPNmCnGu5+Vd53JERLkCIiAiIgIiICIiAiIgIiICIiAiIgIiICQO0ex6byGsT1hwHVmrcDyFiENj3Zk+IHDR6NKVCVqFUZOB5nkknxJPJJ6zvEQM7qardLhaqWvoJ4WsoLKc9AFcqHq/eBXoAw9mb2foXNnf3ABgCtdYbIrVsbix6Gw4AJHAAwCcktaxIRjrFuTu51olfruxNPc2+ypS+MFhlWK/dZlwWX3HiWESbjzVWFUKoCqoAAAwABwAAOgxPURAREQEREBERAREQEREBERAREQEREBERAREQEREBERAREQEREBERAREQEREBERAREQEREBERAREQEREBERAREQEREBERAREQEREBERAREQEREBERAREQERED/2Q==>" width="50%"/>
 </p>
 # Devocean-06/Spam_Filter-gemma
@@ -29,42 +29,40 @@ pipeline_tag: text-generation
 **Model Developers**: SK Devoceon-06 On device LLM
-# Model Information
-**Skitty**는 다양한 형태의 스팸 문자를 필터링하고,
-“왜 스팸으로 분류되었는가”를 **논리적으로 설명할 수 있는 sLLM** (Small Language Model)입니다.
-모델은 단순 분류를 넘어, 판단 근거(reason)를 명시적으로 출력하도록 설계되었습니다.
 ---
 ## 🧠 Description
-이 모델은 **스마트 치안 빅데이터 플랫폼(2025)**을 통해 확보한
-최신 스팸 문자 데이터셋을 기반으로 학습되었습니��.
-### 🔍 데이터 및 전처리
-- **데이터 출처**: 2025년도 스마트 치안 빅데이터 플랫폼 스팸 문자 데이터셋
-- **중복 제거**: `SimHash` 기반의 근사 중복 필터링을 수행하여 유사한 메시지 제거
-- **샘플링 전략**: `Curriculum Sampling`을 적용하여 쉬운 예제 → 어려운 예제 순으로 학습
-- **라벨링 방식**: 라벨 신뢰도 보정을 거친 **Hard Label 기반 지도학습**
-### 🧠 학습 및 증류 (Distillation)
-- **Off-Policy Distillation**을 적용하여 Teacher LLM의 의사결정 근거를 효율적으로 압축
-- 단순 생성 모방이 아닌, Teacher의 **논리적 분류 근거(reasoning trace)**를 distill
-- 난이도별 Curriculum + Hard Label Distillation을 결합하여
-  **정확도–해석력–일반화 성능**의 균형을 달성
-### 🧾 핵심 특징
-| 항목 | 설명 |
-|------|------|
-| **모델 유형** | sLLM (Small Language Model for Spam Classification & Explanation) |
-| **핵심 기능** | 스팸/비스팸 분류 + 근거(reason) 생성 |
-| **학습 방식** | Off-policy knowledge distillation + Curriculum sampling |
-| **데이터 정제** | SimHash 기반 중복 제거 및 품질 필터링 |
-| **목표** | 단순 분류를 넘어 “왜 스팸인지”를 설명할 수 있는 모델 |
 ---
 ## 🚀 Quick Start
 ```python

 pipeline_tag: text-generation
 ---
 <p align="left">
+  <img src="https://huggingface.co/Devocean-06/Spam_Filter-gemma/edit/main/skitty.png" width="50%"/>
 </p>
 # Devocean-06/Spam_Filter-gemma
 **Model Developers**: SK Devoceon-06 On device LLM
+## Model Information
+Skitty is an explainable small language model (sLLM) designed to classify various types of spam messages and provide concise reasoning for its decisions.
+Instead of only labeling text as "spam" or "not spam", the model outputs short natural-language explanations describing why the message was identified as spam.
 ---
 ## 🧠 Description
+Skitty was trained on an updated 2025 spam message dataset collected through the Smart Police Big Data Platform in South Korea.
+The model leverages deduplication, curriculum sampling, and off-policy distillation to improve both classification accuracy and interpretability.
+### Data and Preprocessing
+- Data source: 2025 Smart Police Big Data Platform spam message dataset
+- Deduplication: Performed near-duplicate removal using SimHash filtering
+- Sampling strategy: Applied curriculum-based sampling to control difficulty and improve generalization
+- Labeling: Trained using hard-label supervision after label confidence refinement
+### Training and Distillation
+- Utilized off-policy distillation to compress the decision process of a large teacher LLM into a smaller student model
+- Instead of directly mimicking the teacher’s text generation, the model distills the reasoning trace for spam detection
+- Combined curriculum learning with hard-label distillation to balance accuracy, interpretability, and generalization
+### Key Features
+| Category | Description |
+|-----------|-------------|
+| Model Type | sLLM (Small Language Model for Spam Classification & Explanation) |
+| Main Function | Spam / Non-spam classification with reasoning |
+| Training Approach | Off-policy knowledge distillation + curriculum sampling |
+| Data Cleaning | SimHash-based deduplication and quality filtering |
+| Objective | Build a model that not only classifies spam but also explains its rationale |
 ---
 ## 🚀 Quick Start
 ```python