YAML Metadata
Warning:
empty or missing yaml metadata in repo card
(https://huggingface.co/docs/hub/model-cards#model-card-metadata)
🎬 YouTube Video Recommendation System (Content-Based Filtering)
Bu proje, YouTube'daki videolara benzer içerikleri öneren bir content-based filtering sistemidir.
Kullanıcı bir video başlığı girer ve sistem, başlık, açıklama ve etiketleri temel alarak benzer 5 videoyu önerir.
📦 Dataset
- Kaynak: YouTube Trending Videos - Kaggle
- Kullanılan dosya:
USvideos.csv(küçültülmüş örneği:USvideos_sample.csv)
🧠 Kullanılan Teknolojiler
- Python, pandas, numpy
- scikit-learn → TF-IDF Vectorizer, cosine similarity
- joblib (model kaydetme)
- matplotlib, wordcloud (görselleştirme)
- Streamlit (web uygulaması)
🔍 Proje Adımları
title,description,tagssütunları seçildi ve temizlendi.- Bu sütunlar birleştirilerek tek bir
textkolonu oluşturuldu. - TF-IDF ile metin vektörleştirildi.
- Cosine similarity ile videolar arası benzerlik hesaplandı.
- Kullanıcı başlığına en çok benzeyen ilk 5 video önerildi.
💻 Web Uygulaması (Streamlit)
Projeye bir Streamlit arayüzü entegre edildi.
🚀 Uygulamayı Başlatmak:
pip install -r requirements.txt
streamlit run app.py
Kullanıcı arayüzü üzerinden bir video başlığı girerek önerileri alabilirsiniz.(verisetindene varsa)
📊 Görselleştirme
En sık kullanılan 15 YouTube etiketi
Başlıklarda en sık geçen 15 kelime
Kelime bulutu (word cloud) gösterimi
📁 Dosya Yapısı
youtube-recommendation/
├── USvideos_sample.csv
├── app.py
├── youtube_recommender.ipynb
├── tfidf_vectorizer.pkl
├── cosine_similarity.pkl
├── youtube_df.pkl
├── title_indices.pkl
├── requirements.txt
└── README.md
🌐 Model Paylaşımı (Opsiyonel)
Eğitilen modeller Hugging Face üzerine yüklenebilir:
https://huggingface.co/yazodi/youtube-video-recommender
✍️ Yazar
Hande Çarkcı
📫 GitHub | 💡 Data Science & AI Öğrencisi
📦 Requirements
streamlit
pandas
numpy
scikit-learn
joblib
matplotlib
wordcloud
---
Inference Providers
NEW
This model isn't deployed by any Inference Provider.
🙋
Ask for provider support