File size: 2,395 Bytes
dfb3177
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
{
 "cells": [
  {
   "cell_type": "code",
   "execution_count": 1,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "False\n",
      "0\n"
     ]
    }
   ],
   "source": [
    "import torch\n",
    "print(torch.cuda.is_available())  # True dönerse GPU kullanılabilir.\n",
    "print(torch.cuda.device_count())  # GPU sayısını gösterir.\n"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 3,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "Vektörleştirme işlemi tamamlandı ve sonuçlar 'data_vectorized.csv' dosyasına kaydedildi.\n"
     ]
    }
   ],
   "source": [
    "import pandas as pd\n",
    "from sentence_transformers import SentenceTransformer\n",
    "\n",
    "# SBERT modelini yükleyelim\n",
    "model = SentenceTransformer('sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2')\n",
    "\n",
    "# Tokenize edilmiş veriyi okuyalım\n",
    "df = pd.read_csv(\"data_tokenized.csv\")\n",
    "\n",
    "# Tokenize edilmiş başlıkları alalım\n",
    "tokenized_titles = df['Title'].tolist()\n",
    "\n",
    "# Tokenized listeyi string'e dönüştürelim\n",
    "titles_as_strings = [' '.join(eval(tokens)) for tokens in tokenized_titles]\n",
    "\n",
    "# Başlıkları vektörleştirelim\n",
    "vectorized_titles = model.encode(titles_as_strings)\n",
    "\n",
    "# Vektörleri DataFrame'e dönüştürelim\n",
    "vectorized_df = pd.DataFrame(vectorized_titles)\n",
    "vectorized_df['Label'] = df['Label']  # Etiketleri ekleyelim\n",
    "\n",
    "# DataFrame'i kaydedelim\n",
    "vectorized_df.to_csv(\"data_vectorized.csv\", index=False)\n",
    "\n",
    "print(\"Vektörleştirme işlemi tamamlandı ve sonuçlar 'data_vectorized.csv' dosyasına kaydedildi.\")\n"
   ]
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.10.10"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 2
}