Cutter

Sleeping

Cutter / rule34.py

b62586b over 2 years ago

4.14 kB

	from bs4 import BeautifulSoup
	import json, os
	from others import *
	import cloudscraper
	scraper = cloudscraper.create_scraper()

	def get_info_rule34(link):

	response = scraper.get(link)
	soup = BeautifulSoup(response.text, 'html.parser')

	# Mencari judul video di elemen dengan class title_video
	title = soup.find(class_="title_video")
	if title:
	video_title = title.text.strip().replace('/', ' -')
	idx = video_title.find(']')
	if idx != -1 and idx + 1 < len(video_title) and video_title[idx + 1].isalpha():
	video_title = video_title[:idx + 1] + ' ' + video_title[idx + 1:]

	video_title = video_title.title()
	print(f"Judul Video: {video_title}")
	else:
	print("Judul Video tidak ditemukan")

	# Mencari nama artist di elemen dengan class col
	cols = soup.find_all(class_="col") # Menggunakan find_all untuk mendapatkan semua elemen dengan class col
	if cols:
	for col in cols: # Melakukan iterasi untuk setiap elemen col
	# Mencari elemen dengan class label yang memiliki teks yang cocok dengan regex "Artist.*"
	label = col.find(class_="label", string="Artist:")
	if label:
	# Mencari elemen dengan class item yang merupakan saudara dari label
	item = label.find_next_sibling(class_="item")
	if item:
	# Mencari elemen dengan class name yang merupakan anak dari item
	name = item.find(class_="name")
	if name:
	artist = name.text.strip()
	print(f"Nama Artist: {artist}")
	break # Keluar dari loop jika sudah menemukan nama artist
	else: # Menambahkan else di akhir loop
	print("Nama Artist tidak ditemukan") # Mencetak pesan jika tidak ada nama artist yang ditemukan
	else:
	print("Elemen col tidak ditemukan")

	# Mencari thumbnailUrl di script type="application/ld+json"
	script = soup.find("script", type="application/ld+json")
	if script:
	data = json.loads(script.string)
	if "thumbnailUrl" in data:
	thumbnail_url = data['thumbnailUrl']
	print(f"Thumbnail URL: {thumbnail_url}")
	else:
	print("Tidak ditemukan thumbnail URL")
	else:
	print("Tidak ditemukan elemen script dengan type application/ld+json")

	# Mencari resolusi yang tersedia
	resolutions = []
	for a in soup.find_all('a'):
	if 'MP4' in a.text and 'p' in a.text:
	resolutions.append(a.text.split()[1])
	if resolutions:
	print("Resolusi yang tersedia: " + ", ".join(resolutions))
	else:
	print("Tidak ditemukan resolusi yang tersedia")

	# Mencari kualitas video 720p atau 480p
	video_quality_elements = soup.find_all("a", class_="tag_item")
	video_quality_720p = None
	video_quality_480p = None
	for element in video_quality_elements:
	if "720p" in element.text:
	video_quality_720p = element['href']
	elif "480p" in element.text:
	video_quality_480p = element['href']

	if video_quality_720p:
	print(f"Video kualitas 720p: {video_quality_720p}")
	video_url = video_quality_720p
	elif video_quality_480p:
	print(f"Video kualitas 480p: {video_quality_480p}")
	video_url = video_quality_480p
	else:
	print("Tidak ditemukan video kualitas 720p atau 480p")
	video_url = None

	return video_title, artist, video_url, thumbnail_url

	def rule34(link):
	video_info = ""
	video_title, artist, video_url, thumbnail_url = get_info_rule34(link)
	directory = f"/home/user/app/Hasil Download/Rule34/{artist}"
	if not os.path.exists(directory):
	os.makedirs(directory)
	# Menentukan nama file thumbnail
	thumbnail_file = download_file(thumbnail_url, video_title, directory)
	video_file = download_file(video_url, video_title, directory)

	video_info = f"Nama Channel: {artist}\n"
	video_info += f"Judul Video: {video_title}\n"

	return video_file, video_title, video_info, thumbnail_file