Spaces:

dashhdata
/

video-dubbing-agent

Build error

Upload folder using huggingface_hub

4ec3855 verified 2 months ago

1.16 kB

	"""
	Stage 5 — Speaker Profiler (Simplified — Male Voice Forced)
	Since we force male voice, this just groups speakers.
	"""
	import logging
	from pathlib import Path
	from typing import Dict, List
	from collections import defaultdict

	logger = logging.getLogger(__name__)


	def profile_speakers(
	segments: List[Dict],
	audio_path: Path,
	output_dir: Path
	) -> Dict[str, Dict]:
	"""Profile speakers — all forced to male."""
	speaker_segments = defaultdict(list)
	for seg in segments:
	speaker_segments[seg.get("speaker", "SPEAKER_00")].append(seg)

	logger.info(f"Found {len(speaker_segments)} speakers — ALL forced to MALE voice")

	profiles = {}
	for speaker_id, segs in speaker_segments.items():
	total_time = sum(s["end"] - s["start"] for s in segs)
	profiles[speaker_id] = {
	"gender": "male", # FORCED
	"reference_audio": None,
	"total_speaking_time": round(total_time, 2),
	"avg_pitch": 0,
	"segment_count": len(segs),
	}
	logger.info(f" {speaker_id}: MALE (forced), {len(segs)} segments, {total_time:.1f}s")

	return profiles