Spaces:

tnwjddla2190
/

human_interview

Sleeping

sujeongim

edit : gr

01dfce8 6 months ago

12.9 kB

	import gradio as gr
	from huggingface_hub import InferenceClient
	from litellm import completion
	from dotenv import load_dotenv
	import json
	import re

	load_dotenv()

	# -------------------------------
	# 1) 고정 10개 질문 정의
	# -------------------------------
	FIXED_QUESTIONS = [
	"Q1) 본인의 전공/업무 분야는 무엇인가요?",
	"Q2) 최근 가장 집중한 프로젝트는 무엇이었나요?",
	"Q3) 해당 프로젝트에서 가장 어려웠던 점은 무엇이었나요?",
	"Q4) 즐겨 쓰는 개발 스택(언어/프레임워크/라이브러리)을 알려주세요.",
	"Q5) 협업 시 가장 중요하게 생각하는 원칙은 무엇인가요?",
	"Q6) 성능 개선을 위해 가장 자주 사용하는 방법은 무엇인가요?",
	"Q7) 테스트/검증을 어떤 방식으로 진행하나요?",
	"Q8) 데이터/리소스가 제한될 때 어떤 전략을 쓰시나요?",
	"Q9) 최근 배운 것 중 가장 유용했던 내용은 무엇이었나요?",
	"Q10) 앞으로 다뤄보고 싶은 주제나 기술이 있나요?",
	]

	# -------------------------------
	# 2) 꼬리질문 20개 생성 프롬프트
	# (고정 10문답을 바탕으로 추출)
	# -------------------------------
	FOLLOWUP_SYSTEM = (
	"You are an excellent interviewer. Based on the given 10 Q/A pairs, "
	"generate 20 SHORT, concrete, non-overlapping follow-up questions that deeply probe the user's answers. "
	"Each question should be standalone and specific. Output as a numbered list 1..20."
	)

	def build_followup_user_prompt(qa_pairs):
	"""
	qa_pairs: list[tuple(question, answer)]
	"""
	lines = ["Below are 10 Q/A pairs. Generate 20 short follow-up questions.\n"]
	for i, (q, a) in enumerate(qa_pairs, 1):
	lines.append(f"[Q{i}] {q}")
	lines.append(f"[A{i}] {a}\n")
	lines.append("Return only the 20 questions as a numbered list (1..20).")
	return "\n".join(lines)

	def parse_numbered_list_to_lines(text, expected_n=20):
	# 1) Remove code fences
	text = re.sub(r"^```.*?\n\|\n```$", "", text, flags=re.DOTALL).strip()
	# 2) Split lines on numbering
	# e.g. "1) ..." or "1. ..." or "1 - ..." etc
	candidates = re.split(r"(?:^\s\d+\s[\)\.\-\:]\s*)", text, flags=re.MULTILINE)
	# The split keeps text fragments; we need to reassemble meaningful lines.
	# An easier approach is to capture lines that start with a number:
	lines = re.findall(r"^\s\d+\s[\)\.\-\:]\s*(.+)$", text, flags=re.MULTILINE)
	lines = [l.strip() for l in lines if l.strip()]
	# Fallback: if no pattern matched, split by newline and filter bullets
	if not lines:
	for raw in text.splitlines():
	s = raw.strip()
	if s and not s.startswith("#"):
	lines.append(s)
	# Trim to expected_n if overshoot; if undershoot, keep whatever we have
	return lines[:expected_n]

	# --------------------------------
	# 3) 메인 응답 함수
	# --------------------------------
	def respond(
	message,
	history: list[dict[str, str]],
	system_message,
	max_tokens,
	temperature,
	top_p,
	# (OAuth 버튼은 유지하되, 아래 구현에서는 사용하지 않음)
	hf_token: gr.OAuthToken,
	# --- 상태 값들 ---
	phase, # 1 -> 2 -> 3
	asked, # 직전에 질문을 던졌는지 여부 (True면 이번 사용자의 입력은 답변으로 간주)
	i1, i2, i3, # 각 단계 인덱스
	gen_questions,# 2단계에서 사용할 20개 질문 (list[str])
	fixed_answers,# 1단계 답변(10개 저장용)
	gen_answers, # 2단계 답변(20개 저장용)
	rep_answers, # 3단계 답변(10개 저장용)
	):
	"""
	대화 흐름:
	- asked == False: 이번 호출에서는 '다음 질문'을 내보내고 asked=True 로 전환
	- asked == True : 이번 호출의 message를 '답변'으로 저장하고 인덱스를 증가시킨 뒤, 다음 질문을 내보내며 asked=True 유지
	"""
	model = "gemini/gemini-2.5-flash"

	# 최초 진입(사용자 첫 메시지): 질문을 던질 차례로 맞춘다.
	if phase is None:
	phase = 1
	if asked is None:
	asked = False
	if i1 is None:
	i1 = 0
	if i2 is None:
	i2 = 0
	if i3 is None:
	i3 = 0
	if gen_questions is None:
	gen_questions = []
	if fixed_answers is None:
	fixed_answers = []
	if gen_answers is None:
	gen_answers = []
	if rep_answers is None:
	rep_answers = []

	# 헬퍼: 현재 단계에서 "다음 질문 텍스트"를 리턴
	def next_question():
	nonlocal phase, i1, i2, i3, gen_questions
	if phase == 1:
	return FIXED_QUESTIONS[i1] if i1 < len(FIXED_QUESTIONS) else None
	elif phase == 2:
	return gen_questions[i2] if i2 < len(gen_questions) else None
	elif phase == 3:
	return FIXED_QUESTIONS[i3] if i3 < len(FIXED_QUESTIONS) else None
	return None

	# 헬퍼: 1→2 단계 전환 시 꼬리질문 20개 생성
	def ensure_followups():
	nonlocal gen_questions
	if gen_questions:
	return # 이미 생성됨
	# 1단계 Q/A 페어 구성
	qa_pairs = list(zip(FIXED_QUESTIONS, fixed_answers))
	user_prompt = build_followup_user_prompt(qa_pairs)
	followup_msgs = [
	{"role": "system", "content": FOLLOWUP_SYSTEM},
	{"role": "user", "content": user_prompt},
	]
	res = completion(
	model=model,
	messages=followup_msgs,
	temperature=temperature,
	top_p=top_p,
	# max_tokens=max_tokens, # 필요 시 해제
	)
	res_json = res.choices[0].message.model_dump()
	followup_text = res_json["content"].strip()
	gen_questions = parse_numbered_list_to_lines(followup_text, expected_n=20)
	# 혹시 20개 미만이면 보충(간단한 백업)
	while len(gen_questions) < 20:
	gen_questions.append(f"(추가) 관심 주제에 대해 더 자세히 설명해 주실 수 있나요? [{len(gen_questions)+1}]")

	# --------------------------------
	# (A) asked == False → 질문 던지기
	# --------------------------------
	if not asked:
	if phase == 1 and i1 == 0:
	intro = (
	"안녕하세요! 다음 순서로 진행할게요:\n"
	"1) 고정 10문항에 먼저 답변합니다.\n"
	"2) 이어서 LLM이 방금 답변을 바탕으로 20문항을 생성해 질문합니다.\n"
	"3) 마지막으로 처음의 10문항을 다시 묻습니다.\n\n"
	"그럼 시작하겠습니다!"
	)
	# 첫 안내 후 첫 질문
	q = next_question()
	asked = True
	yield f"{intro}\n\n{q}", phase, asked, i1, i2, i3, gen_questions, fixed_answers, gen_answers, rep_answers
	return

	# 그 외 일반 케이스: 다음 질문
	q = next_question()
	if q is not None:
	asked = True
	yield q, phase, asked, i1, i2, i3, gen_questions, fixed_answers, gen_answers, rep_answers
	return

	# 질문이 더 없다면(모든 단계 완료)
	yield "모든 질문이 완료되었습니다. 참여해 주셔서 감사합니다! 🎉", phase, asked, i1, i2, i3, gen_questions, fixed_answers, gen_answers, rep_answers
	return

	# --------------------------------
	# (B) asked == True → 방금 받은 message를 답변으로 저장하고 다음 질문
	# --------------------------------
	if asked:
	if phase == 1:
	# 1단계 답변 저장
	fixed_answers.append(message)
	i1 += 1
	asked = False # 다음 턴에는 질문을 내보내도록

	if i1 >= len(FIXED_QUESTIONS):
	# 2단계로 이동: 꼬리질문 20개 생성
	phase = 2
	ensure_followups()
	# 곧바로 다음 질문 던지기
	q = next_question()
	asked = True
	yield f"좋습니다. 1단계를 마쳤습니다. 이제 2단계(20문항)로 넘어갈게요.\n\n{q}", phase, asked, i1, i2, i3, gen_questions, fixed_answers, gen_answers, rep_answers
	return
	else:
	# 다음 1단계 질문
	q = next_question()
	asked = True
	yield q, phase, asked, i1, i2, i3, gen_questions, fixed_answers, gen_answers, rep_answers
	return

	elif phase == 2:
	# 2단계 답변 저장
	gen_answers.append(message)
	i2 += 1
	asked = False

	if i2 >= len(gen_questions):
	# 3단계로 이동
	phase = 3
	q = next_question()
	asked = True
	yield f"좋아요. 2단계를 마쳤습니다. 마지막으로 1단계의 10문항을 다시 묻겠습니다.\n\n{q}", phase, asked, i1, i2, i3, gen_questions, fixed_answers, gen_answers, rep_answers
	return
	else:
	q = next_question()
	asked = True
	yield q, phase, asked, i1, i2, i3, gen_questions, fixed_answers, gen_answers, rep_answers
	return

	elif phase == 3:
	# 3단계 답변 저장
	rep_answers.append(message)
	i3 += 1
	asked = False

	if i3 >= len(FIXED_QUESTIONS):
	# 완료
	summary = {
	"phase1_fixed": [{"q": FIXED_QUESTIONS[i], "a": fixed_answers[i]} for i in range(len(fixed_answers))],
	"phase2_generated": [{"q": gen_questions[i], "a": gen_answers[i]} for i in range(len(gen_answers))],
	"phase3_repeat": [{"q": FIXED_QUESTIONS[i], "a": rep_answers[i]} for i in range(len(rep_answers))],
	}
	done_text = (
	"모든 질문이 완료되었습니다. 참여에 감사드립니다! 🎉\n"
	"필요하시다면 아래 JSON 요약을 복사해가세요.\n\n"
	+ "```json\n" + json.dumps(summary, ensure_ascii=False, indent=2) + "\n```"
	)
	yield done_text, phase, asked, i1, i2, i3, gen_questions, fixed_answers, gen_answers, rep_answers
	return
	else:
	q = next_question()
	asked = True
	yield q, phase, asked, i1, i2, i3, gen_questions, fixed_answers, gen_answers, rep_answers
	return

	# 안전망 (도달하지 않아야 함)
	yield "상태 전환 중 예기치 못한 상황이 발생했습니다. 다시 시도해 주세요.", phase, asked, i1, i2, i3, gen_questions, fixed_answers, gen_answers, rep_answers


	# --------------------------------
	# 4) ChatInterface 구성
	# --------------------------------


	with gr.Blocks() as demo:
	with gr.Sidebar():
	# 로그인 버튼 유지 (hf_token은 현재 구현에서 사용하지 않지만 UI는 그대로 둠)
	oauth = gr.LoginButton()
	gr.Markdown(
	"### 진행 순서\n"
	"1) 고정 10문항에 먼저 답하기\n"
	"2) LLM이 생성한 20문항 꼬리질문에 답하기\n"
	"3) 고정 10문항을 다시 한 번 답하기"
	)

	phase = gr.State(1)
	asked = gr.State(False)
	i1 = gr.State(0)
	i2 = gr.State(0)
	i3 = gr.State(0)
	gen_questions= gr.State([])
	fixed_answers= gr.State([])
	gen_answers = gr.State([])
	rep_answers = gr.State([])

	# system/max_tokens/temperature/top_p 입력 컴포넌트도 블록 안에서 만들고 넘깁니다
	sys_msg = gr.Textbox(value="You are a friendly Chatbot.", label="System message")
	max_toks = gr.Slider(minimum=1, maximum=2048, value=512, step=1, label="Max new tokens")
	temp = gr.Slider(minimum=0.1, maximum=4.0, value=0.7, step=0.1, label="Temperature")
	top_p = gr.Slider(minimum=0.1, maximum=1.0, value=0.95, step=0.05, label="Top-p (nucleus sampling)")

	chatbot = gr.ChatInterface(
	respond,
	type="messages",
	# ✅ 파라미터 순서: system_message, max_tokens, temperature, top_p, hf_token, (states…)
	additional_inputs=[
	sys_msg, max_toks, temp, top_p,
	oauth, # <-- ✅ hf_token 자리에 놓기!
	phase, asked, i1, i2, i3,
	gen_questions, fixed_answers, gen_answers, rep_answers,
	],
	# ✅ 출력에도 동일한 State 인스턴스 재사용
	additional_outputs=[
	phase, asked, i1, i2, i3,
	gen_questions, fixed_answers, gen_answers, rep_answers,
	],
	)
	chatbot.render()

	if __name__ == "__main__":
	demo.launch()