seungbo7747
/

summarization_model

@@ -60,6 +60,87 @@ The following hyperparameters were used during training:
 | 0.6402        | 0.96  | 1200 | 0.5970          | 0.0855 | 0.0213 | 0.0854 | 0.0855    |
 ### Framework versions
 - Transformers 4.51.3

 | 0.6402        | 0.96  | 1200 | 0.5970          | 0.0855 | 0.0213 | 0.0854 | 0.0855    |
+### How to
+```python
+import torch
+from transformers import T5TokenizerFast, T5ForConditionalGeneration
+# 1. 모델 및 토크나이저 로드
+model_id = "username/my_awesome_summarization_model"  # 실제 허브 모델 ID로 대체
+tokenizer = T5TokenizerFast.from_pretrained(model_id)
+model = T5ForConditionalGeneration.from_pretrained(model_id)
+# 2. GPU 설정 (가능한 경우)
+device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+model.to(device)
+print(f"Using device: {device}")
+if torch.cuda.is_available():
+    print(f"GPU name: {torch.cuda.get_device_name(0)}")
+# 3. 요약 함수 정의
+def summarize_text(texts, max_input_length=512, max_output_length=150, num_beams=4):
+    """
+    주어진 텍스트 리스트를 요약하는 함수.
+    Args:
+        texts (list[str]): 요약할 텍스트 리스트 (각 텍스트는 'summarize: ' 접두사 포함 가능).
+        max_input_length (int): 입력 텍스트 최대 길이.
+        max_output_length (int): 출력 요약 최대 길이.
+        num_beams (int): 빔 서치에서 사용할 빔 수.
+    Returns:
+        list[str]: 요약된 텍스트 리스트.
+    """
+    # 입력 텍스트에 'summarize: ' 접두사 추가 (없는 경우)
+    inputs = [f"summarize: {text}" if not text.startswith("summarize: ") else text for text in texts]
+    # 토큰화
+    tokenized_inputs = tokenizer(
+        inputs,
+        max_length=max_input_length,
+        truncation=True,
+        padding=True,
+        return_tensors="pt"
+    )
+    # GPU로 입력 이동
+    tokenized_inputs = {k: v.to(device) for k, v in tokenized_inputs.items()}
+    # 요약 생성
+    summary_ids = model.generate(
+        tokenized_inputs["input_ids"],
+        attention_mask=tokenized_inputs["attention_mask"],
+        max_length=max_output_length,
+        num_beams=num_beams,
+        early_stopping=True
+    )
+    # 디코딩
+    summaries = tokenizer.batch_decode(summary_ids, skip_special_tokens=True)
+    return summaries
+# 4. 테스트 입력 예시
+test_texts = [
+    "summarize: 한국의 수도는 서울입니다. 서울은 한반도 중부에 위치하며, 인구는 약 970만 명입니다. 서울은 경제, 문화, 정치의 중심지로, 한강이 도시를 가로지르며 많은 역사적 유산과 현대적 건축물이 공존합니다.",
+    "summarize: 인공지능(AI)은 컴퓨터 시스템이 인간의 지능을 모방하거나 초월하도록 만드는 기술입니다. AI는 머신러닝, 딥러닝, 자연어 처리 등의 분야로 나뉘며, 의료, 금융, 제조 등 다양한 산업에서 활용되고 있습니다. 그러나 AI의 윤리적 문제와 일자리 대체 우려도 제기되고 있습니다.",
+    "summarize: 기후 변화는 지구 온난화, 해수면 상승, 극단적 기상 현상을 초래하는 글로벌 문제입니다. 이산화탄소 배출 감소와 재생 가능 에너지 사용이 해결책으로 제시되지만, 국제적 협력이 부족한 상황입니다."
+]
+# 5. 요약 실행 및 결과 출력
+summaries = summarize_text(test_texts)
+for i, (input_text, summary) in enumerate(zip(test_texts, summaries)):
+    print(f"\nInput {i+1}: {input_text}")
+    print(f"Summary {i+1}: {summary}")
+# 6. 단일 텍스트 요약 예시 (간단한 사용)
+single_text = "summarize: 블록체인은 분산된 디지털 장부로, 거래 데이터를 암호화하여 보안성과 투명성을 제공합니다. 비트코인과 같은 암호화폐뿐만 아니라 공급망 관리, 의료 기록 등 다양한 분야에서 활용되고 있습니다."
+summary = summarize_text([single_text])[0]
+print(f"\nSingle Input: {single_text}")
+print(f"Single Summary: {summary}")
+```
 ### Framework versions
 - Transformers 4.51.3