Spaces:
Running
Running
Update app/inference + ablation task outputs
Browse filesThis view is limited to 50 files because it contains too many changes. See raw diff
- .gitattributes +3 -0
- README.md +26 -7
- analysis_outputs/T16/task1_encoder_cost.png +0 -0
- analysis_outputs/T16/task1_kv_cache.txt +15 -0
- analysis_outputs/T16/task1_speedup.png +0 -0
- analysis_outputs/T16/task1_time_comparison.png +0 -0
- analysis_outputs/T16/task2_all_layers_t0.png +0 -0
- analysis_outputs/T16/task2_attn_evolution.png +0 -0
- analysis_outputs/T16/task2_attn_t0.png +0 -0
- analysis_outputs/T16/task2_attn_t15.png +0 -0
- analysis_outputs/T16/task2_report.txt +31 -0
- analysis_outputs/T16/task2_semantic_drift.png +0 -0
- analysis_outputs/T16/task2_source_alignment.png +0 -0
- analysis_outputs/T16/task2_tfidf_vs_attention.png +0 -0
- analysis_outputs/T16/task3_concept_space.png +3 -0
- analysis_outputs/T16/task3_diversity_curve.png +0 -0
- analysis_outputs/T16/task3_diversity_direction.npy +3 -0
- analysis_outputs/T16/task3_pca_explained_variance.png +0 -0
- analysis_outputs/T16/task3_report.txt +17 -0
- analysis_outputs/T16/task4_3d.png +0 -0
- analysis_outputs/T16/task4_raw_results.json +26 -0
- analysis_outputs/T16/task4_report.txt +1 -0
- analysis_outputs/T16/task5_quality_diversity_tradeoff.png +0 -0
- analysis_outputs/T16/task5_report.txt +13 -0
- analysis_outputs/T32/task1_encoder_cost.png +0 -0
- analysis_outputs/T32/task1_kv_cache.txt +15 -0
- analysis_outputs/T32/task1_speedup.png +0 -0
- analysis_outputs/T32/task1_time_comparison.png +0 -0
- analysis_outputs/T32/task2_all_layers_t0.png +0 -0
- analysis_outputs/T32/task2_attn_evolution.png +0 -0
- analysis_outputs/T32/task2_attn_t0.png +0 -0
- analysis_outputs/T32/task2_attn_t31.png +0 -0
- analysis_outputs/T32/task2_report.txt +31 -0
- analysis_outputs/T32/task2_semantic_drift.png +0 -0
- analysis_outputs/T32/task2_source_alignment.png +0 -0
- analysis_outputs/T32/task2_tfidf_vs_attention.png +0 -0
- analysis_outputs/T32/task3_concept_space.png +0 -0
- analysis_outputs/T32/task3_diversity_curve.png +0 -0
- analysis_outputs/T32/task3_diversity_direction.npy +3 -0
- analysis_outputs/T32/task3_pca_explained_variance.png +0 -0
- analysis_outputs/T32/task3_report.txt +17 -0
- analysis_outputs/T32/task4_3d.png +0 -0
- analysis_outputs/T32/task4_raw_results.json +26 -0
- analysis_outputs/T32/task4_report.txt +1 -0
- analysis_outputs/T32/task5_quality_diversity_tradeoff.png +0 -0
- analysis_outputs/T32/task5_report.txt +13 -0
- analysis_outputs/T4/task1_encoder_cost.png +0 -0
- analysis_outputs/T4/task1_kv_cache.txt +15 -0
- analysis_outputs/T4/task1_speedup.png +0 -0
- analysis_outputs/T4/task1_time_comparison.png +0 -0
.gitattributes
CHANGED
|
@@ -33,3 +33,6 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
|
|
| 33 |
*.zip filter=lfs diff=lfs merge=lfs -text
|
| 34 |
*.zst filter=lfs diff=lfs merge=lfs -text
|
| 35 |
*tfevents* filter=lfs diff=lfs merge=lfs -text
|
|
|
|
|
|
|
|
|
|
|
|
| 33 |
*.zip filter=lfs diff=lfs merge=lfs -text
|
| 34 |
*.zst filter=lfs diff=lfs merge=lfs -text
|
| 35 |
*tfevents* filter=lfs diff=lfs merge=lfs -text
|
| 36 |
+
analysis_outputs/T16/task3_concept_space.png filter=lfs diff=lfs merge=lfs -text
|
| 37 |
+
analysis_outputs/T4/task3_concept_space.png filter=lfs diff=lfs merge=lfs -text
|
| 38 |
+
analysis_outputs/T8/task3_concept_space.png filter=lfs diff=lfs merge=lfs -text
|
README.md
CHANGED
|
@@ -1,13 +1,32 @@
|
|
| 1 |
---
|
| 2 |
-
title:
|
| 3 |
-
emoji:
|
| 4 |
-
colorFrom:
|
| 5 |
-
colorTo:
|
| 6 |
sdk: gradio
|
| 7 |
-
sdk_version:
|
| 8 |
app_file: app.py
|
| 9 |
pinned: false
|
| 10 |
-
short_description: Sanskrit IAST → Devanagari transliteration model built using
|
| 11 |
---
|
| 12 |
|
| 13 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
---
|
| 2 |
+
title: Sanskrit D3PM Paraphrase
|
| 3 |
+
emoji: "🕉️"
|
| 4 |
+
colorFrom: indigo
|
| 5 |
+
colorTo: blue
|
| 6 |
sdk: gradio
|
| 7 |
+
sdk_version: 5.0.0
|
| 8 |
app_file: app.py
|
| 9 |
pinned: false
|
|
|
|
| 10 |
---
|
| 11 |
|
| 12 |
+
# Sanskrit D3PM Gradio Space
|
| 13 |
+
|
| 14 |
+
This Space runs Roman/IAST Sanskrit to Devanagari generation.
|
| 15 |
+
|
| 16 |
+
## Model Source
|
| 17 |
+
|
| 18 |
+
Set these Space variables in **Settings → Variables and secrets**:
|
| 19 |
+
|
| 20 |
+
- `HF_CHECKPOINT_REPO` = `<your-username>/sanskrit-d3pm`
|
| 21 |
+
- `HF_CHECKPOINT_FILE` = `best_model.pt`
|
| 22 |
+
- `HF_CHECKPOINT_LABEL` = `main-model` (optional)
|
| 23 |
+
|
| 24 |
+
The app will download checkpoint from your model repo and load it at runtime.
|
| 25 |
+
|
| 26 |
+
## Local Dev
|
| 27 |
+
|
| 28 |
+
```bash
|
| 29 |
+
pip install -r requirements.txt
|
| 30 |
+
python app.py
|
| 31 |
+
```
|
| 32 |
+
|
analysis_outputs/T16/task1_encoder_cost.png
ADDED
|
analysis_outputs/T16/task1_kv_cache.txt
ADDED
|
@@ -0,0 +1,15 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
TASK 1 — KV CACHE BENCHMARK
|
| 2 |
+
========================================
|
| 3 |
+
|
| 4 |
+
has_generate_cached=True
|
| 5 |
+
memory_profile=N/A (CPU/MPS)
|
| 6 |
+
|
| 7 |
+
src_len standard(s) cached(s) speedup encoder%
|
| 8 |
+
16 0.855 0.549 1.56x 39.2%
|
| 9 |
+
32 0.679 0.499 1.36x 41.2%
|
| 10 |
+
64 1.069 0.732 1.46x 40.0%
|
| 11 |
+
|
| 12 |
+
Saved graphs:
|
| 13 |
+
- task1_time_comparison.png
|
| 14 |
+
- task1_speedup.png
|
| 15 |
+
- task1_encoder_cost.png
|
analysis_outputs/T16/task1_speedup.png
ADDED
|
analysis_outputs/T16/task1_time_comparison.png
ADDED
|
analysis_outputs/T16/task2_all_layers_t0.png
ADDED
|
analysis_outputs/T16/task2_attn_evolution.png
ADDED
|
analysis_outputs/T16/task2_attn_t0.png
ADDED
|
analysis_outputs/T16/task2_attn_t15.png
ADDED
|
analysis_outputs/T16/task2_report.txt
ADDED
|
@@ -0,0 +1,31 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
TASK 2 — ATTENTION + DRIFT REPORT
|
| 2 |
+
==================================================
|
| 3 |
+
|
| 4 |
+
Input : dharmo rakṣati rakṣitaḥ
|
| 5 |
+
Output: धर्मो रक्षति रक्ष रक्ष ितः तः तः तः ितः तः धर्मो धर्मो धर्मो धर्मो तः ितः तः तः ितः ितः रक्ष रक्ष रक्ष धर्मो धर्मो धर्मो धर्मो धर्मो ति ति ति रक्ष रक्ष रक्ष रक्ष रक्ष ितः ितः रक्षि रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष ति ति रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष
|
| 6 |
+
|
| 7 |
+
Captured steps: 16
|
| 8 |
+
Lock-in step (CER<=0.05): t=0
|
| 9 |
+
Locked tokens: 67 Flexible tokens: 13
|
| 10 |
+
TF-IDF vs attention stability corr: 0.8977
|
| 11 |
+
TF-IDF status: OK
|
| 12 |
+
|
| 13 |
+
Saved graphs:
|
| 14 |
+
- task2_attn_t*.png / task2_all_layers_t0.png
|
| 15 |
+
- task2_attn_evolution.png
|
| 16 |
+
- task2_semantic_drift.png
|
| 17 |
+
- task2_source_alignment.png
|
| 18 |
+
- task2_tfidf_vs_attention.png
|
| 19 |
+
|
| 20 |
+
Step trajectory (first 10 rows)
|
| 21 |
+
------------------------------------------------------------
|
| 22 |
+
t= 15 bert=0.0000 drift=1.0000 text=धर्मो रक्षति रक्ष रक्ष ितः तः तः तः तः तः धर्मो धर्मो धर्मो
|
| 23 |
+
t= 14 bert=0.0000 drift=1.0000 text=धर्मो रक्षति रक्ष रक्ष ितः तः तः तः तः तः धर्मो धर्मो धर्मो
|
| 24 |
+
t= 13 bert=0.0000 drift=1.0000 text=धर्मो रक्षति रक्ष रक्ष ितः तः तः तः तः तः धर्मो धर्मो धर्मो
|
| 25 |
+
t= 12 bert=0.0000 drift=1.0000 text=धर्मो रक्षति रक्ष रक्ष ितः तः तः तः तः तः धर्मो धर्मो धर्मो
|
| 26 |
+
t= 11 bert=0.0000 drift=1.0000 text=धर्मो रक्षति रक्ष रक्ष ितः तः तः तः तः तः धर्मो धर्मो धर्मो
|
| 27 |
+
t= 10 bert=0.0000 drift=1.0000 text=धर्मो रक्षति रक्ष रक्ष ितः तः तः तः ितः तः धर्मो धर्मो धर्मो
|
| 28 |
+
t= 9 bert=0.0000 drift=1.0000 text=धर्मो रक्षति रक्ष रक्ष ितः तः तः तः ितः तः धर्मो धर्मो धर्मो
|
| 29 |
+
t= 8 bert=0.0000 drift=1.0000 text=धर्मो रक्षति रक्ष रक्ष ितः तः तः तः ितः तः धर्मो धर्मो धर्मो
|
| 30 |
+
t= 7 bert=0.0000 drift=1.0000 text=धर्मो रक्षति रक्ष रक्ष ितः तः तः तः ितः तः धर्मो धर्मो धर्मो
|
| 31 |
+
t= 6 bert=0.0000 drift=1.0000 text=धर्मो रक्षति रक्ष रक्ष ितः तः तः तः ितः तः धर्मो धर्मो धर्मो
|
analysis_outputs/T16/task2_semantic_drift.png
ADDED
|
analysis_outputs/T16/task2_source_alignment.png
ADDED
|
analysis_outputs/T16/task2_tfidf_vs_attention.png
ADDED
|
analysis_outputs/T16/task3_concept_space.png
ADDED
|
Git LFS Details
|
analysis_outputs/T16/task3_diversity_curve.png
ADDED
|
analysis_outputs/T16/task3_diversity_direction.npy
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:be55855f7ab065608575c85ee1d88452c707f4b256354715f017ff501ab51d2d
|
| 3 |
+
size 4224
|
analysis_outputs/T16/task3_pca_explained_variance.png
ADDED
|
analysis_outputs/T16/task3_report.txt
ADDED
|
@@ -0,0 +1,17 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
TASK 3 — CONCEPT VECTORS + PCA STEERING
|
| 2 |
+
==================================================
|
| 3 |
+
|
| 4 |
+
PCA: 50 components, 48.4% variance
|
| 5 |
+
Diversity PC: 0 (|r|=0.155 with output length)
|
| 6 |
+
|
| 7 |
+
Saved graphs:
|
| 8 |
+
- task3_concept_space.png
|
| 9 |
+
- task3_pca_explained_variance.png
|
| 10 |
+
- task3_diversity_curve.png
|
| 11 |
+
|
| 12 |
+
Diversity spectrum:
|
| 13 |
+
alpha=-2.0 → बले बले ोर् तुल वीर्य वीर्य दस्य अध क्षणम किनी कृपणं @ दीयते वै क्षणम वरो वरो सिंहा सकरुण वरो दस्य सकरुण दीयते दीयते वै वै बले बले बले बले ोर् पतति वरो तुल तुल तुल वीर्य वीर्य वीर्य वीर्य तुल तुल तुल तुल तुल वपुषः वरो वरो मयं नम् हतः सप्तधा नम् नम् ति यता ष्टिम् दान्त अध दीयते क्षणम ग्र शोधन न्ती ति ान्न दान्त म नित्यम् सा भान िता ान्न दस्य ऽर्थ दस्य नम् दुर्गा दीयते ऽर्थ
|
| 14 |
+
alpha=-1.0 → बले र् अ तुल वीर्य वीर्य स्य सिंहा सिंहा सन जनकं वै वै वै @ सन सन सिंहा स्य स्य वीर्य ग सन सर्वस्वं वै वै बले बले बले र् ॥ त्त अ तुल तुल वीर्य वीर्य वीर्य वीर्य वीर्य तुल तुल तुल तुल तुल र् जान बले वै वै ॥ व वरो सा म दस्य ग् यता ष्टिम् सन सन ग सन ग ग सन भान घ म अध ऽन्तरे महा भ व त्रया सिंहा न्ती सन सा सन
|
| 15 |
+
alpha=+0.0 → बले र् र् तुल वीर्य वीर्य स्य सिंहा सन । गतस्य वै वै वै गतस्य सन सन सिंहा सा सा स्य स्य सन म् वै वै बले बले बले । र् अ अ । तुल वीर्य वीर्य वीर्य वीर्य वीर्य तुल तुल तुल अ अ र् र् ॥ ॥ वै भ सन सन ॥ ॥ द् द् सन क्ष सन सन सन सन सन सन ॥ सन कारकः ॥ स्य सन सन ॥ चिन्त ते सिंहा ॥ ता सन पि
|
| 16 |
+
alpha=+1.0 → बले र् अ अ वीर्य वीर्य स्य सिंहा सन सन गतस्य ते वै वै एकस्य सन सन सिंहा स्य स्य स्य स्य सन सन वै वै बले बले बले र् र् अ अ अ सव्य ित त्र वीर्य स्य वीर्य चारि संयुक्त स् अ अ र् र् र् ॥ वै वै सन यु हेम स्य सिद्धं सं स्ति शेष ॥ सन सन सन ॥ सन सन निर्वृतः ॥ व सन च ) ॥ मुख सं स्य स स्य ैस्तथा सन
|
| 17 |
+
alpha=+2.0 → बले बहू अ क्षे राजानं स्य स्य सिंहा सन सन एकस्य गतस्य निश वाच एकस्य सन ̍ये̱ क्षे स्य स्य स्य स्य वाच एकस्य पयो वै ॥ स्ति बले र् नित्य अ अ अ उत्तम क्षे स्य स्य स्य स्य स्य संयुक्त अचिन्त अ अ र् र् अपरा ॥ एकस्य नित्य क्षे घोरं सन एकस्य सं व्रजति एकस्य सन क्षे गेन्द्र सन सन सन मुख ॥ ) कर फलप्र त्र अचिन्त सं त्र स्य बहू नित्य ॥ एकस्य ̍भिर् सन
|
analysis_outputs/T16/task4_3d.png
ADDED
|
analysis_outputs/T16/task4_raw_results.json
ADDED
|
@@ -0,0 +1,26 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"4": {
|
| 3 |
+
"bertscore_f1": 0.6790409088134766,
|
| 4 |
+
"semantic_sim": 0.5334163904190063,
|
| 5 |
+
"bleu": 0.0003333366738921545,
|
| 6 |
+
"speed_per_sample": 0.12499853520479519
|
| 7 |
+
},
|
| 8 |
+
"8": {
|
| 9 |
+
"bertscore_f1": 0.6395084261894226,
|
| 10 |
+
"semantic_sim": 0.48110902309417725,
|
| 11 |
+
"bleu": 1.7409952895149752e-156,
|
| 12 |
+
"speed_per_sample": 0.2653733541647671
|
| 13 |
+
},
|
| 14 |
+
"16": {
|
| 15 |
+
"bertscore_f1": 0.6821702718734741,
|
| 16 |
+
"semantic_sim": 0.5372508764266968,
|
| 17 |
+
"bleu": 0.00047544921470022843,
|
| 18 |
+
"speed_per_sample": 0.53346393458487
|
| 19 |
+
},
|
| 20 |
+
"32": {
|
| 21 |
+
"bertscore_f1": 0.4939882755279541,
|
| 22 |
+
"semantic_sim": 0.19846703112125397,
|
| 23 |
+
"bleu": 8.528327361662488e-233,
|
| 24 |
+
"speed_per_sample": 1.0967584718746366
|
| 25 |
+
}
|
| 26 |
+
}
|
analysis_outputs/T16/task4_report.txt
ADDED
|
@@ -0,0 +1 @@
|
|
|
|
|
|
|
| 1 |
+
Optimal diffusion steps = 8
|
analysis_outputs/T16/task5_quality_diversity_tradeoff.png
ADDED
|
analysis_outputs/T16/task5_report.txt
ADDED
|
@@ -0,0 +1,13 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
TASK 5 — COMPATIBILITY REPORT
|
| 2 |
+
========================================
|
| 3 |
+
Guidance classifier path unavailable; λ mapped to repetition penalty.
|
| 4 |
+
|
| 5 |
+
lambda=0.0 CER=5.7955 diversity=0.251
|
| 6 |
+
lambda=0.5 CER=5.7330 diversity=0.303
|
| 7 |
+
lambda=1.0 CER=5.7294 diversity=0.395
|
| 8 |
+
lambda=1.5 CER=5.5630 diversity=0.505
|
| 9 |
+
lambda=2.0 CER=5.5803 diversity=0.611
|
| 10 |
+
lambda=3.0 CER=5.4209 diversity=0.767
|
| 11 |
+
|
| 12 |
+
Saved graphs:
|
| 13 |
+
- task5_quality_diversity_tradeoff.png
|
analysis_outputs/T32/task1_encoder_cost.png
ADDED
|
analysis_outputs/T32/task1_kv_cache.txt
ADDED
|
@@ -0,0 +1,15 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
TASK 1 — KV CACHE BENCHMARK
|
| 2 |
+
========================================
|
| 3 |
+
|
| 4 |
+
has_generate_cached=True
|
| 5 |
+
memory_profile=N/A (CPU/MPS)
|
| 6 |
+
|
| 7 |
+
src_len standard(s) cached(s) speedup encoder%
|
| 8 |
+
16 1.844 1.084 1.70x 41.2%
|
| 9 |
+
32 1.580 1.133 1.39x 39.9%
|
| 10 |
+
64 2.386 1.939 1.23x 39.7%
|
| 11 |
+
|
| 12 |
+
Saved graphs:
|
| 13 |
+
- task1_time_comparison.png
|
| 14 |
+
- task1_speedup.png
|
| 15 |
+
- task1_encoder_cost.png
|
analysis_outputs/T32/task1_speedup.png
ADDED
|
analysis_outputs/T32/task1_time_comparison.png
ADDED
|
analysis_outputs/T32/task2_all_layers_t0.png
ADDED
|
analysis_outputs/T32/task2_attn_evolution.png
ADDED
|
analysis_outputs/T32/task2_attn_t0.png
ADDED
|
analysis_outputs/T32/task2_attn_t31.png
ADDED
|
analysis_outputs/T32/task2_report.txt
ADDED
|
@@ -0,0 +1,31 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
TASK 2 — ATTENTION + DRIFT REPORT
|
| 2 |
+
==================================================
|
| 3 |
+
|
| 4 |
+
Input : dharmo rakṣati rakṣitaḥ
|
| 5 |
+
Output: असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर तृ तृ तृ तृ तृ तृ तृ तृ तृ तृ तृ तृ तृ तृ तृ तृ तृ तृ तृ तृ तृ तृ तृ असुर असुर असुर सङ्ख्या सङ्ख्या सङ्ख्या तृ तृ तृ तृ असुर असुर असुर असुर असुर तृ सङ्ख्या सङ्ख्या सङ्ख्या
|
| 6 |
+
|
| 7 |
+
Captured steps: 32
|
| 8 |
+
Lock-in step (CER<=0.05): t=0
|
| 9 |
+
Locked tokens: 80 Flexible tokens: 0
|
| 10 |
+
TF-IDF vs attention stability corr: -0.5251
|
| 11 |
+
TF-IDF status: OK
|
| 12 |
+
|
| 13 |
+
Saved graphs:
|
| 14 |
+
- task2_attn_t*.png / task2_all_layers_t0.png
|
| 15 |
+
- task2_attn_evolution.png
|
| 16 |
+
- task2_semantic_drift.png
|
| 17 |
+
- task2_source_alignment.png
|
| 18 |
+
- task2_tfidf_vs_attention.png
|
| 19 |
+
|
| 20 |
+
Step trajectory (first 10 rows)
|
| 21 |
+
------------------------------------------------------------
|
| 22 |
+
t= 31 bert=0.0000 drift=1.0000 text=असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर
|
| 23 |
+
t= 30 bert=0.0000 drift=1.0000 text=असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर
|
| 24 |
+
t= 29 bert=0.0000 drift=1.0000 text=असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर
|
| 25 |
+
t= 28 bert=0.0000 drift=1.0000 text=असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर
|
| 26 |
+
t= 27 bert=0.0000 drift=1.0000 text=असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर
|
| 27 |
+
t= 26 bert=0.0000 drift=1.0000 text=असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर
|
| 28 |
+
t= 25 bert=0.0000 drift=1.0000 text=असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर
|
| 29 |
+
t= 24 bert=0.0000 drift=1.0000 text=असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर
|
| 30 |
+
t= 23 bert=0.0000 drift=1.0000 text=असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर
|
| 31 |
+
t= 22 bert=0.0000 drift=1.0000 text=असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर
|
analysis_outputs/T32/task2_semantic_drift.png
ADDED
|
analysis_outputs/T32/task2_source_alignment.png
ADDED
|
analysis_outputs/T32/task2_tfidf_vs_attention.png
ADDED
|
analysis_outputs/T32/task3_concept_space.png
ADDED
|
analysis_outputs/T32/task3_diversity_curve.png
ADDED
|
analysis_outputs/T32/task3_diversity_direction.npy
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:367b1066d533e79478090121c9e7fc7455a88c9b2b8fc9950cfd84d64177a726
|
| 3 |
+
size 4224
|
analysis_outputs/T32/task3_pca_explained_variance.png
ADDED
|
analysis_outputs/T32/task3_report.txt
ADDED
|
@@ -0,0 +1,17 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
TASK 3 — CONCEPT VECTORS + PCA STEERING
|
| 2 |
+
==================================================
|
| 3 |
+
|
| 4 |
+
PCA: 50 components, 86.1% variance
|
| 5 |
+
Diversity PC: 0 (|r|=-0.595 with output length)
|
| 6 |
+
|
| 7 |
+
Saved graphs:
|
| 8 |
+
- task3_concept_space.png
|
| 9 |
+
- task3_pca_explained_variance.png
|
| 10 |
+
- task3_diversity_curve.png
|
| 11 |
+
|
| 12 |
+
Diversity spectrum:
|
| 13 |
+
alpha=-2.0 → चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड
|
| 14 |
+
alpha=-1.0 → चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड
|
| 15 |
+
alpha=+0.0 → माण माण माण माण चण्ड माण माण माण अलं माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण ॥ माण ॥ माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण ॥ माण श्रयाः माण माण माण माण माण माण माण माण माण माण माण माण माण माण चण्ड माण माण माण माण चण्ड माण माण माण माण चण्ड
|
| 16 |
+
alpha=+1.0 → माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण
|
| 17 |
+
alpha=+2.0 → माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण
|
analysis_outputs/T32/task4_3d.png
ADDED
|
analysis_outputs/T32/task4_raw_results.json
ADDED
|
@@ -0,0 +1,26 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"4": {
|
| 3 |
+
"bertscore_f1": 0.6790409088134766,
|
| 4 |
+
"semantic_sim": 0.5334163904190063,
|
| 5 |
+
"bleu": 0.0003333366738921545,
|
| 6 |
+
"speed_per_sample": 0.12499853520479519
|
| 7 |
+
},
|
| 8 |
+
"8": {
|
| 9 |
+
"bertscore_f1": 0.6395084261894226,
|
| 10 |
+
"semantic_sim": 0.48110902309417725,
|
| 11 |
+
"bleu": 1.7409952895149752e-156,
|
| 12 |
+
"speed_per_sample": 0.2653733541647671
|
| 13 |
+
},
|
| 14 |
+
"16": {
|
| 15 |
+
"bertscore_f1": 0.6821702718734741,
|
| 16 |
+
"semantic_sim": 0.5372508764266968,
|
| 17 |
+
"bleu": 0.00047544921470022843,
|
| 18 |
+
"speed_per_sample": 0.53346393458487
|
| 19 |
+
},
|
| 20 |
+
"32": {
|
| 21 |
+
"bertscore_f1": 0.4939882755279541,
|
| 22 |
+
"semantic_sim": 0.19846703112125397,
|
| 23 |
+
"bleu": 8.528327361662488e-233,
|
| 24 |
+
"speed_per_sample": 1.0967584718746366
|
| 25 |
+
}
|
| 26 |
+
}
|
analysis_outputs/T32/task4_report.txt
ADDED
|
@@ -0,0 +1 @@
|
|
|
|
|
|
|
| 1 |
+
Optimal diffusion steps = 8
|
analysis_outputs/T32/task5_quality_diversity_tradeoff.png
ADDED
|
analysis_outputs/T32/task5_report.txt
ADDED
|
@@ -0,0 +1,13 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
TASK 5 — COMPATIBILITY REPORT
|
| 2 |
+
========================================
|
| 3 |
+
Guidance classifier path unavailable; λ mapped to repetition penalty.
|
| 4 |
+
|
| 5 |
+
lambda=0.0 CER=6.4826 diversity=0.018
|
| 6 |
+
lambda=0.5 CER=6.4739 diversity=0.018
|
| 7 |
+
lambda=1.0 CER=6.5157 diversity=0.019
|
| 8 |
+
lambda=1.5 CER=6.5621 diversity=0.022
|
| 9 |
+
lambda=2.0 CER=6.7447 diversity=0.064
|
| 10 |
+
lambda=3.0 CER=8.4432 diversity=0.355
|
| 11 |
+
|
| 12 |
+
Saved graphs:
|
| 13 |
+
- task5_quality_diversity_tradeoff.png
|
analysis_outputs/T4/task1_encoder_cost.png
ADDED
|
analysis_outputs/T4/task1_kv_cache.txt
ADDED
|
@@ -0,0 +1,15 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
TASK 1 — KV CACHE BENCHMARK
|
| 2 |
+
========================================
|
| 3 |
+
|
| 4 |
+
has_generate_cached=True
|
| 5 |
+
memory_profile=N/A (CPU/MPS)
|
| 6 |
+
|
| 7 |
+
src_len standard(s) cached(s) speedup encoder%
|
| 8 |
+
16 0.217 0.168 1.30x 39.3%
|
| 9 |
+
32 0.168 0.126 1.33x 39.7%
|
| 10 |
+
64 0.250 0.202 1.24x 38.6%
|
| 11 |
+
|
| 12 |
+
Saved graphs:
|
| 13 |
+
- task1_time_comparison.png
|
| 14 |
+
- task1_speedup.png
|
| 15 |
+
- task1_encoder_cost.png
|
analysis_outputs/T4/task1_speedup.png
ADDED
|
analysis_outputs/T4/task1_time_comparison.png
ADDED
|