bhsinghgrid commited on
Commit
27f26fd
·
verified ·
1 Parent(s): 850e007

Update app/inference + ablation task outputs

Browse files
This view is limited to 50 files because it contains too many changes.   See raw diff
Files changed (50) hide show
  1. .gitattributes +3 -0
  2. README.md +26 -7
  3. analysis_outputs/T16/task1_encoder_cost.png +0 -0
  4. analysis_outputs/T16/task1_kv_cache.txt +15 -0
  5. analysis_outputs/T16/task1_speedup.png +0 -0
  6. analysis_outputs/T16/task1_time_comparison.png +0 -0
  7. analysis_outputs/T16/task2_all_layers_t0.png +0 -0
  8. analysis_outputs/T16/task2_attn_evolution.png +0 -0
  9. analysis_outputs/T16/task2_attn_t0.png +0 -0
  10. analysis_outputs/T16/task2_attn_t15.png +0 -0
  11. analysis_outputs/T16/task2_report.txt +31 -0
  12. analysis_outputs/T16/task2_semantic_drift.png +0 -0
  13. analysis_outputs/T16/task2_source_alignment.png +0 -0
  14. analysis_outputs/T16/task2_tfidf_vs_attention.png +0 -0
  15. analysis_outputs/T16/task3_concept_space.png +3 -0
  16. analysis_outputs/T16/task3_diversity_curve.png +0 -0
  17. analysis_outputs/T16/task3_diversity_direction.npy +3 -0
  18. analysis_outputs/T16/task3_pca_explained_variance.png +0 -0
  19. analysis_outputs/T16/task3_report.txt +17 -0
  20. analysis_outputs/T16/task4_3d.png +0 -0
  21. analysis_outputs/T16/task4_raw_results.json +26 -0
  22. analysis_outputs/T16/task4_report.txt +1 -0
  23. analysis_outputs/T16/task5_quality_diversity_tradeoff.png +0 -0
  24. analysis_outputs/T16/task5_report.txt +13 -0
  25. analysis_outputs/T32/task1_encoder_cost.png +0 -0
  26. analysis_outputs/T32/task1_kv_cache.txt +15 -0
  27. analysis_outputs/T32/task1_speedup.png +0 -0
  28. analysis_outputs/T32/task1_time_comparison.png +0 -0
  29. analysis_outputs/T32/task2_all_layers_t0.png +0 -0
  30. analysis_outputs/T32/task2_attn_evolution.png +0 -0
  31. analysis_outputs/T32/task2_attn_t0.png +0 -0
  32. analysis_outputs/T32/task2_attn_t31.png +0 -0
  33. analysis_outputs/T32/task2_report.txt +31 -0
  34. analysis_outputs/T32/task2_semantic_drift.png +0 -0
  35. analysis_outputs/T32/task2_source_alignment.png +0 -0
  36. analysis_outputs/T32/task2_tfidf_vs_attention.png +0 -0
  37. analysis_outputs/T32/task3_concept_space.png +0 -0
  38. analysis_outputs/T32/task3_diversity_curve.png +0 -0
  39. analysis_outputs/T32/task3_diversity_direction.npy +3 -0
  40. analysis_outputs/T32/task3_pca_explained_variance.png +0 -0
  41. analysis_outputs/T32/task3_report.txt +17 -0
  42. analysis_outputs/T32/task4_3d.png +0 -0
  43. analysis_outputs/T32/task4_raw_results.json +26 -0
  44. analysis_outputs/T32/task4_report.txt +1 -0
  45. analysis_outputs/T32/task5_quality_diversity_tradeoff.png +0 -0
  46. analysis_outputs/T32/task5_report.txt +13 -0
  47. analysis_outputs/T4/task1_encoder_cost.png +0 -0
  48. analysis_outputs/T4/task1_kv_cache.txt +15 -0
  49. analysis_outputs/T4/task1_speedup.png +0 -0
  50. analysis_outputs/T4/task1_time_comparison.png +0 -0
.gitattributes CHANGED
@@ -33,3 +33,6 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ analysis_outputs/T16/task3_concept_space.png filter=lfs diff=lfs merge=lfs -text
37
+ analysis_outputs/T4/task3_concept_space.png filter=lfs diff=lfs merge=lfs -text
38
+ analysis_outputs/T8/task3_concept_space.png filter=lfs diff=lfs merge=lfs -text
README.md CHANGED
@@ -1,13 +1,32 @@
1
  ---
2
- title: Devflow
3
- emoji: 🌍
4
- colorFrom: yellow
5
- colorTo: pink
6
  sdk: gradio
7
- sdk_version: 6.9.0
8
  app_file: app.py
9
  pinned: false
10
- short_description: Sanskrit IAST → Devanagari transliteration model built using
11
  ---
12
 
13
- Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
  ---
2
+ title: Sanskrit D3PM Paraphrase
3
+ emoji: "🕉️"
4
+ colorFrom: indigo
5
+ colorTo: blue
6
  sdk: gradio
7
+ sdk_version: 5.0.0
8
  app_file: app.py
9
  pinned: false
 
10
  ---
11
 
12
+ # Sanskrit D3PM Gradio Space
13
+
14
+ This Space runs Roman/IAST Sanskrit to Devanagari generation.
15
+
16
+ ## Model Source
17
+
18
+ Set these Space variables in **Settings → Variables and secrets**:
19
+
20
+ - `HF_CHECKPOINT_REPO` = `<your-username>/sanskrit-d3pm`
21
+ - `HF_CHECKPOINT_FILE` = `best_model.pt`
22
+ - `HF_CHECKPOINT_LABEL` = `main-model` (optional)
23
+
24
+ The app will download checkpoint from your model repo and load it at runtime.
25
+
26
+ ## Local Dev
27
+
28
+ ```bash
29
+ pip install -r requirements.txt
30
+ python app.py
31
+ ```
32
+
analysis_outputs/T16/task1_encoder_cost.png ADDED
analysis_outputs/T16/task1_kv_cache.txt ADDED
@@ -0,0 +1,15 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ TASK 1 — KV CACHE BENCHMARK
2
+ ========================================
3
+
4
+ has_generate_cached=True
5
+ memory_profile=N/A (CPU/MPS)
6
+
7
+ src_len standard(s) cached(s) speedup encoder%
8
+ 16 0.855 0.549 1.56x 39.2%
9
+ 32 0.679 0.499 1.36x 41.2%
10
+ 64 1.069 0.732 1.46x 40.0%
11
+
12
+ Saved graphs:
13
+ - task1_time_comparison.png
14
+ - task1_speedup.png
15
+ - task1_encoder_cost.png
analysis_outputs/T16/task1_speedup.png ADDED
analysis_outputs/T16/task1_time_comparison.png ADDED
analysis_outputs/T16/task2_all_layers_t0.png ADDED
analysis_outputs/T16/task2_attn_evolution.png ADDED
analysis_outputs/T16/task2_attn_t0.png ADDED
analysis_outputs/T16/task2_attn_t15.png ADDED
analysis_outputs/T16/task2_report.txt ADDED
@@ -0,0 +1,31 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ TASK 2 — ATTENTION + DRIFT REPORT
2
+ ==================================================
3
+
4
+ Input : dharmo rakṣati rakṣitaḥ
5
+ Output: धर्मो रक्षति रक्ष रक्ष ितः तः तः तः ितः तः धर्मो धर्मो धर्मो धर्मो तः ितः तः तः ितः ितः रक्ष रक्ष रक्ष धर्मो धर्मो धर्मो धर्मो धर्मो ति ति ति रक्ष रक्ष रक्ष रक्ष रक्ष ितः ितः रक्षि रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष ति ति रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष रक्ष
6
+
7
+ Captured steps: 16
8
+ Lock-in step (CER<=0.05): t=0
9
+ Locked tokens: 67 Flexible tokens: 13
10
+ TF-IDF vs attention stability corr: 0.8977
11
+ TF-IDF status: OK
12
+
13
+ Saved graphs:
14
+ - task2_attn_t*.png / task2_all_layers_t0.png
15
+ - task2_attn_evolution.png
16
+ - task2_semantic_drift.png
17
+ - task2_source_alignment.png
18
+ - task2_tfidf_vs_attention.png
19
+
20
+ Step trajectory (first 10 rows)
21
+ ------------------------------------------------------------
22
+ t= 15 bert=0.0000 drift=1.0000 text=धर्मो रक्षति रक्ष रक्ष ितः तः तः तः तः तः धर्मो धर्मो धर्मो
23
+ t= 14 bert=0.0000 drift=1.0000 text=धर्मो रक्षति रक्ष रक्ष ितः तः तः तः तः तः धर्मो धर्मो धर्मो
24
+ t= 13 bert=0.0000 drift=1.0000 text=धर्मो रक्षति रक्ष रक्ष ितः तः तः तः तः तः धर्मो धर्मो धर्मो
25
+ t= 12 bert=0.0000 drift=1.0000 text=धर्मो रक्षति रक्ष रक्ष ितः तः तः तः तः तः धर्मो धर्मो धर्मो
26
+ t= 11 bert=0.0000 drift=1.0000 text=धर्मो रक्षति रक्ष रक्ष ितः तः तः तः तः तः धर्मो धर्मो धर्मो
27
+ t= 10 bert=0.0000 drift=1.0000 text=धर्मो रक्षति रक्ष रक्ष ितः तः तः तः ितः तः धर्मो धर्मो धर्मो
28
+ t= 9 bert=0.0000 drift=1.0000 text=धर्मो रक्षति रक्ष रक्ष ितः तः तः तः ितः तः धर्मो धर्मो धर्मो
29
+ t= 8 bert=0.0000 drift=1.0000 text=धर्मो रक्षति रक्ष रक्ष ितः तः तः तः ितः तः धर्मो धर्मो धर्मो
30
+ t= 7 bert=0.0000 drift=1.0000 text=धर्मो रक्षति रक्ष रक्ष ितः तः तः तः ितः तः धर्मो धर्मो धर्मो
31
+ t= 6 bert=0.0000 drift=1.0000 text=धर्मो रक्षति रक्ष रक्ष ितः तः तः तः ितः तः धर्मो धर्मो धर्मो
analysis_outputs/T16/task2_semantic_drift.png ADDED
analysis_outputs/T16/task2_source_alignment.png ADDED
analysis_outputs/T16/task2_tfidf_vs_attention.png ADDED
analysis_outputs/T16/task3_concept_space.png ADDED

Git LFS Details

  • SHA256: f9a510ef3f1866c515e1b56865b75d9ffad94db2b246cca568cdf073be66a582
  • Pointer size: 131 Bytes
  • Size of remote file: 129 kB
analysis_outputs/T16/task3_diversity_curve.png ADDED
analysis_outputs/T16/task3_diversity_direction.npy ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:be55855f7ab065608575c85ee1d88452c707f4b256354715f017ff501ab51d2d
3
+ size 4224
analysis_outputs/T16/task3_pca_explained_variance.png ADDED
analysis_outputs/T16/task3_report.txt ADDED
@@ -0,0 +1,17 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ TASK 3 — CONCEPT VECTORS + PCA STEERING
2
+ ==================================================
3
+
4
+ PCA: 50 components, 48.4% variance
5
+ Diversity PC: 0 (|r|=0.155 with output length)
6
+
7
+ Saved graphs:
8
+ - task3_concept_space.png
9
+ - task3_pca_explained_variance.png
10
+ - task3_diversity_curve.png
11
+
12
+ Diversity spectrum:
13
+ alpha=-2.0 → बले बले ोर् तुल वीर्य वीर्य दस्य अध क्षणम किनी कृपणं @ दीयते वै क्षणम वरो वरो सिंहा सकरुण वरो दस्य सकरुण दीयते दीयते वै वै बले बले बले बले ोर् पतति वरो तुल तुल तुल वीर्य वीर्य वीर्य वीर्य तुल तुल तुल तुल तुल वपुषः वरो वरो मयं नम् हतः सप्तधा नम् नम् ति यता ष्टिम् दान्त अध दीयते क्षणम ग्र शोधन न्ती ति ान्न दान्त म नित्यम् सा भान िता ान्न दस्य ऽर्थ दस्य नम् दुर्गा दीयते ऽर्थ
14
+ alpha=-1.0 → बले र् अ तुल वीर्य वीर्य स्य सिंहा सिंहा सन जनकं वै वै वै @ सन सन सिंहा स्य स्य वीर्य ग सन सर्वस्वं वै वै बले बले बले र् ॥ त्त अ तुल तुल वीर्य वीर्य वीर्य वीर्य वीर्य तुल तुल तुल तुल तुल र् जान बले वै वै ॥ व वरो सा म दस्य ग् यता ष्टिम् सन सन ग सन ग ग सन भान घ म अध ऽन्तरे महा भ व त्रया सिंहा न्ती सन सा सन
15
+ alpha=+0.0 → बले र् र् तुल वीर्य वीर्य स्य सिंहा सन । गतस्य वै वै वै गतस्य सन सन सिंहा सा सा स्य स्य सन म् वै वै बले बले बले । र् अ अ । तुल वीर्य वीर्य वीर्य वीर्य वीर्य तुल तुल तुल अ अ र् र् ॥ ॥ वै भ सन सन ॥ ॥ द् द् सन क्ष सन सन सन सन सन सन ॥ सन कारकः ॥ स्य सन सन ॥ चिन्त ते सिंहा ॥ ता सन पि
16
+ alpha=+1.0 → बले र् अ अ वीर्य वीर्य स्य सिंहा सन सन गतस्य ते वै वै एकस्य सन सन सिंहा स्य स्य स्य स्य सन सन वै वै बले बले बले र् र् अ अ अ सव्य ित त्र वीर्य स्य वीर्य चारि संयुक्त स् अ अ र् र् र् ॥ वै वै सन यु हेम स्य सिद्धं सं स्ति शेष ॥ सन सन सन ॥ सन सन निर्वृतः ॥ व सन च ) ॥ मुख सं स्य स स्य ैस्तथा सन
17
+ alpha=+2.0 → बले बहू अ क्षे राजानं स्य स्य सिंहा सन सन एकस्य गतस्य निश वाच एकस्य सन ̍ये̱ क्षे स्य स्य स्य स्य वाच एकस्य पयो वै ॥ स्ति बले र् नित्य अ अ अ उत्तम क्षे स्य स्य स्य स्य स्य संयुक्त अचिन्त अ अ र् र् अपरा ॥ एकस्य नित्य क्षे घोरं सन एकस्य सं व्रजति एकस्य सन क्षे गेन्द्र सन सन सन मुख ॥ ) कर फलप्र त्र अचिन्त सं त्र स्य बहू नित्य ॥ एकस्य ̍भिर् सन
analysis_outputs/T16/task4_3d.png ADDED
analysis_outputs/T16/task4_raw_results.json ADDED
@@ -0,0 +1,26 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "4": {
3
+ "bertscore_f1": 0.6790409088134766,
4
+ "semantic_sim": 0.5334163904190063,
5
+ "bleu": 0.0003333366738921545,
6
+ "speed_per_sample": 0.12499853520479519
7
+ },
8
+ "8": {
9
+ "bertscore_f1": 0.6395084261894226,
10
+ "semantic_sim": 0.48110902309417725,
11
+ "bleu": 1.7409952895149752e-156,
12
+ "speed_per_sample": 0.2653733541647671
13
+ },
14
+ "16": {
15
+ "bertscore_f1": 0.6821702718734741,
16
+ "semantic_sim": 0.5372508764266968,
17
+ "bleu": 0.00047544921470022843,
18
+ "speed_per_sample": 0.53346393458487
19
+ },
20
+ "32": {
21
+ "bertscore_f1": 0.4939882755279541,
22
+ "semantic_sim": 0.19846703112125397,
23
+ "bleu": 8.528327361662488e-233,
24
+ "speed_per_sample": 1.0967584718746366
25
+ }
26
+ }
analysis_outputs/T16/task4_report.txt ADDED
@@ -0,0 +1 @@
 
 
1
+ Optimal diffusion steps = 8
analysis_outputs/T16/task5_quality_diversity_tradeoff.png ADDED
analysis_outputs/T16/task5_report.txt ADDED
@@ -0,0 +1,13 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ TASK 5 — COMPATIBILITY REPORT
2
+ ========================================
3
+ Guidance classifier path unavailable; λ mapped to repetition penalty.
4
+
5
+ lambda=0.0 CER=5.7955 diversity=0.251
6
+ lambda=0.5 CER=5.7330 diversity=0.303
7
+ lambda=1.0 CER=5.7294 diversity=0.395
8
+ lambda=1.5 CER=5.5630 diversity=0.505
9
+ lambda=2.0 CER=5.5803 diversity=0.611
10
+ lambda=3.0 CER=5.4209 diversity=0.767
11
+
12
+ Saved graphs:
13
+ - task5_quality_diversity_tradeoff.png
analysis_outputs/T32/task1_encoder_cost.png ADDED
analysis_outputs/T32/task1_kv_cache.txt ADDED
@@ -0,0 +1,15 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ TASK 1 — KV CACHE BENCHMARK
2
+ ========================================
3
+
4
+ has_generate_cached=True
5
+ memory_profile=N/A (CPU/MPS)
6
+
7
+ src_len standard(s) cached(s) speedup encoder%
8
+ 16 1.844 1.084 1.70x 41.2%
9
+ 32 1.580 1.133 1.39x 39.9%
10
+ 64 2.386 1.939 1.23x 39.7%
11
+
12
+ Saved graphs:
13
+ - task1_time_comparison.png
14
+ - task1_speedup.png
15
+ - task1_encoder_cost.png
analysis_outputs/T32/task1_speedup.png ADDED
analysis_outputs/T32/task1_time_comparison.png ADDED
analysis_outputs/T32/task2_all_layers_t0.png ADDED
analysis_outputs/T32/task2_attn_evolution.png ADDED
analysis_outputs/T32/task2_attn_t0.png ADDED
analysis_outputs/T32/task2_attn_t31.png ADDED
analysis_outputs/T32/task2_report.txt ADDED
@@ -0,0 +1,31 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ TASK 2 — ATTENTION + DRIFT REPORT
2
+ ==================================================
3
+
4
+ Input : dharmo rakṣati rakṣitaḥ
5
+ Output: असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर तृ तृ तृ तृ तृ तृ तृ तृ तृ तृ तृ तृ तृ तृ तृ तृ तृ तृ तृ तृ तृ तृ तृ असुर असुर असुर सङ्ख्या सङ्ख्या सङ्ख्या तृ तृ तृ तृ असुर असुर असुर असुर असुर तृ सङ्ख्या सङ्ख्या सङ्ख्या
6
+
7
+ Captured steps: 32
8
+ Lock-in step (CER<=0.05): t=0
9
+ Locked tokens: 80 Flexible tokens: 0
10
+ TF-IDF vs attention stability corr: -0.5251
11
+ TF-IDF status: OK
12
+
13
+ Saved graphs:
14
+ - task2_attn_t*.png / task2_all_layers_t0.png
15
+ - task2_attn_evolution.png
16
+ - task2_semantic_drift.png
17
+ - task2_source_alignment.png
18
+ - task2_tfidf_vs_attention.png
19
+
20
+ Step trajectory (first 10 rows)
21
+ ------------------------------------------------------------
22
+ t= 31 bert=0.0000 drift=1.0000 text=असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर
23
+ t= 30 bert=0.0000 drift=1.0000 text=असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर
24
+ t= 29 bert=0.0000 drift=1.0000 text=असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर
25
+ t= 28 bert=0.0000 drift=1.0000 text=असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर
26
+ t= 27 bert=0.0000 drift=1.0000 text=असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर
27
+ t= 26 bert=0.0000 drift=1.0000 text=असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर
28
+ t= 25 bert=0.0000 drift=1.0000 text=असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर
29
+ t= 24 bert=0.0000 drift=1.0000 text=असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर
30
+ t= 23 bert=0.0000 drift=1.0000 text=असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर
31
+ t= 22 bert=0.0000 drift=1.0000 text=असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर असुर
analysis_outputs/T32/task2_semantic_drift.png ADDED
analysis_outputs/T32/task2_source_alignment.png ADDED
analysis_outputs/T32/task2_tfidf_vs_attention.png ADDED
analysis_outputs/T32/task3_concept_space.png ADDED
analysis_outputs/T32/task3_diversity_curve.png ADDED
analysis_outputs/T32/task3_diversity_direction.npy ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:367b1066d533e79478090121c9e7fc7455a88c9b2b8fc9950cfd84d64177a726
3
+ size 4224
analysis_outputs/T32/task3_pca_explained_variance.png ADDED
analysis_outputs/T32/task3_report.txt ADDED
@@ -0,0 +1,17 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ TASK 3 — CONCEPT VECTORS + PCA STEERING
2
+ ==================================================
3
+
4
+ PCA: 50 components, 86.1% variance
5
+ Diversity PC: 0 (|r|=-0.595 with output length)
6
+
7
+ Saved graphs:
8
+ - task3_concept_space.png
9
+ - task3_pca_explained_variance.png
10
+ - task3_diversity_curve.png
11
+
12
+ Diversity spectrum:
13
+ alpha=-2.0 → चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड
14
+ alpha=-1.0 → चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड चण्ड
15
+ alpha=+0.0 → माण माण माण माण चण्ड माण माण माण अलं माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण ॥ माण ॥ माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण ॥ माण श्रयाः माण माण माण माण माण माण माण माण माण माण माण माण माण माण चण्ड माण माण माण माण चण्ड माण माण माण माण चण्ड
16
+ alpha=+1.0 → माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण
17
+ alpha=+2.0 → माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण माण
analysis_outputs/T32/task4_3d.png ADDED
analysis_outputs/T32/task4_raw_results.json ADDED
@@ -0,0 +1,26 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "4": {
3
+ "bertscore_f1": 0.6790409088134766,
4
+ "semantic_sim": 0.5334163904190063,
5
+ "bleu": 0.0003333366738921545,
6
+ "speed_per_sample": 0.12499853520479519
7
+ },
8
+ "8": {
9
+ "bertscore_f1": 0.6395084261894226,
10
+ "semantic_sim": 0.48110902309417725,
11
+ "bleu": 1.7409952895149752e-156,
12
+ "speed_per_sample": 0.2653733541647671
13
+ },
14
+ "16": {
15
+ "bertscore_f1": 0.6821702718734741,
16
+ "semantic_sim": 0.5372508764266968,
17
+ "bleu": 0.00047544921470022843,
18
+ "speed_per_sample": 0.53346393458487
19
+ },
20
+ "32": {
21
+ "bertscore_f1": 0.4939882755279541,
22
+ "semantic_sim": 0.19846703112125397,
23
+ "bleu": 8.528327361662488e-233,
24
+ "speed_per_sample": 1.0967584718746366
25
+ }
26
+ }
analysis_outputs/T32/task4_report.txt ADDED
@@ -0,0 +1 @@
 
 
1
+ Optimal diffusion steps = 8
analysis_outputs/T32/task5_quality_diversity_tradeoff.png ADDED
analysis_outputs/T32/task5_report.txt ADDED
@@ -0,0 +1,13 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ TASK 5 — COMPATIBILITY REPORT
2
+ ========================================
3
+ Guidance classifier path unavailable; λ mapped to repetition penalty.
4
+
5
+ lambda=0.0 CER=6.4826 diversity=0.018
6
+ lambda=0.5 CER=6.4739 diversity=0.018
7
+ lambda=1.0 CER=6.5157 diversity=0.019
8
+ lambda=1.5 CER=6.5621 diversity=0.022
9
+ lambda=2.0 CER=6.7447 diversity=0.064
10
+ lambda=3.0 CER=8.4432 diversity=0.355
11
+
12
+ Saved graphs:
13
+ - task5_quality_diversity_tradeoff.png
analysis_outputs/T4/task1_encoder_cost.png ADDED
analysis_outputs/T4/task1_kv_cache.txt ADDED
@@ -0,0 +1,15 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ TASK 1 — KV CACHE BENCHMARK
2
+ ========================================
3
+
4
+ has_generate_cached=True
5
+ memory_profile=N/A (CPU/MPS)
6
+
7
+ src_len standard(s) cached(s) speedup encoder%
8
+ 16 0.217 0.168 1.30x 39.3%
9
+ 32 0.168 0.126 1.33x 39.7%
10
+ 64 0.250 0.202 1.24x 38.6%
11
+
12
+ Saved graphs:
13
+ - task1_time_comparison.png
14
+ - task1_speedup.png
15
+ - task1_encoder_cost.png
analysis_outputs/T4/task1_speedup.png ADDED
analysis_outputs/T4/task1_time_comparison.png ADDED