์์ฃผ ์คํ์ ์ธ ์๊ฐ.
UZR-Lastest (Luria 3brains Meta Runner)
UZR-Lastest๋ GitHub ์ ์ฅ์ 10kseason/uzr์ ์๋
โ๋ฃจ๋ฆฌ์ 3brains ๋ฉํ ๋ฌ๋(UZR)โ์ ์ต์ PyTorch ์ฒดํฌํฌ์ธํธ๋ฅผ ๋ชจ์๋ ๊ณต๊ฐ์
๋๋ค.
โ ๏ธ ์ฐ๊ตฌ์ฉ ํ๋กํ ํ์ ์ ๋๋ค.
- ์์ ์ฑยท์ผ๋ฐ ์ฑ๋ฅยท์ง์์ ์ธ ์ ์ง๋ณด์๋ ๋ณด์ฅ๋์ง ์์ต๋๋ค.
- pickle ํฌ๋งท์ ์ฌ์ฉํ๊ธฐ ๋๋ฌธ์, ์ ๋ขฐํ๋ ํ๊ฒฝ์์๋ง ๋ก๋ํด์ผ ํฉ๋๋ค.
Files
์ด ์ ์ฅ์์๋ ๋ค์๊ณผ ๊ฐ์ PyTorch ์ฒดํฌํฌ์ธํธ๊ฐ ํฌํจ๋์ด ์์ต๋๋ค:โ
uzr_3brains_ckpt.pt(~48.7 MB)uzr_3brains_ckpt_best.pt(~107 MB)uzr_3brains_ckpt_last.pt(~107 MB)
๋ชจ๋ ํ์ผ์ torch.load()๋ก ๋ก๋๋๋ pickle ๊ธฐ๋ฐ ์ฒดํฌํฌ์ธํธ์ด๋ฉฐ,
๋ด๋ถ์์ ๋ค์ Python ํ์
์ importํฉ๋๋ค:โ
uzr.memory.MemoryItemtorch.device,torch.FloatStorage,torch._utils._rebuild_tensor_v2collections.OrderedDict
๋ฐ๋ผ์, ์ฌ์ฉ ์์๋ GitHub ์ ์ฅ์๋ฅผ ํจ๊ป ํด๋ก ํ๊ฑฐ๋uzr/ ๋๋ ํฐ๋ฆฌ๊ฐ Python path์ ์ฌ๋ผ์ ์์ด์ผ ํฉ๋๋ค.
What is UZR?
์งง๊ฒ ๋งํ๋ฉด, UZR๋ โ์์ Transformer ์ธ์ฝ๋์ 3๊ฐ์ latent ๋ธ๋ ์ธ๊ณผ ์์ถ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ๋ถ์ธ ๋ฉํ ๋ฌ๋โ์ ๋๋ค.
GitHub README ๊ธฐ์ค์ผ๋ก, UZR๋ ๋ค์ ์์๋ค๋ก ๊ตฌ์ฑ๋ฉ๋๋ค:
3brains latent space
- ๋น ๋ฅธ ๊ท์นยท์ง์์ฉ
z_rule(inner-step์์ ๋น ๋ฅด๊ฒ ์ ์) - ๋๋ฆฐ ์ธ์ด/๋
ผ๋ฆฌ์ฉ
z_slow_lang,z_slow_logic+ ๋์ ์๋z_bridge - ์ฌ๊ณ ๋ณด์กฐ์ฉ
z_think
- ๋น ๋ฅธ ๊ท์นยท์ง์์ฉ
Identity & Intent
identity_self/identity_intent๋ฒกํฐidentity_intent_control()์ด ๋ด๋๋(bias, toggle)๋ก
โธ inner-step ํ์
โธ top-k / temperature
โธ ๋ฉ๋ชจ๋ฆฌ ์ฐ๊ธฐ ๊ฒ์ดํธ
โธ abstain ์ฌ๋ถ
๋ฅผ ํจ๊ป ์ ์ดํฉ๋๋ค.
Self-Eval & Abstain
- conf / entropy / Brier ์ค์ฝ์ด ๊ธฐ๋ฐ ์๊ธฐ ํ๊ฐ ํค๋
- โํ์ ์ด ์์ผ๋ฉด ๊ฑฐ๋ถํ๊ฑฐ๋ ์ฝํ๊ฒ๋ง ํ์ตโํ๋๋ก ์ค๊ณ๋ lossยท๊ฒ์ดํธ
CompressedMemory
- surprise / entropy / ์ค๋ณต๋ / ๊ทผ์ ๋ / ๋ฒํท ์ ์ฑ ์ผ๋ก โ์ธ์ ์ธ์งโ๋ฅผ ์ ํ
- shadow bank, tail bucket, rebalance, learner(์์ธก๊ธฐ)๋ฅผ ํฌํจํ ์ฅ๊ธฐ ์์ถ ๋ฉ๋ชจ๋ฆฌ ๋
NPU(QNN) / ORT ์์ง (์ต์ )
- PyTorch ํ๋ผ๋ฏธํฐ๋ ๊ทธ๋๋ก ๋๊ณ , ONNX(QDQ) INT8 + QNN์ผ๋ก ์ถ๋ก ๋ง ์คํ๋ก๋ฉ
npu/runtime_ort.py,npu/engine.py์์ ์์ง ํ ๊ธ ๋ฐ ์ปจํ ์คํธ ์บ์๋ฅผ ์ ๊ณตํฉ๋๋ค.
์์ธํ ๊ตฌ์กฐ์ ํ์ต/์ถ๋ก ํ์ดํ๋ผ์ธ์ GitHub README์ ์ ๋ฆฌ๋์ด ์์ต๋๋ค.
Intended use
์ด ์ฒดํฌํฌ์ธํธ๋ ์ฐ๊ตฌยท๊ฐ์ธ ์คํยท์์ด๋์ด ํ๋กํ ํ์ดํ์ ๋ชฉ์ ์ผ๋ก ํฉ๋๋ค.
์์ ์ฉ๋:
- ์ฅ๊ธฐ ์ธ์
๋์
- Self-Eval / Abstain ์ ํธ๊ฐ ์ด๋ป๊ฒ ์์ง์ด๋์ง,
- ๋ฉ๋ชจ๋ฆฌ ๋ฒํท(shadow / tail / rebalance)์ด ์ด๋ป๊ฒ ์ฑ์์ง๋์ง,
- identity intent๊ฐ ์ถ๋ก ๊ณผ์ ์ ์ด๋ป๊ฒ ๋ฐ๊พธ๋์ง
๋ฅผ ๊ด์ฐฐํ๋ ์คํ
- โ์์ ๋ชจ๋ธ + ์์ถ ๋ฉ๋ชจ๋ฆฌ + ๋ฉํ ๋ฌ๋โ ๊ตฌ์กฐ๋ฅผ ์ฐธ๊ณ ํ์ฌ
๋ค๋ฅธ ํ๋ก์ ํธ์ ์์ฉํ๋ ์ฉ๋ - NPU(QNN) + ONNX Runtime ํ๊ฒฝ์์ ๋ฉ๋ชจ๋ฆฌ ๋ฌ๋ฆฐ ๋ฌ๋๋ฅผ ํ ์คํธํ๋ ์ฉ๋
๋น๊ถ์ฅ ์ฌ์ฉ
- ์ผ๋ฐ ์ฌ์ฉ์ ๋์ ํ๋ก๋์ ์๋น์ค
- ๊ฐํ ์์ /์ ํ๋๊ฐ ์๊ตฌ๋๋ ์์ฉ (์: ์๋ฃ, ๊ธ์ต, ๋ฒ๋ฅ ์์ฌ๊ฒฐ์ )
- ๋๊ท๋ชจ RLHF๊ฐ ๋ถ์ ๋ฒ์ฉ ์ฑ๋ด ๋์ฒด ์ฉ๋
How to load
- GitHub ์ ์ฅ์ ํด๋ก :
- Python path์
uzr/๊ฐ ๋ณด์ด๋๋ก ์ค์ ํฉ๋๋ค. - PyTorch์์
torch.load("uzr_3brains_ckpt_*.pt")๋ฅผ ์ฌ์ฉํด ์ฒดํฌํฌ์ธํธ๋ฅผ ๋ก๋ํฉ๋๋ค.- ๋ด๋ถ์
uzr.model.UZRModel,uzr.memory.MemoryItem๋ฑ์ด ๋ฑ์ฅํ๋ฏ๋ก,
๋์ผํ ์ฝ๋๋ฒ ์ด์ค๋ฅผ ํจ๊ป ๋ถ๋ฌ์์ผ ํฉ๋๋ค.
- ๋ด๋ถ์
๊ตฌ์ฒด์ ์ธ ์ฌ์ฉ ์์๋ GitHub ์ชฝ chat_cli.py, infer_longrun_*.py, uzr_live.py ๋ฑ์ ์ฐธ๊ณ ํ๋ ๊ฒ์ด ๊ฐ์ฅ ์์ ํฉ๋๋ค.
License
- ์ฝ๋์ ์ฒดํฌํฌ์ธํธ๋ ๋ชจ๋ MIT License๋ฅผ ๋ฐ๋ฆ ๋๋ค.
- KOBERT + KMMLU_KO + TASK.py Codebook.py๋ง ์ฌ์ฉ๋์ด ํธ๋ ์ด๋๋์์ต๋๋ค.
- ์์ ๋กญ๊ฒ fork / ์์ / ์ฌ์ฌ์ฉํ ์ ์์ง๋ง,
์์ ยทํ์งยท์ ์ง๋ณด์๋ ์ ์ ์ผ๋ก ์ฌ์ฉ์ ์ฑ ์์ ๋๋ค.