add essentials

Files changed (4) hide show

README.md ADDED Viewed

+### Reproduce
+```sh
+docker run -it --name "oppo" --gpus all --net host  nvcr.io/nvidia/tensorrt:23.03-py3
+pip3 install -r requirements.txt
+bash run.sh
+```

encoder.onnx ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:1096f60e4c2f92de7c24892a41fe76af7a391ff64d0b89b0a3c8d2e6d12e1311
+size 72431039

requirements.txt ADDED Viewed

+tensorrt==8.6.0
+onnx
+onnxruntime==1.13.1

run.sh ADDED Viewed

+polygraphy run \
+    ./encoder.onnx \
+    --fp16 \
+    --onnxrt \
+    --trt \
+    --atol 1e-3 --rtol 1e-3 \
+    --pool-limit workspace:1000000000 \
+    --save-engine=./encoder1_fp16.plan  \
+    --verbose \
+    --onnx-outputs mark all  \
+    --trt-outputs mark all \
+    --trt-min-shapes  \
+                   chunk_xs:[1,67,80] chunk_lens:[1] \
+                   offset:[1,1] att_cache:[1,12,4,80,128] \
+                   cnn_cache:[1,12,256,7] cache_mask:[1,1,80]  \
+    --trt-opt-shapes  \
+                   chunk_xs:[16,67,80] chunk_lens:[16] \
+                   offset:[16,1] att_cache:[16,12,4,80,128] \
+                   cnn_cache:[16,12,256,7] cache_mask:[16,1,80]  \
+    --trt-max-shapes  \
+                   chunk_xs:[32,67,80] chunk_lens:[32] \
+                   offset:[32,1] att_cache:[32,12,4,80,128] \
+                   cnn_cache:[32,12,256,7] cache_mask:[32,1,80]  \
+    --input-shapes \
+                   chunk_xs:[16,67,80] chunk_lens:[16] \
+                   offset:[16,1] att_cache:[16,12,4,80,128] \
+                   cnn_cache:[16,12,256,7] cache_mask:[16,1,80]  \
+    --validate