rsvalerio
/

codebert-base-coreml

Feature Extraction

sentence-transformers

Model card Files Files and versions

rsvalerio commited on Mar 25

Commit

4c62b1a

·

verified ·

1 Parent(s): 050af4a

Update model card

Files changed (1) hide show

README.md +48 -0

README.md ADDED Viewed

	@@ -0,0 +1,48 @@

+---
+license: mit
+tags:
+  - coreml
+  - sentence-transformers
+  - embedding
+  - code
+  - roberta
+base_model: microsoft/codebert-base
+library_name: coremltools
+pipeline_tag: feature-extraction
+---
+# codebert-base — CoreML (.mlpackage)
+CoreML conversion of [microsoft/codebert-base](https://huggingface.co/microsoft/codebert-base) for native Apple Neural Engine / GPU inference on macOS and iOS.
+## Files
+| File | Description |
+|------|-------------|
+| `model.mlpackage/` | CoreML model (FP16, flexible shapes) |
+| `tokenizer.json` | HF fast tokenizer |
+## Details
+- **Architecture**: RoBERTa (encoder-only, no token_type_ids)
+- **Precision**: FP16 (native ANE precision)
+- **Compute units**: `.all` — CoreML schedules across ANE, GPU, and CPU
+- **Input shapes**: batch=1..512, seq_len=1..512 (flexible range)
+- **Embedding dimension**: 768
+## Usage with cai
+```bash
+cai index --embed-backend swift --embed-model "rsvalerio/codebert-base-coreml"
+```
+The Swift backend downloads the `.mlpackage` from this repo, compiles it to `.mlmodelc` on first run (~30-60s), and caches the compiled model for subsequent runs.
+## Conversion
+Converted using [rsvalerio/models](https://github.com/rsvalerio/models) CI pipeline with `coremltools`.
+```bash
+pip install coremltools transformers torch
+python convert.py
+```