Spaces:

obaydata
/

README

Running

README / README.md

Update org card with contact email

aeb767e verified about 2 months ago

1.45 kB

	---
	title: README
	emoji: "📊"
	colorFrom: blue
	colorTo: purple
	sdk: static
	pinned: false
	---

	# OBay Data

	World-class training data production for frontier AI models.

	We build high-quality datasets that power the next generation of AI — from large language models to embodied intelligence.

	## What We Do

	\| Domain \| Description \|
	\|--------\|-------------\|
	\| 🧠 Pre-training Data \| Large-scale, curated corpora for foundation model training \|
	\| 🎯 Post-training Data \| SFT, RLHF, DPO datasets for alignment and instruction-following \|
	\| 🤖 Embodied AI Data \| Robotics trajectories, gameplay recordings, sensor logs for world models \|
	\| 🖼️ Multimodal Data \| Image editing, composition, style transfer instruction sets \|

	## Datasets

	\| Dataset \| Description \|
	\|---------\|-------------\|
	\| trajectory_demo \| Terminal agent trajectories (ATIF format) \|
	\| svg-multimodal-rubrics \| SVG code generation + evaluation rubrics \|
	\| image-editing-style-instruction-following \| Style transfer + instruction following \|
	\| swe-coding-instruction-following \| SWE-bench coding tasks \|
	\| world-model-gameplay-recording \| Gameplay recording for world model training \|
	\| multi-image-composition-instruction-following \| Multi-image composition with instructions \|

	## Contact

	🌐 [obaydata.com](https://obaydata.com) · 💻 [GitHub](https://github.com/simonsu20000) · ✉️ simon.su@obaydata.com

	---
	title: README
	emoji: "📊"
	colorFrom: blue
	colorTo: purple
	sdk: static
	pinned: false
	---

	# OBay Data

	World-class training data production for frontier AI models.

	We build high-quality datasets that power the next generation of AI — from large language models to embodied intelligence.

	## What We Do

	\| Domain \| Description \|
	\|--------\|-------------\|
	\| 🧠 Pre-training Data \| Large-scale, curated corpora for foundation model training \|
	\| 🎯 Post-training Data \| SFT, RLHF, DPO datasets for alignment and instruction-following \|
	\| 🤖 Embodied AI Data \| Robotics trajectories, gameplay recordings, sensor logs for world models \|
	\| 🖼️ Multimodal Data \| Image editing, composition, style transfer instruction sets \|

	## Datasets

	\| Dataset \| Description \|
	\|---------\|-------------\|
	\| trajectory_demo \| Terminal agent trajectories (ATIF format) \|
	\| svg-multimodal-rubrics \| SVG code generation + evaluation rubrics \|
	\| image-editing-style-instruction-following \| Style transfer + instruction following \|
	\| swe-coding-instruction-following \| SWE-bench coding tasks \|
	\| world-model-gameplay-recording \| Gameplay recording for world model training \|
	\| multi-image-composition-instruction-following \| Multi-image composition with instructions \|

	## Contact

	🌐 [obaydata.com](https://obaydata.com) · 💻 [GitHub](https://github.com/simonsu20000) · ✉️ simon.su@obaydata.com