Spaces:

ehwkang
/

researchbot

Sleeping

1.62 MB

Ctrl+K

2 contributors

Rename src/data/Globally Convergent Offline Reinforcement Learning with Smoothed Bellman Residual Minimization to src/data/Globally Convergent Offline Reinforcement Learning with Smoothed Bellman Residual Minimization.txt

4d0cb56 verified 15 days ago

AI alignment methods are probably (and provably) more efficient than you think.txt

73.8 kB
Upload 4 files 15 days ago
An End-to-end Offline RL Approach to Multi-turn Agentic Alignment.txt

96.9 kB
Upload 4 files 15 days ago
Bounded (O(1)) Regret Recommendation Learning via Synthetic Controls Oracle.txt

63.9 kB
Rename src/data/Bounded_SC.txt to src/data/Bounded (O(1)) Regret Recommendation Learning via Synthetic Controls Oracle.txt 7 months ago
Empirical risk minimization for Inverse RL and Dynamic Discrete Choice models.txt

244 kB
Rename src/data/ERMIRL.txt to src/data/Empirical risk minimization for Inverse RL and Dynamic Discrete Choice models.txt 7 months ago
Globally Convergent Offline Reinforcement Learning with Smoothed Bellman Residual Minimization.txt

77.7 kB
Rename src/data/Globally Convergent Offline Reinforcement Learning with Smoothed Bellman Residual Minimization to src/data/Globally Convergent Offline Reinforcement Learning with Smoothed Bellman Residual Minimization.txt 15 days ago
Is O(log N) practical_Near-Equivalence Between Delay Robustness and Bounded Regret in Bandits and RL.txt

90.8 kB
Upload Is O(log N) practical_Near-Equivalence Between Delay Robustness and Bounded Regret in Bandits and RL.txt 7 months ago
LLM Personas as a Substitute for Field Experiments in Method Benchmarking

81.2 kB
Create LLM Personas as a Substitute for Field Experiments in Method Benchmarking 6 months ago
Learning NP-Hard Multi-Agent Assignment Planning using GNN_Inference on a Random Graph and Provable Auction-Fitted Q-learning.txt

110 kB
Rename src/data/MRRC.txt to src/data/Learning NP-Hard Multi-Agent Assignment Planning using GNN_Inference on a Random Graph and Provable Auction-Fitted Q-learning.txt 7 months ago
Personalized Alignment Revisited_The Necessity and Sufficiency of User Diversity.txt

162 kB
Upload 4 files 15 days ago
Reasonably reasoning AI agents avoid game-theoretic failures in zero-shot, provably.txt

285 kB
Upload 4 files 15 days ago
Stability and Generalization for Bellman Residuals.txt

104 kB
Upload Stability and Generalization for Bellman Residuals.txt 7 months ago
TextBO: Bayesian Optimization in Language Space for Eval-Efficient Self-Improving AI.txt

233 kB
Rename src/data/Bayesian optimization in language space: An eval-efficient AI self-improvement framework.txt to src/data/TextBO: Bayesian Optimization in Language Space for Eval-Efficient Self-Improving AI.txt 15 days ago