NLPIR Lab @ RUC

university

https://ruc-nlpir.github.io/

Activity Feed

AI & ML interests

None defined yet.

Recent Activity

MengjieDeng updated a Space 8 days ago

RUC-NLPIR/DISBench-Leaderboard

namespace-ERI submitted a paper 14 days ago

Toward Generalist Autonomous Research via Hypothesis-Tree Refinement

zstanjj authored a paper 21 days ago

From Prompt Injection to Persistent Control: Defending Agentic Harness Against Trojan Backdoors

View all activity

Papers

Toward Generalist Autonomous Research via Hypothesis-Tree Refinement

DeepImageSearch: Benchmarking Multimodal Agents for Context-Aware Image Retrieval in Visual Histories

View all Papers

NLPIR Lab @ RUC

AI & ML interests

Recent Activity

Papers

RUC-NLPIR 's collections 4

OmniGAIA Leaderboard

RUC-NLPIR/OmniGAIA

RUC-NLPIR/Omnimodal-Agent-SFT-2K

RUC-NLPIR/OmniAtlas-Qwen3-30B-A3B

DeepImageSearch: Benchmarking Multimodal Agents for Context-Aware Image Retrieval in Visual Histories

RUC-NLPIR/DISBench

DISBench Leaderboard

GISA Leaderboard

GISA: A Benchmark for General Information-Seeking Assistant

RUC-NLPIR/GISA

OmniEval

OmniEval: An Omnidirectional and Automatic RAG Evaluation Benchmark in Financial Domain

RUC-NLPIR/OmniEval-KnowledgeCorpus

RUC-NLPIR/OmniEval-AutoGen-Dataset

OmniGAIA Leaderboard

RUC-NLPIR/OmniGAIA

RUC-NLPIR/Omnimodal-Agent-SFT-2K

RUC-NLPIR/OmniAtlas-Qwen3-30B-A3B

GISA Leaderboard

GISA: A Benchmark for General Information-Seeking Assistant

RUC-NLPIR/GISA

DeepImageSearch: Benchmarking Multimodal Agents for Context-Aware Image Retrieval in Visual Histories

RUC-NLPIR/DISBench

DISBench Leaderboard

OmniEval

OmniEval: An Omnidirectional and Automatic RAG Evaluation Benchmark in Financial Domain

RUC-NLPIR/OmniEval-KnowledgeCorpus

RUC-NLPIR/OmniEval-AutoGen-Dataset

AI & ML interests

Recent Activity

Papers

Team members 7

RUC-NLPIR 's collections 4

OmniGAIA Leaderboard

DISBench Leaderboard

GISA Leaderboard

OmniEval

OmniGAIA Leaderboard

GISA Leaderboard

DISBench Leaderboard

OmniEval