ntutaipei1

community

Activity Feed

AI & ML interests

None defined yet.

Recent Activity

dlion168 submitted a paper about 6 hours ago

VIBE: Voice-Induced open-ended Bias Evaluation for Large Audio-Language Models via Real-World Speech

dlion168 submitted a paper 13 days ago

Speaker Identity in Non-Verbal Vocalizations: Conditional Distillation and Mixture of Experts Approach

zenyn submitted a paper 3 months ago

Nudging Hidden States: Training-Free Model Steering for Chain-of-Thought Reasoning in Large Audio-Language Models

View all activity

dlion168

submitted a paper to Daily Papers about 6 hours ago

VIBE: Voice-Induced open-ended Bias Evaluation for Large Audio-Language Models via Real-World Speech

Paper • 2604.17248 • Published 6 days ago

dlion168

submitted a paper to Daily Papers 13 days ago

Speaker Identity in Non-Verbal Vocalizations: Conditional Distillation and Mixture of Experts Approach

Paper • 2606.21215 • Published 20 days ago

zenyn

submitted a paper to Daily Papers 3 months ago

Nudging Hidden States: Training-Free Model Steering for Chain-of-Thought Reasoning in Large Audio-Language Models

Paper • 2603.14636 • Published Mar 15 • 4

zenyn

authored 3 papers 3 months ago

A Preliminary Exploration with GPT-4o Voice Mode

Paper • 2502.09940 • Published Feb 14, 2025

MUGEN: Evaluating and Improving Multi-audio Understanding of Large Audio-Language Models

Paper • 2603.09714 • Published Mar 10

Nudging Hidden States: Training-Free Model Steering for Chain-of-Thought Reasoning in Large Audio-Language Models

Paper • 2603.14636 • Published Mar 15 • 4

dlion168

submitted a paper to Daily Papers 6 months ago

On the Fallacy of Global Token Perplexity in Spoken Language Model Evaluation

Paper • 2601.06329 • Published Jan 9 • 2

zenyn

authored 2 papers 9 months ago

SAKE: Towards Editing Auditory Attribute Knowledge of Large Audio-Language Models

Paper • 2510.16917 • Published Oct 19, 2025 • 20

Investigating Safety Vulnerabilities of Large Audio-Language Models Under Speaker Emotional Variations

Paper • 2510.16893 • Published Oct 19, 2025 • 18

dmnph

authored 3 papers 9 months ago

ML-SUPERB: Multilingual Speech Universal PERformance Benchmark

Paper • 2305.10615 • Published May 18, 2023 • 1

REBORN: Reinforcement-Learned Boundary Segmentation with Iterative Training for Unsupervised ASR

Paper • 2402.03988 • Published Feb 6, 2024

Hierarchical Programmatic Reinforcement Learning via Learning to Compose Programs

Paper • 2301.12950 • Published Jan 30, 2023

WeiChihChen

authored 2 papers 9 months ago

Dynamic-SUPERB Phase-2: A Collaboratively Expanding Benchmark for Measuring the Capabilities of Spoken Language Models with 180 Tasks

Paper • 2411.05361 • Published Nov 8, 2024 • 5

BreezyVoice: Adapting TTS for Taiwanese Mandarin with Enhanced Polyphone Disambiguation -- Challenges and Insights

Paper • 2501.17790 • Published Jan 29, 2025 • 3

dmnph

authored a paper 9 months ago

DeSTA2.5-Audio: Toward General-Purpose Large Audio Language Model with Self-Generated Cross-Modal Alignment

Paper • 2507.02768 • Published Jul 3, 2025 • 19

WeiChihChen

authored 3 papers 9 months ago

DeSTA2.5-Audio: Toward General-Purpose Large Audio Language Model with Self-Generated Cross-Modal Alignment

Paper • 2507.02768 • Published Jul 3, 2025 • 19

Analyzing Mitigation Strategies for Catastrophic Forgetting in End-to-End Training of Spoken Language Models

Paper • 2505.17496 • Published May 23, 2025 • 2

Spoken Stereoset: On Evaluating Social Bias Toward Speaker in Speech Large Language Models

Paper • 2408.07665 • Published Aug 14, 2024

dmnph

authored a paper 9 months ago

Game-Time: Evaluating Temporal Dynamics in Spoken Language Models

Paper • 2509.26388 • Published Sep 30, 2025 • 27

WeiChihChen

authored a paper 9 months ago

Game-Time: Evaluating Temporal Dynamics in Spoken Language Models

Paper • 2509.26388 • Published Sep 30, 2025 • 27

AI & ML interests

Recent Activity

Team members 13

taipei1's activity