{"segments": [[90.0, 92.2]], "p_music": [0.0], "p_speech": [33.89], "labels": ["P(~Music) = 0.0 | P(~Speech) = 33.89"]}