他们在演唱中的一大难点就是无法把握和观众互动的度文字转WAV音频