虽然注意力没放在对话上面文字转WAV音频