最终根据这些标记文字转WAV音频