刚才的话确实是欠考虑文字转WAV音频