还是要继续收集文字转WAV音频