一开始就是他们计划好的文字转WAV音频