可以说只能允许有一个声音文字转WAV音频