是个体或局部的对抗文字转WAV音频