增加了准确辨识他们身份的难度文字转WAV音频