他们的信息完全是靠文字转WAV音频