显然是回音听到的原话文字转WAV音频