显然是被强化的文字转WAV音频