他们看到的是成功文字转WAV音频