我们看到的就是表面文字转WAV音频