而他也是这么理解和执行的文字转WAV音频