我觉得你们讨论的焦点错了文字转WAV音频