我们希望把它们放在同一个框架里来谈文字转WAV音频