他和我说了一下他们的思路――据他新找的那个团队说文字转WAV音频