我们先跟他们口头约定文字转WAV音频