所以自己需要给与他们相当的调解文字转WAV音频