这些问题涉及到各方利益文字转WAV音频