肯定会尽量避让彼此文字转WAV音频