就分析出对方的大概能力来文字转WAV音频