然后根据这些不同之处文字转WAV音频