最终达到一个尽量满足我们倾向性的积极和温暖的结果文字转WAV音频