第二次的过程几乎和第一次完全相同文字转WAV音频