并调整加注的次序和速率文字转WAV音频