以及每个行止举动文字转WAV音频