也就是在千夫长的基础上往上跳一格文字转WAV音频