然后我们从后方和侧方插入文字转WAV音频