然后他记住位置文字转WAV音频