下半部分是三个文字转WAV音频