剩余的两位则表示中立文字转WAV音频