而忽略了传送数量文字转WAV音频