实际不会再有补给文字转WAV音频