但大体上还是保留原样的文字转WAV音频