如果把两者给混淆在一起的话文字转WAV音频