分为普通人和念动士两种文字转WAV音频