他们也未必会录取文字转WAV音频