最后根据他们模糊的记忆文字转WAV音频