推断出是这些人类的记忆文字转WAV音频