我们的记忆大部分都是重叠的文字转WAV音频