并且只能记住很难合理运用文字转WAV音频