尽管训练可能会让他们死文字转WAV音频