根本没办法把散乱的部位拼凑起来文字转WAV音频