我们也曾考虑过取舍文字转WAV音频