我希望你们能想出一套比较适合大规模生产这玩意的设备文字转WAV音频