只是人家要精准的用仪器测量文字转WAV音频