我们已经得到了坐标文字转WAV音频