但具体下潜到多深也无法估算文字转WAV音频