这两个办法已经是芯片给出的最优思路了文字转WAV音频