Saya cuba menggunakan Baidu Voice Cloud API untuk melaksanakan perkhidmatan desktop termasuk TTS. MP3 telah berjaya diambil dan dicache dalam cStringIO, tetapi saya tidak tahu cara memainkannya. Main balik kod menimbulkan ralat.
Rujuk kepada pywave/pyaudio/pyglet dan kaedah lain yang disebut dalam
Kod adalah seperti berikut:
#!/usr/bin/env python
#import wave
import pyaudio
import pyglet
import urllib, urllib2, pycurl
import base64
import json
import cStringIO
import binascii
## get access token by api key & secret key
def get_token():
apiKey = "xxxxxxxxxx"
secretKey = "yyyyyyyyyyyyyyyyyyyyy"
auth_url = "" + apiKey + "&client_secret=" + secretKey;
res = urllib2.urlopen(auth_url)
json_data =
return json.loads(json_data)['access_token']
def dump_res(buf):
#print buf
## post audio to server
def use_cloud(token):
fp ='vad_0.wav', 'rb')
nf = fp.getnframes()
f_len = nf * 2
audio_data = fp.readframes(nf)
cuid = "xxxxxxxxxx" #my xiaomi phone MAC
srv_url = '' + '?cuid=' + cuid + '&token=' + token
http_header = [
'Content-Type: audio/pcm; rate=8000',
'Content-Length: %d' % f_len
c = pycurl.Curl()
c.setopt(pycurl.URL, str(srv_url)) #curl doesn't support unicode
#c.setopt(c.RETURNTRANSFER, 1)
c.setopt(c.HTTPHEADER, http_header) #must be list, not dict
c.setopt(c.POST, 1)
c.setopt(c.CONNECTTIMEOUT, 30)
c.setopt(c.TIMEOUT, 30)
c.setopt(c.WRITEFUNCTION, dump_res)
c.setopt(c.POSTFIELDS, audio_data)
c.setopt(c.POSTFIELDSIZE, f_len)
c.perform() #pycurl.perform() has no return val
def get_audio(token):
cuid = "00030DAF5784" # MAC address
text = "从前有座山,山上有个庙,庙里有个老和尚和小和尚,老和尚对小和尚说:"
#baidu_url = "" + urllib.urlencode(text) + "&lan=zh&cuid=" + cuid + "&ctp=1&tok=" + token
baidu_url = "" + urllib.quote(text) + "&lan=zh&cuid=" + cuid + "&ctp=1&tok=" + token
buf = cStringIO.StringIO()
c = pycurl.Curl()
c.setopt(c.URL, str(baidu_url)) #curl doesn't support unicode
#c.setopt(c.HTTPHEADER, http_header) #must be list, not dict
#c.setopt(c.GET, 1)
c.setopt(c.WRITEFUNCTION, buf.write)
c.setopt(c.CONNECTTIMEOUT, 30)
c.setopt(c.TIMEOUT, 30)
c.setopt(c.WRITEFUNCTION, dump_res)
c.perform() #pycurl.perform() has no return val
#print "type:\t{0}".format(c.CONTENT_TYPE)
#print buf.getvalue()
song =
if __name__ == "__main__":
token = get_token()
Ralat yang dilemparkan adalah seperti berikut:
Traceback (most recent call last):
File "C:\BOM_Planner\source\", line 87, in <module>
File "C:\BOM_Planner\source\", line 79, in get_audio
song =
File "C:\Python27\lib\site-packages\pyglet\media\", line 1429, in load
source = get_source_loader().load(filename, file)
File "C:\Python27\lib\site-packages\pyglet\media\", line 1410, in load
return riff.WaveSource(filename, file)
File "C:\Python27\lib\site-packages\pyglet\media\", line 185, in __init__
file = open(filename, 'rb')
TypeError: coercing to Unicode: need string or buffer, cStringIO.StringO found
Jika anda menulis Python3, pygame disyorkan Anda boleh menggunakan untuk memainkan fail mp3 tempatan.
Pada masa itu, saya juga banyak mencari tidak berjaya, jadi saya akhirnya menggunakan pygame untuk memainkannya.
Ini adalah contoh apa yang saya tulis. Anda boleh lihat. Saya menyimpan muzik dalam talian ke fail mp3 tempatan dan kemudian memainkannya. Terdapat maklumat yang berkaitan dalam readme.
Jika ia adalah persekitaran Linux, terdapat banyak penyelesaian Jika anda ingin mencapai platform silang, disyorkan untuk menggunakan pygame.