python下利用有利用css的font-family属性来提取html字符串的库吗?用来做字体子集化。
你问的问题有一点模糊,若是使用CSS Selector取html内的内容,可以用lxml.cssselect,中文说明还有这有,且不只是用lxml
font-family只是指定使用的字体。
你想做的是对一篇HTML计算一共有多少个汉字,然后动态或者半静态生成只包含这些字的提及比较小的汉字字体远程下载使用?
如果只是计算汉字,其实python下面的set是最简单的。
但是要生成对应的字库就是大坑了。目前方正有类似的服务,似乎叫云字库,之前询过价,对方老实表示问题还不少。
你问的问题有一点模糊,若是使用CSS Selector取html内的内容,可以用lxml.cssselect,中文说明还有这有,且不只是用lxml
font-family只是指定使用的字体。
你想做的是对一篇HTML计算一共有多少个汉字,然后动态或者半静态生成只包含这些字的提及比较小的汉字字体远程下载使用?
如果只是计算汉字,其实python下面的set是最简单的。
但是要生成对应的字库就是大坑了。目前方正有类似的服务,似乎叫云字库,之前询过价,对方老实表示问题还不少。