python下利用有利用css的font-family屬性來提取html字串的函式庫嗎?用來做字體子集化。
你問的問題有一點模糊,如果是使用CSS Selector取html內的內容,可以用lxml.cssselect,中文說明還有這有,且不只是用lxml
font-family只是指定使用的字體。
你想做的是對一篇HTML計算一共有多少個漢字,然後動態或半靜態產生只包含這些字的提及比較小的漢字字體遠端下載使用?
如果只是計算漢字,其實python下面的set是最簡單的。
但是要產生對應的字庫就是大坑了。目前方正有類似的服務,似乎叫雲端字庫,之前詢過價,對方老實表示問題還不少。
你問的問題有一點模糊,如果是使用CSS Selector取html內的內容,可以用lxml.cssselect,中文說明還有這有,且不只是用lxml
font-family只是指定使用的字體。
你想做的是對一篇HTML計算一共有多少個漢字,然後動態或半靜態產生只包含這些字的提及比較小的漢字字體遠端下載使用?
如果只是計算漢字,其實python下面的set是最簡單的。
但是要產生對應的字庫就是大坑了。目前方正有類似的服務,似乎叫雲端字庫,之前詢過價,對方老實表示問題還不少。