轉換。 html日誌與巢狀表到。 csv文件
P粉190883225
2023-08-01 11:12:35
<p>我試著轉換一個。 html文件,其中包含表格形式的日誌,它有嵌套的表。我正在將其轉換為。 csv文件。其中一列有錯誤報告,並在該列中作為新表。我想把整個表格轉換成純文字。試著在python中使用beautifulsoup來實現這一點,但還沒有運氣。嵌套表中的資料分散到父表的所有列中,而不固定在原始列中。有什麼我能做的嗎?<br /><br />使用python與beautifulsoup庫沒有給出所需的輸出</p><p><br /></ p>
將帶有巢狀表的HTML檔案轉換為CSV,同時保留結構可能有點困難。 BeautifulSoup是解析HTML的一個很好的函式庫,但它可能需要額外的操作才能正確處理巢狀表。
為了獲得所需的輸出,可以使用BeautifulSoup和一些自訂Python程式碼來解析HTML、提取資料並將其正確組織為CSV格式。這裡有一個循序漸進的方法來幫助你實現這個目標:
使用BeautifulSoup解析HTML檔。
下面是一段Python程式碼片段來幫助你入門:
This code assumes that your nested table data is comma-separated. If it's not, you may need to adjust the separator accordingly. Additionally, consider other delimiters if your sested table contains thatother delimiters#if your nested table contains that#. complex HTML structures may require further adjustments to this code, depending on the specifics of your data. Nonetheless, this should serve as a good starting point to tackle the task.