高效清理DataFrame 列字串
從DataFrame 列中的字串中刪除不需要的部分是資料清理中的常見任務。這可能需要刪除特定字元、前綴或後綴。
考慮具有以下資料結構的DataFrame:
Time | Result |
---|---|
09:00 | 52A |
10:00 | 62B |
11:00 | 44a |
12:00 | 30b |
13:00 | -110a |
我們的目標是從每個「結果」中提取數字部分' 字串,刪除' ' 和'-' 符號以及尾隨字符。所需的輸出應如下所示:
Time | Result |
---|---|
09:00 | 52 |
10:00 | 62 |
11:00 | 44 |
12:00 | 30 |
13:00 | 110 |
要實現此目的,我們可以利用 Python 的 lambda 函數。以下程式碼有效清理「結果」列資料:
data['Result'] = data['Result'].map(lambda x: x.lstrip('+-').rstrip('aAbBcC'))
此lambda 函數迭代「結果」列中的每個元素:
透過應用這些操作,我們獲得了所需的結果,並從「結果」列中的字串中刪除了不需要的部分。
以上是如何使用Python的Lambda函數有效率地清理DataFrame列字串?的詳細內容。更多資訊請關注PHP中文網其他相關文章!