用 python 给数据打标签,500 万条数据怎样提高效率?
ringa_lee
ringa_lee 2017-04-17 16:52:14
0
4
506
ringa_lee
ringa_lee

ringa_lee

全員に返信(4)
迷茫

では、本当にパンダをデータ読み取りツールとして使用しているのでしょうか?

あなたが言ったタグとして列 is_tobacco を追加しました

filter_query はこれらの単語を含むリストを返し、効率が向上しました

2 番目に、それを分割し、マルチプロセスを使用して実行できます。これにより、プロセスが大幅に高速化されます。

リーリー
いいねを押す +0
刘奇

正規表現を使用してみることができます:

リーリー
いいねを押す +0
左手右手慢动作

KMP アルゴリズム

いいねを押す +0
Peter_Zhu

KMP
Manacher
TireTree

いいねを押す +0
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート
私たちについて 免責事項 Sitemap
PHP中国語ウェブサイト:福祉オンライン PHP トレーニング,PHP 学習者の迅速な成長を支援します!