Weibo と Tieba は両方とも PHP で構築された同時実行性の高い Web サイトであり、中国で最高の Web サイトの 1 つです。どのようにしてこの注目のランキングを作成したのでしょうか?
現在、中国語の単語セグメンテーション ライブラリを使用して、サイト コンテンツ全体の統計をセグメント化して収集したいと考えています。しかし、このような同時実行性の高い Web サイトでは、毎日何億ものデータが生成されます。単語セグメンテーションを使用して効率の問題を解決するにはどうすればよいでしょうか。 ?あるいは、他にどのようなテクニックを使用したのでしょうか?