首頁 資料庫 mysql教程 用Twitter的cursor方式进行Web数据分页_MySQL

用Twitter的cursor方式进行Web数据分页_MySQL

Jun 01, 2016 pm 01:49 PM
count cursor twitter 科技

bitsCN.com

  本文讨论Web应用中实现数据分页功能,不同的技术实现方式的性能方区别。

/

  上图功能的技术实现方法拿MySQL来举例就是

  select * from msgs where thread_id = ? limit page * count, count

  不过在看Twitter API的时候,我们却发现不少接口使用cursor的方法,而不用page, count这样直观的形式,如 followers ids 接口

 

  URL:

  http://twitter.com/followers/ids.format

  Returns an array of numeric IDs for every user following the specified user.

  Parameters:

  * cursor. Required. Breaks the results into pages. Provide a value of -1 to begin paging. Provide values as returned to in the response body’s next_cursor and previous_cursor attributes to page back and forth in the list.

  o Example: http://twitter.com/followers/ids/barackobama.xml?cursor=-1

  o Example: http://twitter.com/followers/ids/barackobama.xml?cursor=-1300794057949944903

 

  从上面描述可以看到,http://twitter.com/followers/ids.xml 这个调用需要传cursor参数来进行分页,而不是传统的 url?page=n&count=n的形式。这样做有什么优点呢?是否让每个cursor保持一个当时数据集的镜像?防止由于结果集实时改变而产生查询结果有重复内容?

  在Google Groups这篇Cursor Expiration讨论中Twitter的架构师John Kalucki提到

 

  A cursor is an opaque deletion-tolerant index into a Btree keyed by source

  userid and modification time. It brings you to a point in time in the

  reverse chron sorted list. So, since you can’t change the past, other than

  erasing it, it’s effectively stable. (Modifications bubble to the top.) But

  you have to deal with additions at the list head and also block shrinkage

  due to deletions, so your blocks begin to overlap quite a bit as the data

  ages. (If you cache cursors and read much later, you’ll see the first few

  rows of cursor[n+1]’s block as duplicates of the last rows of cursor[n]’s

  block. The intersection cardinality is equal to the number of deletions in

  cursor[n]’s block). Still, there may be value in caching these cursors and

  then heuristically rebalancing them when the overlap proportion crosses some

  threshold.

 

  在另外一篇new cursor-based pagination not multithread-friendly中John又提到

 

  The page based approach does not scale with large sets. We can no

  longer support this kind of API without throwing a painful number of

  503s.

  Working with row-counts forces the data store to recount rows in an O

  (n^2) manner. Cursors avoid this issue by allowing practically

  constant time access to the next block. The cost becomes O(n/

  block_size) which, yes, is O(n), but a graceful one given n

  a block_size of 5000. The cursor approach provides a more complete and

  consistent result set.

  Proportionally, very few users require multiple page fetches with a

  page size of 5,000.

  Also, scraping the social graph repeatedly at high speed is could

  often be considered a low-value, borderline abusive use of the social

  graph API.

 

  通过这两段文字我们已经很清楚了,对于大结果集的数据,使用cursor方式的目的主要是为了极大地提高性能。还是拿MySQL为例说明,比如翻页到100,000条时,不用cursor,对应的SQL为

  select * from msgs limit 100000, 100

  在一个百万记录的表上,第一次执行这条SQL需要5秒以上。

  假定我们使用表的主键的值作为cursor_id, 使用cursor分页方式对应的SQL可以优化为

  select * from msgs where id > cursor_id limit 100;

  同样的表中,通常只需要100ms以下, 效率会提高几十倍。MySQL limit性能差别也可参看我3年前写的一篇不成熟的文章 MySQL LIMIT 的性能问题。

  结论

  建议Web应用中大数据集翻页可以采用这种cursor方式,不过此方法缺点是翻页时必须连续,不能跳页。

bitsCN.com
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
4 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

Stable Diffusion 3論文終於發布,架構細節大揭秘,對復現Sora有幫助? Stable Diffusion 3論文終於發布,架構細節大揭秘,對復現Sora有幫助? Mar 06, 2024 pm 05:34 PM

StableDiffusion3的论文终于来了!这个模型于两周前发布,采用了与Sora相同的DiT(DiffusionTransformer)架构,一经发布就引起了不小的轰动。与之前版本相比,StableDiffusion3生成的图质量有了显著提升,现在支持多主题提示,并且文字书写效果也得到了改善,不再出现乱码情况。StabilityAI指出,StableDiffusion3是一个系列模型,其参数量从800M到8B不等。这一参数范围意味着该模型可以在许多便携设备上直接运行,从而显著降低了使用AI

自動駕駛與軌跡預測看這篇就夠了! 自動駕駛與軌跡預測看這篇就夠了! Feb 28, 2024 pm 07:20 PM

軌跡預測在自動駕駛中承擔著重要的角色,自動駕駛軌跡預測是指透過分析車輛行駛過程中的各種數據,預測車輛未來的行駛軌跡。作為自動駕駛的核心模組,軌跡預測的品質對於下游的規劃控制至關重要。軌跡預測任務技術堆疊豐富,需熟悉自動駕駛動/靜態感知、高精地圖、車道線、神經網路架構(CNN&GNN&Transformer)技能等,入門難度很高!許多粉絲期望能夠盡快上手軌跡預測,少踩坑,今天就為大家盤點下軌跡預測常見的一些問題和入門學習方法!入門相關知識1.預習的論文有沒有切入順序? A:先看survey,p

DualBEV:大幅超越BEVFormer、BEVDet4D,開卷! DualBEV:大幅超越BEVFormer、BEVDet4D,開卷! Mar 21, 2024 pm 05:21 PM

這篇論文探討了在自動駕駛中,從不同視角(如透視圖和鳥瞰圖)準確檢測物體的問題,特別是如何有效地從透視圖(PV)到鳥瞰圖(BEV)空間轉換特徵,這一轉換是透過視覺轉換(VT)模組實施的。現有的方法大致分為兩種策略:2D到3D和3D到2D轉換。 2D到3D的方法透過預測深度機率來提升密集的2D特徵,但深度預測的固有不確定性,尤其是在遠處區域,可能會引入不準確性。而3D到2D的方法通常使用3D查詢來採樣2D特徵,並透過Transformer學習3D和2D特徵之間對應關係的注意力權重,這增加了計算和部署的

區塊鏈資料分析工具有哪些? 區塊鏈資料分析工具有哪些? Feb 21, 2025 pm 10:24 PM

區塊鏈技術的迅速發展帶來了對可靠且高效的分析工具的需求。這些工具對於從區塊鏈交易中提取有價值的見解至關重要,以便更好地理解和利用其潛力。本文將探討市場上一些領先的區塊鏈數據分析工具,包括他們的功能、優勢和局限性。通過了解這些工具,用戶可以獲得必要的見解,最大限度地利用區塊鏈技術的可能性。

綜述!深度模型融合(LLM/基礎模型/聯邦學習/微調等) 綜述!深度模型融合(LLM/基礎模型/聯邦學習/微調等) Apr 18, 2024 pm 09:43 PM

23年9月國防科大、京東和北理工的論文「DeepModelFusion:ASurvey」。深度模型整合/合併是一種新興技術,它將多個深度學習模型的參數或預測合併為一個模型。它結合了不同模型的能力來彌補單一模型的偏差和錯誤,以獲得更好的性能。而大規模深度學習模型(例如LLM和基礎模型)上的深度模型整合面臨一些挑戰,包括高運算成本、高維度參數空間、不同異質模型之間的干擾等。本文將現有的深度模型融合方法分為四類:(1)“模式連接”,透過一條損失減少的路徑將權重空間中的解連接起來,以獲得更好的模型融合初

不只3D高斯!最新綜述一覽最先進的3D重建技術 不只3D高斯!最新綜述一覽最先進的3D重建技術 Jun 02, 2024 pm 06:57 PM

寫在前面&筆者的個人理解基於圖像的3D重建是一項具有挑戰性的任務,涉及從一組輸入圖像推斷目標或場景的3D形狀。基於學習的方法因其直接估計3D形狀的能力而受到關注。這篇綜述論文的重點是最先進的3D重建技術,包括產生新穎的、看不見的視野。概述了高斯飛濺方法的最新發展,包括輸入類型、模型結構、輸出表示和訓練策略。也討論了尚未解決的挑戰和未來的方向。鑑於該領域的快速進展以及增強3D重建方法的眾多機會,對演算法進行全面檢查似乎至關重要。因此,本研究對高斯散射的最新進展進行了全面的概述。 (大拇指往上滑

革命性GPT-4o:重塑人機互動體驗 革命性GPT-4o:重塑人機互動體驗 Jun 07, 2024 pm 09:02 PM

OpenAI發布的GPT-4o模型無疑是一個巨大的突破,特別是在其能夠處理多種輸入媒介(文字、音訊、圖片)並產生相應輸出方面。這種能力使得人機互動更加自然直觀,大大提升了AI的實用性和可用性。 GPT-4o的幾個關鍵亮點包括:高度可擴展性、多媒體輸入輸出、自然語言理解能力的進一步提升等等。 1.跨媒介輸入/輸出:GPT-4o+能夠接受文字、音訊和圖片的任意組合作為輸入,並直接產生這些媒介的輸出。這打破了傳統AI模型僅處理單一輸入類型的限制,使得人機互動更加靈活和多樣化。這項創新有助於推動智能助手

Golang與前端技術結合:探討Golang如何在前端領域發揮作用 Golang與前端技術結合:探討Golang如何在前端領域發揮作用 Mar 19, 2024 pm 06:15 PM

Golang與前端技術結合:探討Golang如何在前端領域發揮作用,需要具體程式碼範例隨著互聯網和行動應用的快速發展,前端技術也愈發重要。而在這個領域中,Golang作為一門強大的後端程式語言,也可以發揮重要作用。本文將探討Golang如何與前端技術結合,以及透過具體的程式碼範例來展示其在前端領域的潛力。 Golang在前端領域的角色作為一門高效、簡潔且易於學習的

See all articles