Cassandra 数据模型（基于CQL,解决胖列数量限制及灵活性问题）-mysql教程-PHP中文網

首頁

資料庫

mysql教程

Cassandra 数据模型（基于CQL,解决胖列数量限制及灵活性问题）

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 07, 2016 pm 05:38 PM

cassandra 基於數據數量模型解決限制

Cassandra 数据模型（基于CQL,解决胖列数量限制及灵活性问题）（1.1及以上版本）文中主要交代Cassandra的编程模型及数据结构。由于Cassandra版本数次更新，网上中文的资料已经有点过时，比较有代表性的比如ebuy那篇文章都已经过时了，于是自己找资料，结合

Cassandra 数据模型（基于CQL,解决胖列数量限制及灵活性问题）（1.1及以上版本）

文中主要交代Cassandra的编程模型及数据结构。由于Cassandra版本数次更新，网上中文的资料已经有点过时，比较有代表性的比如ebuy那篇文章都已经过时了，于是自己找资料，结合官方博客写一篇Cassandra模型的文章。一些名词的介绍：由于技术名词冲突，BigTable里的表对应的是Cassandra里的列族，而BigTable里面列族的概念更类似Cassandra早期实现里的超级列（该功能在Cassandra里已被关闭）。 Cassandra介绍首先介绍一下Cassandra。 Cassandra是Apache的开源项目，是NoSQL的一种，广泛意义上的列族数据库，分布式，无中心机。其早期实现主要参考了Google的Big Table论文及亚马逊的Dynamo论文中的介绍，可以参考两篇论文来获得Cassandra的设计思想，关于更详细的资料，可以参见wiki及官方文档。早期实现及最佳实践前文提到早期实现，那么现在当然与早期区别已经极大了，从数据模型设计到实际使用，基本上已经自成体系了。其中之一最大的改变，就是1.1版本里对数据库操作的改变。 Cassandra的早期实现里，使用的完全是BigTable的数据模型，即列及列族及主键等概念。在ebuy的最佳实践的文中，对该模型的使用做了详细解释，我无意在此引用他人文章，只是简单说一下概念。最佳实践文章总共分两部分，上部分主要说的是列族数据库中该如何设计数据模型，其中主要讨论的是对关系及部分相关数据的重复储存来减少对数据库的分布式读取，其中对列族数据库数据结构的有个挺有意思的式子，如下： Map> 下部分交代的则是Cassandra中的具体实现方式，比如当时Cassandra实现了一个与BigTable列族类似的东西，或者说只是名字不同的东西，就是超级列，把类似的列聚合在一起提取。

NewImage

再比如说推荐使用胖列（使用列键查询）而不是瘦列（使用主键查询）。胖列指的是以大量的列储存关系，比如用户表users有三列user_k,p1,p2，第一列user_k是主键，第二列p1是用户购买的产品1，第三列p2是用户购买的产品2，pn可以扩展到极大的数量. 注：上文只是简单解释，实际全文中对各种应用场景的讨论不仅限于该范围。磁盘储存方式 Cassandra使用的方式是：把一级主键当做分区主键，列名作为列键储存。光说不清楚，上图：（图片来自Cassandra 1.1） CREATE TABLE timeline ( user_id varchar, tweet_id uuid, author varchar, body varchar, PRIMARY KEY (user_id, tweet_id) );

NewImage

上图是传统数据库的储存方式。

NewImage

上图是Cassandra的储存方式，注意{1787，author}是列键名而不只是数据。现在的实现随着Cassandra的成长，原先完全按照BigTable实现的数据模型开始产生一些问题，其中之一就是无法无限扩大的列的数量，虽然已经设计了一个足够大的列数量，但对于大数据分布式数据库，仍然是不够用的，，而且超级列的方式灵活性受限制，于是开发者开始走自己的道路，于是随着CQL（Cassandra自己的类似SQL的操作语言）的发布及发展，首先清除了超级列（BigTable里的列族）的概念：在CQL中，没有超级列的概念，在列上一级就是表，也就是原先概念上的超级列是不存在的，那针对原先的胖列的应用场景，该如何处理呢？ CQL中有主键及二级主键的概念，主键就是原先的主键，这个概念没有变化，而对于原先的超级列聚合，CQL通过把二级主键的值加上列名作为列键名解决了这个问题。也就是说，把原先由数据字典（请允许我使用这个关系数据库词汇）储存的数据储存到了数据表中，减轻了对数据字典的访问及数据字典数据结构的维持开销，把压力下发到数据表。参考： Schema in Cassandra 1.1 Cassandra Wiki Cassandra Data Modeling Best Practices, Part 1 Cassandra Data Modeling Best Practices, Part 2

posted on

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

Video Face Swap

使用我們完全免費的人工智慧換臉工具，輕鬆在任何影片中換臉！

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學

1664

CakePHP 教程

1423

Laravel 教程

1321

PHP教程

1269

C# 教程

1249

Related knowledge

全球最強開源 MoE 模型來了，中文能力比肩 GPT-4，價格僅 GPT-4-Turbo 的近百分之一 May 07, 2024 pm 04:13 PM

想像一下，一個人工智慧模型，不僅擁有超越傳統運算的能力，還能以更低的成本實現更有效率的效能。這不是科幻，DeepSeek-V2[1]，全球最強開源MoE模型來了。 DeepSeek-V2是一個強大的專家混合（MoE）語言模型，具有訓練經濟、推理高效的特點。它由236B個參數組成，其中21B個參數用於啟動每個標記。與DeepSeek67B相比，DeepSeek-V2效能更強，同時節省了42.5%的訓練成本，減少了93.3%的KV緩存，最大生成吞吐量提高到5.76倍。 DeepSeek是一家探索通用人工智

替代MLP的KAN，被開源專案擴展到卷積了 Jun 01, 2024 pm 10:03 PM

本月初，來自MIT等機構的研究者提出了一種非常有潛力的MLP替代方法—KAN。 KAN在準確性和可解釋性方面表現優於MLP。而且它能以非常少的參數量勝過以更大參數量運行的MLP。例如，作者表示，他們用KAN以更小的網路和更高的自動化程度重現了DeepMind的結果。具體來說，DeepMind的MLP有大約300,000個參數，而KAN只有約200個參數。 KAN與MLP一樣具有強大的數學基礎，MLP基於通用逼近定理，而KAN基於Kolmogorov-Arnold表示定理。如下圖所示，KAN在邊上具

你好，電動Atlas！波士頓動力機器人復活，180度詭異動作嚇到馬斯克 Apr 18, 2024 pm 07:58 PM

波士頓動力Atlas，正式進入電動機器人時代！昨天，液壓Atlas剛「含淚」退出歷史舞台，今天波士頓動力就宣布：電動Atlas上崗。看來，在商用人形機器人領域，波士頓動力是下定決心要跟特斯拉硬剛一把了。新影片放出後，短短十幾小時內，就已經有一百多萬觀看。舊人離去，新角色登場，這是歷史的必然。毫無疑問，今年是人形機器人的爆發年。網友銳評：機器人的進步，讓今年看起來像人類的開幕式動作、自由度遠超人類，但這真不是恐怖片？影片一開始，Atlas平靜地躺在地上，看起來應該是仰面朝天。接下來，讓人驚掉下巴

iPhone上的蜂窩數據網路速度慢：修復 May 03, 2024 pm 09:01 PM

在iPhone上面臨滯後，緩慢的行動數據連線？通常，手機上蜂窩互聯網的強度取決於幾個因素，例如區域、蜂窩網絡類型、漫遊類型等。您可以採取一些措施來獲得更快、更可靠的蜂窩網路連線。修復1–強制重啟iPhone有時，強制重啟設備只會重置許多內容，包括蜂窩網路連線。步驟1–只需按一次音量調高鍵並放開即可。接下來，按降低音量鍵並再次釋放它。步驟2–過程的下一部分是按住右側的按鈕。讓iPhone完成重啟。啟用蜂窩數據並檢查網路速度。再次檢查修復2–更改資料模式雖然5G提供了更好的網路速度，但在訊號較弱

特斯拉機器人進廠打工，馬斯克：手的自由度今年將達到22個！ May 06, 2024 pm 04:13 PM

特斯拉機器人Optimus最新影片出爐，已經可以在工廠裡打工了。正常速度下，它分揀電池（特斯拉的4680電池）是這樣的：官方還放出了20倍速下的樣子——在小小的「工位」上，揀啊揀啊揀：這次放出的影片亮點之一在於Optimus在廠子裡完成這項工作，是完全自主的，全程沒有人為的干預。而且在Optimus的視角之下，它還可以把放歪了的電池重新撿起來放置，主打一個自動糾錯：對於Optimus的手，英偉達科學家JimFan給出了高度的評價：Optimus的手是全球五指機器人裡最靈巧的之一。它的手不僅有觸覺

FisheyeDetNet：首個以魚眼相機為基礎的目標偵測演算法 Apr 26, 2024 am 11:37 AM

目標偵測在自動駕駛系統當中是一個比較成熟的問題，其中行人偵測是最早得以部署演算法之一。在多數論文當中已經進行了非常全面的研究。然而，利用魚眼相機進行環視的距離感知相對來說研究較少。由於徑向畸變大，標準的邊界框表示在魚眼相機當中很難實施。為了緩解上述描述，我們探索了擴展邊界框、橢圓、通用多邊形設計為極座標/角度表示，並定義一個實例分割mIOU度量來分析這些表示。所提出的具有多邊形形狀的模型fisheyeDetNet優於其他模型，並同時在用於自動駕駛的Valeo魚眼相機資料集上實現了49.5%的mAP

$牛津大學最新！ Mickey：3D中的2D影像匹配SOTA！ (CVPR\'24)$ 牛津大學最新！ Mickey：3D中的2D影像匹配SOTA！ (CVPR\'24) Apr 23, 2024 pm 01:20 PM

寫在前面項目連結：https://nianticlabs.github.io/mickey/給定兩張圖片，可以透過建立圖片之間的對應關係來估計它們之間的相機姿態。通常，這些對應關係是二維到二維的，而我們估計的姿態在尺度上是不確定的。一些應用，例如隨時隨地實現即時增強現實，需要尺度度量的姿態估計，因此它們依賴外部的深度估計器來恢復尺度。本文提出了MicKey，這是一個關鍵點匹配流程，能夠夠預測三維相機空間中的度量對應關係。透過學習跨影像的三維座標匹配，我們能夠在沒有深度測試的情況下推斷度量相對

超級智能體生命力覺醒！可自我更新的AI來了，媽媽再也不用擔心資料瓶頸難題 Apr 29, 2024 pm 06:55 PM

哭死啊，全球狂煉大模型，一網路的資料不夠用，根本不夠用。訓練模型搞得跟《飢餓遊戲》似的，全球AI研究者，都在苦惱怎麼才能餵飽這群資料大胃王。尤其在多模態任務中，這問題尤其突出。一籌莫展之際，來自人大系的初創團隊，用自家的新模型，率先在國內把「模型生成數據自己餵自己」變成了現實。而且還是理解側和生成側雙管齊下，兩側都能產生高品質、多模態的新數據，對模型本身進行數據反哺。模型是啥？中關村論壇上剛露面的多模態大模型Awaker1.0。團隊是誰？智子引擎。由人大高瓴人工智慧學院博士生高一鑷創立，高

See all articles

Cassandra 数据模型 （基于CQL,解决胖列数量限制及灵活性问题）

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題

Cassandra 数据模型（基于CQL,解决胖列数量限制及灵活性问题）