一、前言 关于数据落地方面,HBase官网也有相关介绍。本文主要介绍一下实际工作中涉及的数据存储方面的一些经验和技巧,主要涉及表rowkey设计、数据落地方案 二、表设计 相对于MySQL等关系型数据库而...
Docker是什么? Docker是一个虚拟环境容器,可以将你的开发环境、代码、配置文件等一并打包到这个容器中,并发布和应用到任意平台中。比如,你在本地用Python开发网站后台,开发测试完成后,就可以将Python3及其依赖包...
在连续两年里为每一个项目都配备一个docker后,我变得越来越不喜欢使用docker了。 不过值得肯定的是,在写完dockerfile和docker-composer之后,一行代码直接部署的痛快感,真的会让人身心愉悦。 ...
本篇文章属于进阶知识,可能会用到以前出现在专栏文章中的知识,如果你是第一次关注本专栏,建议你先阅读下其他文章:查询--爬虫(计算机网络) 现在搞爬虫的人,可能被问的最多的问题就是“你会不会分布式爬虫?”。给人的感觉就是你不会分布...
Redis是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。同时redis也是一个key-value存储系统。Redis,更 是一个高性能的key-value数据...
本文从产业技术发展的角度论述了容器目前存在的问题和为什么它是技术的未来。Docker目前虽然从技术上来讲还不成熟,但是它从真正意义上解决了过去若干年在软件行业存在的诸多问题。文章鼓励大家去尝试容器这个新的技术,在实践中获得经验和教训进而迭代...
信息化,一个不可逆转的潮流,潮流之下,发展是一个亘古不变的话题。 IT界同样如此,半年一浪,三载一潮,技术的迭代之快令人咂舌。5年前的Hadoop,3年前的OpenStack,到如今之Docker,无一不是一浪高过一浪。说到发展...
本文中,我们将向你介绍这种技术是什么,以及它对企业的作用。问题1:它是什么?Docker既是一个开源项目的名称,也是一家专注于Linux容器(Container)的初创公司的名称。容器是指在一台主机上运行多个应用程序,这类似于计算虚拟化,但...
Stefan Thies是Sematext的DevOps布道师,在最近的一篇博客文章中,他讨论了十个重要的容器监控指标及其在Docker容器运维中的意义,尤其是针对单个主机上运行多个容器的场景。我们可以将它们集中到一个相互关联的视图中,这些...
“很多时候,我们面临未来的预测和期望,其实很多答案已经存在在历史中。” “没有集装箱,就不会有全球化。”,《经济学家》这个评论可以说是对于这个普通的箱子的历史性地位的一个总结。 这只普通的箱子,技术含量...
搜索功能是App必不可少的一部分,我们使用目前比较流行的Elasticsearch进行全文检索。我们的数据主要存储在MongoDB中,如何将这些数据导入到Elasticsearch中,并能一直保持同步呢?做法大致分为两种:在应用层操作,在读...
### 概要 本篇我们介绍一下部分搜索的几种玩法,我们经常使用的浏览器搜索框,输入时会弹出下拉提示,也是基于局部搜索原理实现的。 ### 前缀搜索 我们在前面了解...
1 海量数据分析 海量数据分析类系统的设计主要面临2个大问题: 1 海量数据如何存储?a 借助于于Hadoop生态体系中的存储系统或者其他存储系统来存储海量数据,自身提供对上述数据的分布式查询分析功能,如Impala...
前言 Elasticsearch是一个很火的分布式搜索系统,提供了非常强大而且易用的查询和分析能力,包括全文索引、模糊查询、多条件组合查询、地理位置查询等等,而且具有一定的分析聚合能力。因为其查询场景非常丰富,所以如果泛泛的分析...
前言 前两周写过一篇《基于Lucene查询原理分析Elasticsearch的性能》,在最后留了一个彩蛋,说下一篇会介绍一种可以极大的优化查询性能的技术。本文就来介绍这种技术——IndexSorting。 因为Ind...