首页 数据库 mysql教程 Mongodb---记一次事故故障

Mongodb---记一次事故故障

Jun 07, 2016 pm 03:57 PM
事故 故障

2014.06.19.001---故障报告 事故发生时间 事故简述 事故责任方 是否解决 19:21-20:15 IIS服务器D盘即将溢出 是 一、事故描述 : 在19:21收到警报,显示IIS/Router服务器的D盘空间即将负荷。 二、事故处理过程: 1. 登录服务器查看后,发现router的日志很

2014.06.19.001---故障报告

事故发生时间

事故简述

事故责任方

是否解决

19:21-20:15

IIS服务器D盘即将溢出

 

事故发生时间
事故简述 事故责任方 是否解决
19:21-20:15 IIS服务器D盘即将溢出  

一、事故描述

在19:21收到警报,显示IIS/Router服务器的D盘空间即将负荷。

二、事故处理过程:

1. 登录服务器查看后,发现router的日志很大,有超过100G,导致无法打开, 决定,先重启router服务,删除日志。

2. 重启完毕router后,日志又出现了猛刷的情况,进入查看,显示

2014-06-19T20:08:25.170 0800[conn8956] end connection 10.4.1.101:7389(100 connections now open)

2014-06-19T20:08:25.170 0800[mongosMain] connection accepted from 10.4.1.101:7390#8957 (101 connections now open)

2014-06-19T20:08:25.170 0800[conn8957] authenticate db: minger { authenticate: 1, user: "client",nonce: "xxx", key: "xxx" }

2014-06-19T20:08:25.170 0800[conn8957] end connection 10.4.1.101:7390(100 connections now open)

2014-06-19T20:08:25.170 0800[mongosMain] connection accepted from 10.4.1.101:7391#8958 (101 connections now open)

2014-06-19T20:08:25.170 0800[conn8958] authenticate db: minger { authenticate: 1, user: "client",nonce: "xxx", key: "xxx" }

2014-06-19T20:08:25.170 0800[conn8958] end connection 10.4.1.101:7391(100 connections now open)

2014-06-19T20:08:25.170 0800[mongosMain] connection accepted from 10.4.1.101:7392#8959 (101 connections now open)

2014-06-19T20:08:25.170 0800[conn8959] authenticate db: minger { authenticate: 1, user: "client",nonce: "xxx", key: "xxx" }

2014-06-19T20:08:25.170 0800[conn8959] end connection 10.4.1.101:7392(100 connections now open)

2014-06-19T20:08:25.186 0800[mongosMain] connection accepted from 10.4.1.101:7393#8960 (101 connections now open)

2014-06-19T20:08:25.186 0800[conn8960] authenticate db: minger { authenticate: 1, user: "client",nonce: "xxx", key: "xxx" }

3. 这个问题在阿里也一度遇到过,是由于阿里云的物理机的设置导致tcp请求 上不去,而出现这种情况。

4. 将IIS的tcp pool关闭,mongodb的pool关闭。随机日志不再狂刷。

三、分析原因

Mongodb 驱动程序采用的连接池的方式连接到数据库,目前从观察到的情况是应用一开启便根据变量的设置,建立全部连接,然后提供给程序使用,并且一旦其中某个连接到数据库的访问失败,则会清空整个连接池到这台数据库的连接,并重新建立连接。
而mongodb对中断连接的垃圾清理工作则是懒惰的被动清理方式,如果驱动程序端配 置的连接数过大,一旦发生重连,则会导致mongo端堆积大量的垃圾连接数据,导致主机资源耗尽。 

windows服务器,timewaitdelay 最小值是30秒,而mongodb pool size 设为2000 

也就是说,如果2000个连接里有一个因为网络关系断开了,就要重新建立新的2000个连接,之前的2000个因为timewaitdelay的原因,暂时还不能释放,如果在30秒内,因为网络原因,重复建立连,接导致将60000个端口都用尽了。就会报错

但是既然耗尽了,为什么日志中显示一直有100个连接保持着呢?

对此,老大给出了一条很重要的信息,C#中,关于连接池的代码中,设定最小值为100。对此我做出的猜想是,是否这100个链接用的是系统的1024个端口中的100个?导致timewaitdelay不会涉及到这100个链接呢?尚待考证。

四、改进措施

1. 调整
MaxUserPort = 65534
MaxHashTableSize = 65536
MaxFreeTcbs = 16000
TcpNumConnections = 16777214

2. 将minpoolsize设为200,进行观察。

2014年06月20号

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

修复:Microsoft Teams 错误代码 80090016 您的计算机的受信任平台模块出现故障 修复:Microsoft Teams 错误代码 80090016 您的计算机的受信任平台模块出现故障 Apr 19, 2023 pm 09:28 PM

MSTeams是与队友和同事交流、聊天或通话的值得信赖的平台。MSTeams上的错误代码为80090016以及您的计算机的受信任的平台模块出现故障的消息可能会导致登录困难。在错误代码得到解决之前,该应用将不允许您登录。如果您在打开MS团队或任何其他Microsoft应用程序时遇到此类消息,那么本文可以指导您解决问题。

发生0x0000004e错误代表了什么问题 发生0x0000004e错误代表了什么问题 Feb 18, 2024 pm 01:54 PM

0x0000004e是什么故障在计算机系统中,故障是一个常见的问题。当计算机遇到故障时,系统通常会因为无法正常运行而出现停机、崩溃或者出现错误提示。而在Windows系统中,有一个特定的故障代码0x0000004e,这是一个蓝屏错误代码,表示系统遇到了一个严重的错误。0x0000004e蓝屏错误是由于系统内核或驱动程序问题导致的。这种错误通常会导致计算机系统

黑鲨手机无法开机怎么办?教你自救方法! 黑鲨手机无法开机怎么办?教你自救方法! Mar 23, 2024 pm 04:06 PM

黑鲨手机无法开机怎么办?教你自救方法!在我们日常生活中,手机已经成为我们不可或缺的一部分。而对于很多人来说,黑鲨手机是一款备受喜爱的游戏手机。但是难免会遇到各种问题,其中之一就是手机无法开机。当你遇到这样的情况时,不要慌张,下面将为你介绍一些解决方法,希望能帮助到你。首先,当黑鲨手机无法开机时,首先要检查手机是否有足够的电量。可能是由于电量耗尽导致无法开机,

黑鲨手机充电故障排查与解决 黑鲨手机充电故障排查与解决 Mar 22, 2024 pm 09:03 PM

黑鲨手机是一款以性能强悍、游戏体验出色而著称的智能手机品牌,备受广大游戏玩家和科技爱好者的喜爱。然而,就像其他智能手机一样,黑鲨手机也会出现各种问题,其中充电故障是比较常见的一种。充电故障不仅会影响手机的正常使用,还可能引发更严重的问题,因此及时解决充电问题十分重要。本文将从常见的黑鲨手机充电故障原因入手,介绍排查和解决充电问题的方法,希望能帮助读者解决黑鲨

如何解决0x00000001蓝屏错误 如何解决0x00000001蓝屏错误 Feb 19, 2024 pm 11:12 PM

0x00000001蓝屏怎么办蓝屏问题是许多电脑用户经常遇到的一个令人头疼的问题。当我们的电脑遇到蓝屏时,它会突然停止运行,并显示一个带有错误代码的蓝屏界面。其中,0x00000001是一种常见的蓝屏错误代码。蓝屏问题可能由多种原因引起,包括软件错误、硬件故障、驱动程序问题等。尽管这个问题可能令人沮丧,但我们可以采取一些措施来解决它。下面我将介绍一些解决蓝屏

win10共享打印机0x0000011b故障该怎么办win10共享打印机0x0000011b故障解决方案 win10共享打印机0x0000011b故障该怎么办win10共享打印机0x0000011b故障解决方案 Jul 18, 2023 am 08:33 AM

共享打印机的客户们在升级了2021年9月的补丁后发觉自己的win10计算机没法与共享打印机开展联接,那么碰到了win10共享打印机0x0000011b故障怎么办呢,这个问题是较为多客户碰到的状况,下边就给各位给予win10共享打印机0x0000011b故障解决方案的具体内容,方式非常简单,客户们一看就可以学好。 win10共享打印机0x0000011b故障该怎么办1、开启操作面板,进到程序流程和作用,查询已组装升级;2、卸载下列补丁:KB5005569/KB5005573/KB5005568/KB

显卡风扇停转的原因及解决办法 显卡风扇停转的原因及解决办法 Dec 26, 2023 pm 05:49 PM

很多小伙伴刚买了新的显卡,装上了才没几天,风扇突然就不转了,这是什么原因呢?这是正常的吗?这肯定是问题的,你可以查看机箱内的显卡,内存和硬盘线连接好没有供电是否正常,有没电压不稳的情况,具体的原因下面跟小编一起来看看吧,显卡风扇不转的原因解答1.供电不足这是导致风扇不转最普遍的原因之一,当你的电源所提供的能量达不到显卡的要求之时,为了保持电脑程序的正常运转,绝大部分显卡会将自己的散热风扇停掉,以保证GPU核心能够继续进行运算,遇到这种情况的时候就不要怪罪人家显卡不给力了啦!明明已经很贴心了好不好

插入充电器时鼠标会跳跃[修复] 插入充电器时鼠标会跳跃[修复] Feb 19, 2024 pm 10:33 PM

如果您在插入充电器时发现鼠标光标出现跳动问题,本文提供的解决方法可能会对您有所帮助。有报道称,在连接充电器到笔记本电脑时,鼠标光标可能会表现得不稳定,跳跃、选择和意外点击。电源问题通常是导致这种情况的最常见原因之一。为什么我的鼠标在充电时会出问题?笔记本电脑鼠标故障可能源于多个原因,如电池、充电器、充电器砖等故障。另外,墙上插座的接线问题也是常见原因。插入充电器后,鼠标会跳跃如果您的鼠标在插入充电器时跳动,请使用以下建议。执行硬重置试试另一个充电器运行电池测试更新或重新安装所需的驱动程序将充电器

See all articles