关键要点
本文是与SiteGround合作创建的系列文章的一部分。感谢您支持使SitePoint成为可能的合作伙伴。
当业务经理、团队领导和其他人员规划业务连续性时,他们就成为了具有前瞻性的思考者。制定计划是为了确保业务在各种压力情况下(自然灾害、人员伤亡、恶意行为等等)能够持续运营。企业会为网站、建筑物、人力资源、金融交易、资产搬迁、设备更换等等制定灾难计划——任何事情都会被考虑在内。
在考虑网站的灾难计划时,您必须考虑很多这些因素,但您还必须考虑诸如黑客攻击、用户错误和依赖性故障等因素(想要学习如何更好地管理依赖关系?请查看SitePoint Premium上的“依赖关系管理”课程)。
这些业务连续性和灾难计划的关键要素通常是流程。这些流程详细说明了公司所有员工(无论只有一个员工、几十个还是几千个)在这种情况下将采取的步骤,以确保业务能够尽可能正常地运行。如果企业无法渡过这些难关,那么当危机结束后,他们可能就无公司可回了。
对于网站和 Web 应用程序的维护人员来说,灾难计划至关重要,但却常常被忽视,原因与整体业务连续性计划被忽视的原因相同——它们只有在发生不好的事情时才有用,而在正常的日常运营中,它们似乎是一种浪费。
网站灾难计划
在考虑您维护的网站的灾难规划时,您(或您的团队)首先应该问自己的问题是:
您的网站或 Web 应用程序可以停机多长时间?
您可以在没有客户访问、互动和购买东西的情况下持续多久?您的网站停机一分钟或一小时会损失多少钱,或者可能会损失多少潜在客户?您是否与客户签订了服务级别协议,如果是,他们是否保证一定的正常运行时间百分比?您什么时候会达到这个限制?
对于您的业务来说,有些灾难是史诗般的、地区性的甚至全球性的,而另一些灾难甚至可能不会成为当地新闻。以下是一些可能需要规划和深思熟虑的情况示例:
在您集思广益上述场景以及您可以想到的其他场景之后,您可能还想召集来自各个团队(如果您有的话)的关键人员,并进行一些思维练习。将自己置身于这种情况中。如果发生 X,然后发生 Y,我们将怎么做?集思广益。您可能会发现计划中存在更多缺陷,以及需要新流程的想法。
备份是一个关键的考虑因素。不仅是数据备份,例如文件、数据库、媒体等,还有凭据备份(它们是否存储在单个用户的记忆之外?)。服务是另一个考虑因素。您是否有备用 CDN、邮件服务、用于各种目的的 NPM 包?他们有实施计划吗?任何付费软件或服务的许可证?
最好在启动网站之前就考虑网站的备份策略。检查您的托管公司的备份策略。有些公司会提供额外的备份解决方案以及他们的托管服务。我们的托管合作伙伴 SiteGround 提供了一个强大的内部工具,用于进行日常备份和快速数据恢复。
制定流程并共享它们也是灾难规划的关键特征。为从备份中恢复数据、针对中断进行故障排除以及其他类似情况制定流程当然很重要,但记录这些流程并与相关人员共享是战斗的另一半。快速有效地完成故障排除或灾难响应流程,可能意味着企业能否生存以及在道路上出现轻微的公共关系问题之间的区别。
需要参与的非IT人员应该了解情况和计划。例如,人力资源部门可能需要参与招聘关键替代人员,或者顾问可能需要介入以在公司进行更换时提供协助。会计部门可能需要了解为恢复目的而支付的服务等等。
结论
最重要的是,您和您的同事制定一个灾难计划,理解它并保持最新。您应该利用您的主机提供的工具。SitePoint 的托管合作伙伴 SiteGround 不仅提供每日备份,还提供监控、安全帐户隔离和专家技术支持。您是否有任何关于灾难规划或您面临灾难响应情况的经验想分享?请在下面的评论中分享!
关于创建网站灾难计划的常见问题 (FAQ)
全面的网站灾难恢复计划应包括以下关键要素:所有硬件、软件和数据的详细清单;对业务流程和优先级的清晰理解;数据备份和恢复策略;硬件和软件更换计划;告知利益相关者灾难和恢复过程的沟通计划;以及确保计划保持有效和最新的测试和维护时间表。
建议至少每年测试一次您的网站灾难恢复计划。但是,如果您的网站发生了重大变化,例如重大重新设计或添加新功能,则建议进行额外测试以确保计划仍然有效。
灾难恢复团队负责在灾难发生时实施灾难恢复计划。这包括执行任务,例如从备份中恢复数据、更换损坏的硬件和软件以及与利益相关者沟通。该团队应包括具有各种技能的个人,包括技术专长和项目管理。
数据备份应进行加密以防止未经授权的访问。此外,备份应存储在安全的位置,例如防火保险箱或异地数据中心。定期测试备份也很重要,以确保在需要时可以成功恢复数据。
沟通计划应概述在灾难发生时需要通知谁、他们需要接收哪些信息以及如何沟通这些信息。这可能包括员工、客户、供应商和其他利益相关者。该计划还应指定谁负责沟通这些信息。
通过结合积极措施(例如定期数据备份和硬件冗余)和被动措施(例如经过充分实践的灾难恢复计划和熟练的灾难恢复团队),可以最大限度地减少网站灾难恢复期间的停机时间。
虽然这两个计划的目标都是确保组织能够在灾难发生时继续运营,但灾难恢复计划特别关注恢复 IT 和数据能力,而业务连续性计划涵盖业务的各个方面,包括运营、人员配备和供应链。
可以通过定期测试来评估网站灾难恢复计划的有效性,这应包括对灾难场景的全面模拟。这些测试的结果可用于识别计划中的任何弱点并进行必要的改进。
如果没有网站灾难恢复计划,组织可能会在灾难发生时遇到延长停机时间、数据丢失、声誉受损和财务损失。此外,缺乏计划可能会导致恢复过程更慢且效率更低。
应定期审查和更新网站灾难恢复计划,以考虑网站基础设施、技术和业务流程的变化。此外,应将从测试或实际灾难场景中吸取的任何教训纳入计划。
以上是如何为网站创建灾难计划的详细内容。更多信息请关注PHP中文网其他相关文章!