Hostinger 网络验证的演变(第 2 部分)
在我们 之前的文章中 ,我们讨论了 Hostinger 如何在上线之前开始使用网络验证。通过对核心网络实施网络验证,我们保持了对大规模网络性能的完全控制。
除此之外,该帖子还总结了 Suzieq 验证网络关键方面的用途。这次,我们将更详细地介绍Hostinger如何使用Suzieq进行网络验证,并 在评估过程中 更详细地描述Batfish 。
为您提供一些数字,我们在全球
拥有 9 个数据中心 (DC),并且很快还会有更多数据中心。每个数据中心的规模各 柬埔寨电报电话号码列表 不相同:每个数据中心可以有几个机架到几十个机架。尽管生产中引入变革的速度很快,但在此基础上使用自动化并不会产生任何显着的差异。对于最终客户而言,使用持续贡献和执行网络验证的公司提供的服务可以为 Hostinger 产品的信任和可靠性奠定基础。
苏齐克
连续运行轮询与快照
对于用于执行网络验证的任何工具,我们必须做出的首要决定之一是是否以独立模式或连续运行模式运行探测器。
无论使用什么工具,持续运行的调查都会产生更高的工程成本,尽管它是正确的方法。在这种方法中,轮询器必须一直运行并且必须是高可用的,也就是说,轮询器必须从故障中恢复……
从可维护性的角度来看,在“快照”模式下运行探测器是微不足道的。它可以在任何环境中独立运行:在本地计算机(工作站)上或在 CI/CD 中,无需考虑任何正在运行的服务。在我们的例子中,我们轮询一次数据,然后运行 Python 测试。在 Hostinger,我们的部署遍布许多地理区域:亚洲、欧洲、美国,并且每个区域都有几个发展中国家。我们将 Jenkins 用于 CI/CD 管道。为了确保我们在所有区域运行相同的测试,我们启动了多个 Jenkins 从服务器。如果我们使用连续运行的调查,则设置和维护的工程成本会更高。
检查同一数据中心的每个设备是否没有重复的 IPv6 环回地址。该规则是有效的并且至少经过了几次测试。大多数情况下,当我们启动新交换机并且复制/粘贴 Ansible 主机文件时,就会发生这种情况。
主要是在发生故障时添加新的测试,并且必须采取一些措施来快速检测它们或在将来尽早 文莱领先 缓解它们。例如,如果我们从仅 L3 设计切换到 EVPN 设计,当 ARP/ND 耗尽碰壁时,或者 L3 路由从几千条减少到几条时,我们可能会感到惊讶。
蝙蝠鱼
我们已经审查过 蝙蝠鱼 两次了。第一
个是概述和预演,看看它给我们带来的机
会。第一印象是“我的设置有什么问题吗? ” 因为,当时 Batfish 并不支 2024 年如何利用人工智能进行营销以实现回报最大化 持 FRR的一些配置语法。 Cumulus Linux 和许多其他大型项目都使用 FRR。它成为事实上最好的开源路由套件。这就是为什么 Batfish 也将 网络验证的 FRR 列为供应商。只有 FRR 作为一个模型在用于生产之前需要更多的改变(至少在我们的环境中)。
我们还开始考虑将 Batfish 作为一个开源项目来推动社区的变革。我们的案例中缺少