Channel: InfoQ - 促进软件开发领域知识与创新的传播

X Mark channel Not-Safe-For-Work? cancel confirm NSFW Votes: (0 votes)

X Are you the publisher? Claim or contact us about this channel.

X 0

Showing article 693 of 1638 in channel 59042100
Channel Details:

Title: InfoQ - 促进软件开发领域知识与创新的传播
Channel Number: 59042100
Language: Chinese
Registered On: February 6, 2016, 3:00 pm
Number of Articles: 1638
Latest Snapshot: January 13, 2020, 6:47 pm
RSS URL: http://www.infoq.com/cn/feed/data-science/minibooks
Publisher: https://www.infoq.cn
Description: InfoQ 是一个实践驱动的社区资讯站点，致力于促进软件开发领域知识与创新的传播。
Catalog: //infoq344.rssing.com/catalog.php?indx=59042100

↧

步步惊心，Zookeeper集群运维“避坑”指南

August 13, 2019, 3:58 am

≫ Next: 开源分布式跟踪方案概览

≪ Previous: 数千台服务器，千万用户量：居然之家两年云原生改造历程

Zookeeper（文中简称ZK）是一个开放源码的分布式应用程序协调服务，是Google公司Chubby服务的开源实现，同时也是Hadoop和Hbase等开源软件的重要组件。文章将从ZK监控案例的角度出发，让大家了解ZK的一些重要监控指标。

服务故障案例

容量问题：

部分follower处于非同步状态后，手工重启异常的follower，结果follower依然无法加入集群。怀疑是集群有问题，因此重启整个集群，重启后集群始终无法进入正常状态，没有leader导致服务瘫痪。事后查看，快照体积达到GB级别，而initLimit默认值仅为20s，follower重启后无法在20s内同步完GB级别的数据，因此被踢出集群。而重启操作又加剧了这一问题，导致集群整体崩溃。最终，通过将故障前leader节点的快照手工同步到所有节点，并调大了zoo.cfg的同步时间相关的参数，服务才恢复。

在这个案例中，快照体积过大是故障的主要原因，我们需要优化initLimit和syncLimit参数、规范业务对ZK的使用方式、避免把ZK当作通用的文件存储系统，同时也需要添加对快照体积（zk_approximate_data_size）的监控，超过1GB就需要报警。类似的问题，如果ZK的节点数过多，也会造成集群性能严重下降，因此也需要添加对ZK集群的节点数（zk_znode_count）的监控，超过10万个节点就需要报警。

资源问题：

ZK集群和Hadoop部署在同一批物理机上，当Hadoop计算任务增加后，将物理机CPU打满，同机部署的ZK集群就无法响应外部请求，进而所有依赖该ZK的Hadoop服务均会崩溃。不仅仅是CPU，ZK还依赖单机的磁盘空间，磁盘的IO能力，网络等。鉴于此，对于ZK集群还是建议独立部署，不要混部。同时，对ZK所在机器的CPU/MEM/NET/IO等进行监控，避免其资源被占用。

还有就是ZK集群的文件句柄数，使用了系统默认的10240，而系统实际的压力远不止于此，因此会出现ZK无法处理部分新的请求，而问题定位的成本和耗时也会增加。发现问题后，通过调整ZK运行账号的文件句柄数限制并重启服务即可解决。

点击查看原文>

↧

Trending Articles

LIVE555再学习 -- 源码分析

September 18, 2017, 2:27 pm

如何在 Ubuntu 18.04 服务器上安装和配置 KVM

June 2, 2018, 5:51 pm

Windbg 指令與分析之教學筆記

December 3, 2019, 1:25 am

輪組碳框裂痕維修及管胎壽命請教 ?

August 17, 2016, 10:22 pm

拉习近平下马！爆炒佟丽娅丑闻央视现罕见诡异画面？【阿波罗网报导】

January 6, 2022, 9:08 pm

关门一家亲：习远平、张澜澜、徐才厚

December 23, 2020, 10:17 pm

EIZO出27吋新機EV2750

September 2, 2015, 6:31 pm

【幻月字幕组】【美丽的他】【04】【1080P】【中日双语】

December 9, 2021, 9:37 pm

cocoscreator3.7.3 命令行打包偶尔出错，脚本丢失，has a bad timestamp。

June 24, 2025, 4:46 am

Rad Studio Keygen 10.2.1 License Manager Corrected and source [含附件]

August 12, 2017, 12:08 am

俄罗斯将于明年3月4日选举新一届总统

November 25, 2011, 1:13 am

VW車主們的下一個品牌選擇

February 22, 2017, 8:57 pm

出售: Solidsteel 6.3

March 12, 2014, 5:44 am

[分享]免費CAD圖塊下載網址...有新增網站102.5.25

November 1, 2023, 1:09 am

【日语无字】春之钟.Haru.no.kane.1985.JAP.vhsrip.NoSub.by.xiongzaixia&vivi

May 5, 2017, 9:42 pm

[转载]梦瑜伽三梦大法梦瑜伽的修行方法

March 11, 2015, 10:01 am

Yuu積分點用好？Yuu獎賞計劃邀請碼+儲Yuu積分教學

February 17, 2022, 12:00 am

[黑白字幕组] 学园战记无量 Gakuen Senki Muryou [12][1080p][简体内嵌]

May 1, 2025, 8:16 am

影音處理框架FFmpeg 8.0新增Whisper過濾器，讓影片轉檔可同步語音轉錄

August 17, 2025, 5:00 pm

注意: 此版本的 ocvalidate 仅兼容 OpenCore 版本 0.9.9!！！！

July 22, 2024, 4:29 am

© 2025 //www.rssing.com