15 March 2015

##介绍
错误出现的三个主要地方:
1. Zookeeper服务器
2. 网络
3. 应用程序

Zookeeper提供两种不同的失败类型:
1. 可恢复的
2. 不可恢复的(session超时,授权收回等)

当客户端重新连接到Zookeeper上时会比对znode的时间戳如果监听的时间戳比客户端的晚就会触发监听事件。 这个逻辑在除了exists的其它方面工作的很好。
exists:如下图C2就不能监听到C1对znode event的操作

failure

##选举与外部资源

###fencing(用来解决外部资源的冲突)

fencing

要支持这种机制就需要修改客户端与资源之间的协议,外部资源需要存储和跟踪最后的zxid。



blog comments powered by Disqus