2013-10-28 68 views
0

(继续与上datastax论坛标题相同的讨论)。我能够重现opscenter无法连接到2.0.1群集的问题,使用“使用现有群集”,失败消息“错误创建群集:呼叫/群集配置超时。”。它与cassandra.yaml中的“rpc_server_type:hsha”有关。添加集群:“错误创建集群:来电/集群CONFIGS超时。”

我再现它如下:

(1)安装了Ubuntu 12.04(x86-64架构)中QEMU。将其更新为所有软件包的最新版本。配置一个静态IP地址(192.168.77.3)。建立Qemu网络,以便主机和qemu虚拟机可以通信。

(2)下载的Sun JRE-7u45-Linux的x64.tar.gz并安装它。安装了libjna-java。这一切都是按照安装在Debian/ubuntu文档上的datastax完成的。

使用Debian包(3)安装datastax卡桑德拉2.0.1,如在datastax文档说明。

(4)作了如下改动cassandra.yaml:

  • 种子: “192.168.77.3” listen_address:192.168.77.3 rpc_address:192.168.77.3 rpc_server_type:HSHA NB:看失败,使用hsha至关重要。

(5)停止cassandra实例(Debian会在安装时自动启动它)。请注意,初始化脚本不能用于停止cassandra(这是cassandra 2.0的一个新问题),所以我不得不手动终止进程。这是一个陷阱:您可能认为您重新启动了cassandra,并且已将您的配置更改考虑在内,但这并不是因为您仍在运行旧实例。

(6)清除出去实例数据:须藤RM -fr的/ var/lib中/卡桑德拉/ *

(7)开始一个新的卡桑德拉实例。检查nodetool是否可以从虚拟机(即本地运行)和主机上连接到它。

(8)尝试添加从游离的OpsCenter运行的群集的主机上(即,不是在虚拟机上运行)。 opscenter版本3.2.2,ubuntu 13.10。由于没有添加任何集群,我通过“创建新集群”或“使用现有集群”获得了“欢迎使用Datastax操作中心”对话框。选择“使用现有群集”。添加了qemu虚拟机实例的IP地址(192.168.77.3)。点击“保存群集”。 “创建群集时出错:呼叫/群集配置超时”失败。

在OpsCenter日志:

2013-10-28 11:59:04+0100 [] INFO: Log opened. 
2013-10-28 11:59:04+0100 [] INFO: twistd 10.2.0 (/usr/bin/python2.7 2.7.5) starting up. 
2013-10-28 11:59:04+0100 [] INFO: reactor class: twisted.internet.selectreactor.SelectReactor. 
2013-10-28 11:59:04+0100 [] INFO: set uid/gid 0/0 
2013-10-28 11:59:04+0100 [] INFO: Logging level set to 'info' 
2013-10-28 11:59:04+0100 [] INFO: OpsCenter version: 3.2.2 
2013-10-28 11:59:04+0100 [] INFO: Compatible agent version: 3.2.2 
2013-10-28 11:59:04+0100 [] INFO: No clusters are configured yet, checking to see if a config migration is needed 
2013-10-28 11:59:04+0100 [] INFO: Main config does not appear to include a cluster configuration, skipping migration 
2013-10-28 11:59:04+0100 [] INFO: No clusters are configured 
2013-10-28 11:59:04+0100 [] INFO: HTTP BASIC authentication disabled 
2013-10-28 11:59:04+0100 [] INFO: Starting webserver with ssl disabled. 
2013-10-28 11:59:04+0100 [] INFO: SSL agent communication enabled 
2013-10-28 11:59:04+0100 [] INFO: opscenterd.WebServer.OpsCenterdWebServer starting on 8888 
2013-10-28 11:59:04+0100 [] INFO: Starting factory <opscenterd.WebServer.OpsCenterdWebServer instance at 0x2f2a6c8> 
2013-10-28 11:59:04+0100 [] INFO: morbid.morbid.StompFactory starting on 61619 
2013-10-28 11:59:04+0100 [] INFO: Starting factory <morbid.morbid.StompFactory instance at 0x3062320> 
2013-10-28 11:59:04+0100 [] INFO: Configuring agent communication with ssl support enabled. 
2013-10-28 11:59:04+0100 [] INFO: morbid.morbid.StompFactory starting on 61620 
2013-10-28 11:59:04+0100 [] INFO: OS Version: Linux version 3.11.0-12-generic ([email protected]) (gcc version 4.8.1 (Ubuntu/Linaro 4.8.1-10ubuntu7)) #19-Ubuntu SMP Wed Oct 9 16:20:46 UTC 2013 
2013-10-28 11:59:04+0100 [] INFO: CPU Info: ['2401.000', '1200.000', '1200.000', '2401.000', '1200.000', '1200.000', '1200.000', '2401.000'] 
2013-10-28 11:59:04+0100 [] INFO: Mem Info: 15979MB 
2013-10-28 11:59:04+0100 [] INFO: Package Manager: Unknown 
2013-10-28 12:03:02+0100 [] INFO: Starting factory <opscenterd.ThriftService.NoReconnectCassandraClientFactory instance at 0x31cd7e8> 
2013-10-28 12:03:02+0100 [] INFO: Adding new cluster 'Test_Cluster': {u'jmx': {u'username': u'', u'password': u'', u'port': u'7199'}, 'kerberos_client_principals': {}, 'kerberos': {}, u'agents': {}, 'kerberos_hostnames': {}, 'kerberos_services': {}, u'cassandra': {u'username': u'', u'seed_hosts': u'192.168.77.3', u'api_port': u'9160', u'password': u''}} 
2013-10-28 12:03:02+0100 [] INFO: Starting new cluster services for Test_Cluster 
2013-10-28 12:03:02+0100 [Test_Cluster] INFO: Starting services for cluster Test_Cluster 
2013-10-28 12:03:02+0100 [] INFO: Metric caching enabled with 50 points and 1000 metrics cached 
2013-10-28 12:03:02+0100 [] INFO: Starting PushService 
2013-10-28 12:03:02+0100 [Test_Cluster] INFO: Starting CassandraCluster service 
2013-10-28 12:03:02+0100 [Test_Cluster] INFO: agent_config items: {'cassandra_log_location': '/var/log/cassandra/system.log', 'thrift_port': 9160, 'thrift_ssl_truststore': None, 'rollups300_ttl': 2419200, 'rollups86400_ttl': -1, 'jmx_port': 7199, 'metrics_ignored_solr_cores': '', 'api_port': '61621', 'metrics_enabled': 1, 'thrift_ssl_truststore_type': 'JKS', 'kerberos_use_ticket_cache': True, 'kerberos_renew_tgt': True, 'rollups60_ttl': 604800, 'cassandra_install_location': '', 'rollups7200_ttl': 31536000, 'kerberos_debug': False, 'storage_keyspace': 'OpsCenter', 'ec2_metadata_api_host': '169.254.169.254', 'provisioning': 0, 'kerberos_use_keytab': True, 'metrics_ignored_column_families': '', 'thrift_ssl_truststore_password': None, 'metrics_ignored_keyspaces': 'system, system_traces, system_auth, dse_auth, OpsCenter'} 
2013-10-28 12:03:02+0100 [] INFO: Stopping factory <opscenterd.ThriftService.NoReconnectCassandraClientFactory instance at 0x31cd7e8> 
+0

Guy on the OpsCenter team here。我们已经报道过这个问题,并且能够在我们的最终重现。不知道究竟是什么原因/解决方法,所以我还没有提交答案,但是当我们弄清楚时,我会尽快解决。 – nickmbailey

回答

1

这是由于在卡桑德拉不幸的错误:

https://issues.apache.org/jira/browse/CASSANDRA-6373

目前的解决办法是使用同步节俭服务器。如果在OpsCenter中实施了解决方法,我会更新我的回复。

+0

该bug的任何更新?从hsha切换到同步,它只是工作。闻起来像种族条件......? –

+0

如果您检查链接故障单,您将看到该错误已修复,并将在Cassandra 2.0.5版中发布。 – nickmbailey