共计 2797 个字符,预计需要花费 7 分钟才能阅读完成。
这篇文章主要介绍了 openstack 出错怎么办,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让丸趣 TV 小编带着大家一起了解一下。
控制节点:
查看云主机: nova list
详细查看单个云主机: nova show [name]
查看各个节点状态:nova-manage service list
计算节点:
查看节点状态: service openstack-nova-compute status
重启节点: service openstack-nova-compute restart
1.
虚拟机建立不起来的时候,有可能是,计算节点上的 openstack 服务 down 掉了,在控制节点上重启 openstack 服务即可。
[root@controlNode01 network-scripts]# nova service-list
| 6 | nova-compute | computeNode01 | nova | enabled | down | 2016-02-26T06:47:45.000000 | None |
[root@controlNode01 network-scripts(keystone_ALUvRAN)]#openstack-service restart
2.
虚拟机删掉了,但是 volume 还显示 in-use 状态,需要从数据库里面重置 volume 的状态。
[root@controlNode01]# mysql cinder
MariaDB [cinder] SELECT id,status,attach_status,mountpoint,instance_uuid from volumes;
MariaDB [cinder] UPDATE volumes SET status= available , attach_status= detached , mountpoint=NULL, instance_uuid=NULL WHERE id= 336d3e1c-298e-437d-a469-c2872cbe1a3a
3.
有时候碰到硬盘太大,比如需要创建 80G 的虚拟机,则会创建失败,需要修改 nova 里面的 vif 超时参数。
vif_plugging_timeout=10
vif_plugging_is_fatal=False
4.
在运行“/etc/init.d/network restart”命令时,出现错误“Job for network.service failed. See systemctl status network.service and journalctl -xn for deta”,运行“cat /var/log/messages | grep network”命令查看日志中出现的与 network 相关的信息
我出现的错误,是由于外网的物理地址与 eth0 不一样。后来将 pub 网指向 eth0 即可
7.14.2016
问题 1:
控制节点与计算节点之间的时间不同步:
nova-manage service list 检测服务状态原理:
最近更新时间,或者第一次创建时间与当前时间间隔少于 CONF.service_down_time(60 秒),则认为服务 alive
从这里也可以得知为什么控制节点和计算节点的时间要一致。
http://blog.csdn.net/tantexian/article/details/39204993
问题 2:
Nova scheduler :Host has more disk space than database expected
原理:
宿主机 RAM 和 DISK 的使用率往往要小于虚拟机理论使用的 RAM 和 DISK,在剩余资源充足的条件下,libvirt 将成功创建虚拟机。
随想:内存和磁盘超配虽然能提供更多数量的虚拟机,当该宿主机上大量虚拟机的负载都很高时,轻着影响虚拟机性能,重则引起 qemu-kvm 相关进程被杀,即虚拟机被关机。因此对于线上稳定性要求高的业务,建议不要超配 RAM 和 DISK,但可适当超配 CPU。建议这几个参数设置为:
CPU: CONF.cpu_allocation_ratio = 4
RAM: CONF.ram_allocation_ratio = 1.0
DISK: CONF.disk_allocation_ratio = 1.0
RAM-Reserve: CONF.reserved_host_memory_mb = 2048
DISK-Reserve: CONF.reserved_host_disk_mb = 20480
http://blog.csdn.net/wsfdl/article/details/45418727
问题 3:
在 nova-all.log 日志中发现 MessagingTimeout: Timed out waiting for a reply to message ID 问题
日志中时不时出现”MessagingTimeout: Timed out waiting for a reply to message“,来点绝的,直接修改 nova.conf 文件,添加:
[conductor]
use_local=true
如果计算节点宕机了,但没有在 nova 里将这个 host disable 掉,在 service_down_time and report_interval setting 时间内 nova-schedule 会误认为这个 host 仍然是 alive 的,从而出问题了。另外也可能是 olso 的 bug, https://bugs.launchpad.net/oslo.messaging/+bug/1338732
或者去掉 RetryFilter,
scheduler_default_filters=AvailabilityZoneFilter,RamFilter,ComputeFilter,ComputeCapabilitiesFilter,Image
在 neutron openswitch-agent .log 中发现
MessagingTimeout: Timed out waiting for a reply to message ID
neutron 在同步路由信息时,会从 neutron-server 获取所有 router 的信息,这个过程会比较长(130s 左右,和网络资源的多少有关系),而 在 /etc/neutron/neutron.conf 中会有一个配置项“rpc_response_timeout”,它用来配置 RPC 的超时时间,默认为 60s, 所以导致超时异常. 解决方法为设置 rpc_response_timeout=180.
延时是解决各种问题的大招啊。。。
感谢你能够认真阅读完这篇文章,希望丸趣 TV 小编分享的“openstack 出错怎么办”这篇文章对大家有帮助,同时也希望大家多多支持丸趣 TV,关注丸趣 TV 行业资讯频道,更多相关知识等着你来学习!