openstack出错怎么办

181次阅读

没有评论

共计 2797 个字符，预计需要花费 7 分钟才能阅读完成。

这篇文章主要介绍了 openstack 出错怎么办，具有一定借鉴价值，感兴趣的朋友可以参考下，希望大家阅读完这篇文章之后大有收获，下面让丸趣 TV 小编带着大家一起了解一下。

控制节点：

查看云主机: nova list

详细查看单个云主机: nova show [name]

查看各个节点状态：nova-manage service list

计算节点:

查看节点状态: service openstack-nova-compute status

重启节点: service openstack-nova-compute restart

1.

虚拟机建立不起来的时候，有可能是，计算节点上的 openstack 服务 down 掉了，在控制节点上重启 openstack 服务即可。

[root@controlNode01 network-scripts]# nova service-list

[root@controlNode01 network-scripts(keystone_ALUvRAN)]#openstack-service restart

2.

虚拟机删掉了，但是 volume 还显示 in-use 状态，需要从数据库里面重置 volume 的状态。

[root@controlNode01]# mysql cinder

MariaDB [cinder] SELECT id,status,attach_status,mountpoint,instance_uuid from volumes;

MariaDB [cinder] UPDATE volumes SET status= available , attach_status= detached , mountpoint=NULL, instance_uuid=NULL WHERE id= 336d3e1c-298e-437d-a469-c2872cbe1a3a

3.

有时候碰到硬盘太大，比如需要创建 80G 的虚拟机，则会创建失败，需要修改 nova 里面的 vif 超时参数。

vif_plugging_timeout=10

vif_plugging_is_fatal=False

4.

在运行“/etc/init.d/network restart”命令时，出现错误“Job for network.service failed. See systemctl status network.service and journalctl -xn for deta”，运行“cat /var/log/messages | grep network”命令查看日志中出现的与 network 相关的信息

我出现的错误，是由于外网的物理地址与 eth0 不一样。后来将 pub 网指向 eth0 即可

7.14.2016

问题 1：

控制节点与计算节点之间的时间不同步：

nova-manage service list 检测服务状态原理：

最近更新时间，或者第一次创建时间与当前时间间隔少于 CONF.service_down_time（60 秒），则认为服务 alive

从这里也可以得知为什么控制节点和计算节点的时间要一致。

http://blog.csdn.net/tantexian/article/details/39204993

问题 2：

Nova scheduler :Host has more disk space than database expected

原理：

宿主机 RAM 和 DISK 的使用率往往要小于虚拟机理论使用的 RAM 和 DISK，在剩余资源充足的条件下，libvirt 将成功创建虚拟机。

随想：内存和磁盘超配虽然能提供更多数量的虚拟机，当该宿主机上大量虚拟机的负载都很高时，轻着影响虚拟机性能，重则引起 qemu-kvm 相关进程被杀，即虚拟机被关机。因此对于线上稳定性要求高的业务，建议不要超配 RAM 和 DISK，但可适当超配 CPU。建议这几个参数设置为：

CPU: CONF.cpu_allocation_ratio = 4

RAM: CONF.ram_allocation_ratio = 1.0

DISK: CONF.disk_allocation_ratio = 1.0

RAM-Reserve: CONF.reserved_host_memory_mb = 2048

DISK-Reserve: CONF.reserved_host_disk_mb = 20480

http://blog.csdn.net/wsfdl/article/details/45418727

问题 3：

在 nova-all.log 日志中发现 MessagingTimeout: Timed out waiting for a reply to message ID 问题

日志中时不时出现”MessagingTimeout: Timed out waiting for a reply to message“，来点绝的，直接修改 nova.conf 文件，添加：

[conductor]
use_local=true

如果计算节点宕机了，但没有在 nova 里将这个 host disable 掉，在 service_down_time and report_interval setting 时间内 nova-schedule 会误认为这个 host 仍然是 alive 的，从而出问题了。另外也可能是 olso 的 bug, https://bugs.launchpad.net/oslo.messaging/+bug/1338732

或者去掉 RetryFilter,

scheduler_default_filters=AvailabilityZoneFilter,RamFilter,ComputeFilter,ComputeCapabilitiesFilter,Image

在 neutron openswitch-agent .log 中发现

MessagingTimeout: Timed out waiting for a reply to message ID

neutron 在同步路由信息时，会从 neutron-server 获取所有 router 的信息，这个过程会比较长（130s 左右，和网络资源的多少有关系），而在 /etc/neutron/neutron.conf 中会有一个配置项“rpc_response_timeout”，它用来配置 RPC 的超时时间，默认为 60s, 所以导致超时异常. 解决方法为设置 rpc_response_timeout=180.

延时是解决各种问题的大招啊。。。

感谢你能够认真阅读完这篇文章，希望丸趣 TV 小编分享的“openstack 出错怎么办”这篇文章对大家有帮助，同时也希望大家多多支持丸趣 TV，关注丸趣 TV 行业资讯频道，更多相关知识等着你来学习!

正文完