该问题常在主机从集群分离后出现,现象是登录WebUI后,总会在登陆(大约)5分钟后就无法继续操作,并会弹出登录框,需要重新登录。
TLDR:解决方法是在参照官方wiki
分离节点后,删除/etc/pve/ha/目录下的所有文件(可能需要停止pve相关服务),即可。
如果/etc/pve/priv/lock/下有残留的文件,也可以一并删除。
这个问题原先在国内和外网上都没有靠谱的解决方案,而我也是在重装了Proxmox VE后对比新旧配置文件夹发现的异样,可能是网络上可见的第一例成功解决的吧。
以下DLC关于如何在不丢失虚拟机的情况下重装Proxmox VE软件套件,这里可以简单的说明一下:
- 首先分离节点(即主机),确保不在cluster中
- 备份需要的pve配置文件:
- 存储配置文件:
/etc/pve/storage.cfg - 每个LXC容器配置文件:
/etc/pve/nodes/<your_node_name>/lxc/* - 每个VM的配置文件:
/etc/pve/nodes/<your_node_name>/qemu-server/*
- 然后停止pve服务,卸载proxmox-ve元软件包(期间还会有一道安全措施),然后用apt autoremove卸载所有的pve软件包
- 备份并移除/var/lib/pve-cluster/(/etc/pve目录虚拟文件系统,即pmxcfs,而这里是其“本体”)
- 此时你的系统就变成了近似普通的Debian Linux,可以重启一下(要有仪式感)
- 重新装回proxmox-ve
- 先关闭所有pve服务,然后恢复之前备份的文件,重启机器
- 登陆WebUI,你应该能看到你原来所有的虚拟机和LXC了
最后吐槽一下pve:cluster加入容易,移出难。还会导致一些奇怪的问题,建议一旦你的cluster有分离操作,最好把所有涉及到的节点都分离并清理干净(甚至重装pve软件),再把需要的节点重新组合为cluster。当然最好是加入cluster就考虑清楚,别做分离操作。