Proxmox VE(PVE)升级到7.X后,BUG是越升越多,越来越难用了!PVE7.0的时候安装的黑群晖DS918-7.0.1带核显直通好好的,后来把PVE升级到最新版本,结果群晖启动不了了,报错提示如下:
kvm: -device vfio-pci,host=0000:00:02.0,id=hostpci1,bus=pci.0,addr=0x2: vfio 0000:00:02.0: error getting device from group 1: Invalid argument
Verify all devices in group 1 are bound to vfio-<bus> or pci-stub and not already in use
TASK ERROR: start failed: QEMU exited with code 1
如果把直通的核显删除是可以正常启动,但是这样用DS918系统就失去乐趣了。解决办法来了:
1、编辑PVE的 /etc/default/grub 这个文件;
2、找到GRUB_DEFAULT=“0”这行;
3、改为:
GRUB_DEFAULT="Advanced options for Proxmox VE GNU/Linux>Proxmox VE GNU/Linux, with Linux 5.13.19-4-pve"
4、保存退出;
5、敲命令update-grub更新grub;
6、重启PVE生效,目的是降级PVE的内核版本,使用5.13.19-4这个内核可以正常启动。
文章评论
请问下 E3V4的 核显 在PVE6.4 7.0 7.2 中都测试了 显示这种是不支持吗?还是也有方法实现核显直通 在虚拟机硬件中添加PCI 显示这个pci 0000:00:02.0: DMAR: Disabling IOMMU for graphics on this chipset
P6300的核显没有分组id 启动提示 TASK ERROR: Cannot open iommu_group
root@pve:~# dmesg | grep -e DMAR -e IOMMU
[ 0.030745] ACPI: DMAR 0x00000000938A6B40 0000B8 (v01 INTEL BDW 00000001 INTL 00000001)
[ 0.030822] ACPI: Reserving DMAR table memory at [mem 0x938a6b40-0x938a6bf7]
[ 0.228326] DMAR: Host address width 39
[ 0.228329] DMAR: DRHD base: 0x000000fed90000 flags: 0x0
[ 0.228341] DMAR: dmar0: reg_base_addr fed90000 ver 1:0 cap 1c0000c40660462 ecap 7e1ff0505e
[ 0.228349] DMAR: DRHD base: 0x000000fed91000 flags: 0x1
[ 0.228357] DMAR: dmar1: reg_base_addr fed91000 ver 1:0 cap d2008c20660462 ecap f010da
[ 0.228363] DMAR: RMRR base: 0x00000093b07000 end: 0x00000093b17fff
[ 0.228368] DMAR: RMRR base: 0x00000095000000 end: 0x000000977fffff
[ 0.228373] DMAR-IR: IOAPIC id 2 under DRHD base 0xfed91000 IOMMU 1
[ 0.228378] DMAR-IR: HPET id 0 under DRHD base 0xfed91000
[ 0.228381] DMAR-IR: x2apic is disabled because BIOS sets x2apic opt out bit.
[ 0.228384] DMAR-IR: Use 'intremap=no_x2apic_optout' to override the BIOS setting.
[ 0.229623] DMAR-IR: Enabled IRQ remapping in xapic mode
[ 0.711595] pci 0000:00:02.0: DMAR: Disabling IOMMU for graphics on this chipset
[ 0.798816] DMAR: No ATSR found
[ 0.798819] DMAR: No SATC found
[ 0.798823] DMAR: dmar1: Using Queued invalidation
[ 0.803438] DMAR: Intel(R) Virtualization Technology for Directed I/O
root@pve:~# lspci -nn | grep VGA
00:02.0 VGA compatible controller [0300]: Intel Corporation Iris Pro Graphics P6300 [8086:162a] (rev 08)
@阿里冬冬 假如PVE已经正确开启了直通分组的情况下,初步判断是硬件不支持核显直通。
求一个网卡SR-IOV的教程 :guai:
@哄哄 百度找一下教程吧,应该有很多。另外,你的网卡要支持SR-IOV才可以用这个功能。
@博主 我用的华为的I350T2 ,我查了每个网口可以虚拟7个网卡,教程意外很多,昨天搞了一天都没搞好 :lei:
没有报错,PVE显示启动,但是就是进不去了后台,删了直通的显卡就可以开机了
@xyz 直通核显给群晖然后开机后启动进不去群晖,是主板问题,这个问题只能换主板。
我920核显直通添加完核显直通文件后,添加PCIE核显,就成功了 :haha:
重启后,在PVE 概要里,还是显示Linux 5.15.30-2-pve 直通核显还是开不了机,群晖6.23
@BFX 你要先找出具体是原因,再改对应的文件。
PVE 怎么用bark或者ServerChan推送状态异常负载温度这些的办法,最好能设置一下阈值,例如温度超过66度发送消息,CPu负载超过88,VM异常,定时推送
@大象艾拉斯 我不会编程。如果你会编程,可以自己去编写脚本,定时运行脚本。
折腾良久,才知道是内核原因导致win10自动关机。
博主太懒,update-grub这命令要输的~
@熊三 大意了,因为不是实时操作的截图,是以前折腾过回忆的操作步骤,所以忘记最后这一步更新grub了。谢谢提醒
5105小主机 PVE下的群晖一定要5.13.19-2内核才稍微正常一点 其他内核老是异常重启 或者死机
@yingdk 是的,5.13.19这个内核版本还算是稳定,再高的版本就是问题多多。
我也被坑了.....win11虚拟机在6.3 6.4 7.0 直通核显都没问题 7.1 7.2就一直蓝屏。7.0 自带是5.11内核 7.1是5.13 7.2是5.15 ,据说是我4代intel 平台太老了,linux内核升级以后无法直通核显, 升级7.2要降级内核才能直通核显,所以现在一直停在7.0了。
:heixian: 我靠原来是这样我还以为我换了硬件软硬导致有问题 害的我直接换了整套设备
@迷情 pve7.x坑多多,没事还是别升级了。
@迷情 哈哈,被坑了