OMV 5 verliert Festplatten

  • Moin,
    seit kurzem verliert mein System nach ca. 5min drei Festplatten und ein Partition von der System SSD. Die einzige Änderung, die ich vorgenommen hatte, war die Erweiterung openmediavault-diskstats 5.05-1 zu installieren und neue Lüfter, Kabel im Gehäuse zu verlegen. Starte ich den Server neu, sind die Festplatten eingebunden nur die Partition der System SSD fehlt.


    Die Erweiterung habe ich wieder entfernt und alles Kabel auf festen Sitz überprüft.
    Kann mir jemand beistehen, ich habe leider 0 Ahnung und bin neu im OMV / Linux Land.

  • Hoffe ich habe den richtigen Teil rauskopiert


  • Re,


    hab mir mal das Syslag angeschaut:

    Code
    Aug  7 16:16:01 NASTim kernel: [  473.308035] ata12.00: exception Emask 0x52 SAct 0x40 SErr 0xffffffff action 0xe frozen
    Aug  7 16:16:01 NASTim kernel: [  473.308044] ata12: SError: { RecovData RecovComm UnrecovData Persist Proto HostInt PHYRdyChg PHYInt CommWake 10B8B Dispar BadCRC Handshk LinkSeq TrStaTrns UnrecFIS DevExch }
    Aug  7 16:16:01 NASTim kernel: [  473.308053] ata12.00: failed command: READ FPDMA QUEUED
    Aug  7 16:16:01 NASTim kernel: [  473.308061] ata12.00: cmd 60/08:30:00:be:c0/00:00:d1:01:00/40 tag 6 ncq dma 4096 in
    Aug  7 16:16:01 NASTim kernel: [  473.308061]          res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x56 (ATA bus error)
    Aug  7 16:16:01 NASTim kernel: [  473.308069] ata12.00: status: { DRDY }
    Aug  7 16:16:01 NASTim kernel: [  473.308075] ata12: hard resetting link
    Aug  7 16:16:01 NASTim kernel: [  473.308081] ahci 0000:03:00.0: AHCI controller unavailable!


    Da fängt es an ... und es geht weiter:


    Und das sieht nicht gut aus - der Fehler bringt deinen AHCI-Controller (SATA-Bus) komplett durcheinander.


    Entweder stirbt der SATA-Controller i'wie oder du hast beschädigte Kabel oder, oder, oder ... i'was stimmt im Speichersubsystem nicht.
    Es kann aber auch die Platte sein, deren Controller totalen Mist macht ... "sdg" wäre ein Kandidat, den ich zuerst mal vom System abstöpseln würde ... "ata12" ist laut Syslog eine "ST4000VN008-2DR166" ...


    Könntest du uns bitte mehr Details über deinen Build mitteilen?


    Sc0rp

  • Oh ha,
    dass klingt nach Mist. Ja ich hatte gestern alle SATA Kabel gegen neue ausgetauscht (einheitlich und länger). Davor lief alles und ohne Probleme. HAtte aber wie erwähnt leise Lüfter, neuen CPU Lüfter und die Kabel neu gemacht


    Athlon A3000g
    Asrock
    Asrock B450M Pro 4


    Kingston HyperX Fury DDR4 3000
    inLine SATA Karte
    BeQuiet NT


    3 WD White Label
    2 Seagate HDD
    SanDisk 256GB SSD







  • Die Karte hat 4 Ports.


    Ob die gestörten Platten daran hängen kann ich erst morgen beantworten. Bin im Nachtdienst. Spielt es den eine Rolle das einige Platten evtl. an einen anderen SATA Port gekommen sind wie vorher? Hatte ja alles Kabel getauscht und könnte nicht beschwören, dass die Platten genau wieder auf denselben Port gekommen sind.


    @ScOrp
    Zwei der gestörten Platten hängen an der Karte. Habe jetzt bei den betroffenen Platten die Kabel wieder getauscht. Mal schauen ob der Fehler wieder Auftritt. Im Nachtdienst habe ich nicht so die Lust mich damit zu beschäftigen. Wäre das System neu Aufsetzen noch eine Option? Oder die Karte gleich gegen eine neue tauschen?


    Edit2
    Ja die Fehler treten wieder auf. Bei Zugriff auf die Platten, werden sie Ausgehängt.

  • Kurzes Update:


    Problem ist gelöst. Die InLine Karte ist zurück zum Versender und eine Syba SI-PEX 40064 ist eingezogen. Alle Festplatten sind wieder da und arbeiten vor sich hin.

  • Hallo zusammen,


    ich habe ein ähnliches Problem, nur habe ich kein RAID, sondern nur eine einfache Backup Platte.

    Irgendwie wird die Platte nicht mehr gemountet, obwohl ich nichts verändert habe.

    Wenn die Platte am PC einstecke, kann ich ganz normal auf die Daten zugreifen.


      


    blkid

    Code
    /dev/mmcblk0p1: LABEL_FATBOOT="boot" LABEL="boot" UUID="5203-DB74" TYPE="vfat" PARTUUID="6c586e13-01"
    /dev/mmcblk0p2: LABEL="rootfs" UUID="2ab3f8e1-7dc6-43f5-b0db-dd5759d51d4e" TYPE="ext4" PARTUUID="6c586e13-02"
    /dev/sda1: LABEL="WD4TB" UUID="9105c421-6c00-4999-b348-16a4ac87e4ae" TYPE="ext4" PARTUUID="c1a98b3a-7a42-4798-a5a0-bad50618a345"
    /dev/mmcblk0: PTUUID="6c586e13" PTTYPE="dos"
    /dev/sdb1: LABEL="Backup500GB" UUID="bf7d6ab3-ddc4-410a-b558-8c12922ed365" TYPE="ext4" PARTUUID="b355f647-c6f8-427f-ad93-e45184e29763"


    lsblk

    Code
    NAME        MAJ:MIN RM   SIZE RO TYPE MOUNTPOINT
    sda           8:0    0   3.7T  0 disk
    └─sda1        8:1    0   3.7T  0 part /sharedfolders/Root
    sdb           8:16   0 465.8G  0 disk
    └─sdb1        8:17   0 465.8G  0 part
    mmcblk0     179:0    0  29.8G  0 disk
    ├─mmcblk0p1 179:1    0   256M  0 part /boot
    └─mmcblk0p2 179:2    0  29.6G  0 part /


    cat /etc/fstab

    Code
    proc            /proc           proc    defaults          0       0
    PARTUUID=6c586e13-01  /boot           vfat    defaults          0       2
    PARTUUID=6c586e13-02            /       ext4    noatime,nodiratime,defaults     0 1
    # a swapfile is not a swap partition, no line here
    #   use  dphys-swapfile swap[on|off]  for that
    # >>> [openmediavault]
    /dev/disk/by-label/WD4TB                /srv/dev-disk-by-label-WD4TB    ext4    defaults,nofail,user_xattr,noexec,usrjquota=aquota.user,grpjquota=aquota.group,jqfmt=vfsv0,acl  0 2
    /dev/disk/by-label/Backup500GB          /srv/dev-disk-by-label-Backup500GB      ext4    defaults,nofail,user_xattr,noexec,usrjquota=aquota.user,grpjquota=aquota.group,jqfmt=vfsv0,acl  0 2
    # <<< [openmediavault]

    Kann man das von Hand irgendwie wieder hinbiegen?

    Weiß jemand was Außlöser sein könnte? Ich hab im Netz was gefunden, dass evtl. mit dem Powermanagement mit der Platte, oder mit S.M.A.R.T. zu tun hat?


    Viele Grüße

    Leitner

  • Ist sdb eine externe USB-Platte?

    Wenn ja würde ich zuerst auf Probleme mit der Stromaufnahme tippen. So eine Platte braucht gerne mal 1 A Anlaufstrom, bei USB2 werden aber nur 0,5 A geliefert, USB 3 liefert 0,9 A. Es kann klappen, muss aber nicht.

    Bei PC's sind die USB-Anschlüsse häufig gerne mal als Paar ausgeführt, ist der daneben liegende schon besetzt, so teilen sich die beiden den knappen Strom.

    Daher mal einen anderen freien USB-Port verwenden oder noch besser einen aktiven Hub dazwischen schalten.

  • ist zwar kein PC, aber wenn ich bei meinem RPi4 zwei SSDs am USB3 anschliesse, geht dauernd im Betrieb eine verloren (und meist die System SSD). Und SSDs sind ja nicht so die Stromfresser.

    Also bei externer Platte checken, wo sie dran ist. Es gibt solche und solcher. Ich habe eine 2,5Zoll 2TB Platte, die auch bei meinem SAT Receiver am USB2 problemlos funktioniert...

    SW: OMV 4.1.35 (Arrakis), Snapraid mit mergerfs, Minidlna
    MSI B150M ECO, Intel Pentium G4400, 16GB Kingston DDR4, SSD 250GB, 4TB Daten, SnapRAID: 4*8TB (Seagate Archive)+6TB, 2*8TB Parity (WD White), FSP Aurum S 400W, Fractal Node 804

  • Bei mir läuft das alles auch auf einem RPI4. Beides sind USB3.0 Festplatten direkt am USB3.0 Anschluss angeschlossen, ohne USB Hub.

    Die 4TB Platte ist einen 3,5" mit eigener Stromversorgung.

    Die 500GB Platte (die gerade nicht eingebunden wird) ist eine 2,5" ohne separate Stromversorgung. Hier lässt sich auch keine zusätzliche Stromversorgung anschließen.

    Die ganze Konfiguration lief fast ein ¾ Jahr ohne Probleme. Mir ist erst jetzt aufgefallen, dass mein nächtliches Backup schon seit 3 Monaten nicht mehr ausgeführt wurde, da die Platte nicht gemountet ist. Ich habe aber selbst nichts geändert...

  • Ich habe das Problem jetzt folgendermaßen gelöst:

    - Alle Freigaben, Jobs und Einstellungen zu der verlorenen Partition/Platte gelöscht (Freigegebene Ordner, SMB/CIFS, rsync...)

    - Unter Dateisysteme konnte ich dann die verlorene Partition/Platte löschen

    - Dann konnte ich die Partition /dev/sdb1 mit "Einbinden" wieder aufnehmen

    - Jetzt musste ich nur noch alle Freigaben, Jobs und Einstellungen wieder neu anlegen

    Ist zwar umständlich und Fehleranfällig (man könnte ja irgendeine Einstellung versehentlich wieder falsch anlegen, ist mir leider passiert :P ) hat aber funktioneirt.

    Mit bessern Linux Kenntnissen wäre es sicher auch einfacher gegangen :S .


    Wenn ich jetzt cat /etc/fstab ausführe sieht es so aus:

    Code
    proc            /proc           proc    defaults          0       0
    PARTUUID=6c586e13-01  /boot           vfat    defaults          0       2
    PARTUUID=6c586e13-02            /       ext4    noatime,nodiratime,defaults     0 1
    # a swapfile is not a swap partition, no line here
    #   use  dphys-swapfile swap[on|off]  for that
    # >>> [openmediavault]
    /dev/disk/by-label/WD4TB                /srv/dev-disk-by-label-WD4TB    ext4    defaults,nofail,user_xattr,noexec,usrjquota=aquota.user,grpjquota=aquota.group,jqfmt=vfsv0,acl  0 2
    /dev/disk/by-id/usb-TO_Exter_nal_USB_3.0_WD-WX11E44ERM45-0:0            /srv/dev-disk-by-id-usb-TO_Exter_nal_USB_3.0_WD-WX11E44ERM45-0-0        ext4    defaults,nofail,user_xattr,usrjquota=aquota.user,grpjquota=aquota.group,jqfmt=vfsv0,acl      0 2

    Jetzt wird die Platte also by-id und nicht mehr by-label gemountet. Warum weiß ich leider nicht... :/

  • also eine 2.5 Zoll Festplatte kann schon ordentlich Strom brauchen. Wie gesagt, ich habe bei zwei SSDs am USB3 fom RPi4 auch dauernd eine SSD verloren. Und ich glaube nicht, dass die zwei SSDs mehr Strom brauchen als die Festplatte. Und Festplatten brauchen auch mal mehr und weniger Strom. Und wenn es blöd kommt mit etwas zu viel Last, dann schaltet der RPi den Port mal ab.


    der RPi4 ist halt auf dem USB sehr brustschwach. du brauchst ja nur mal nachrechnen, unter Annahme du darfst das Maximum am USB verbrauchen, dann hast du 2*0,9`2*0,5A =>2,8A auf 5V (und das Netzteil hat gerade mal 3A). Daraus folgt, dass das USB limitiert ist. Meine Lösung war übrigens ein aktiver USB3 Hub mit eigenem Netzteil (12V, 2A). Und seither gibt es keine Probleme mehr. Übrigens hat der RPi die SSD unter neuem Devicenamen erkannt, wenn ich sie abgesteckt und wieder angesteckt habe (war aber keine Lösung).


    Ich gehe leider davon aus, dass dein Problem wieder kommen wird (vielleicht auch nach längerer Zeit), also noch nicht wirklich gelöst ist.

    SW: OMV 4.1.35 (Arrakis), Snapraid mit mergerfs, Minidlna
    MSI B150M ECO, Intel Pentium G4400, 16GB Kingston DDR4, SSD 250GB, 4TB Daten, SnapRAID: 4*8TB (Seagate Archive)+6TB, 2*8TB Parity (WD White), FSP Aurum S 400W, Fractal Node 804

  • gerade noch mal was interessantes gefunden bezueglich USB und Kabeln. Geht dabei eigentlich um die Stromversorgung, kann aber natürlich auch bei Devices (Platten) ein Problem werden.

    ich hoffe, das zeigt das Problem etwas besser auf (und warum es am PC eigentlich nicht so existiert). Und jetzt versetehe ich auch, wieso das Original USB für den RPi4 5.1V hat...

    SW: OMV 4.1.35 (Arrakis), Snapraid mit mergerfs, Minidlna
    MSI B150M ECO, Intel Pentium G4400, 16GB Kingston DDR4, SSD 250GB, 4TB Daten, SnapRAID: 4*8TB (Seagate Archive)+6TB, 2*8TB Parity (WD White), FSP Aurum S 400W, Fractal Node 804

  • Danke für eure Hinweise!

    Das dies so nicht die Ideallösung (ohne extra Stromversorgung) ist mir klar. War auch nur ein Provisorium, aber ein gutes Provisorium hält ja bekanntlich ewig 😉.


    Das Thema mit den USB Kabeln, Spannungsabfall Strombegrenzung usw. ist mir auch bewusst. Ich arbeite beruflich Hardware Entwickler, da hat man das im Blut… Aus Interesse gerade mal die Spannung am Eingangs-Elko des USB3.0 zu SATA Adapter nagemessen:

    Festplatte im Spinn Down: 5,13V

    Festplatte im Leerlauf: 5,10V

    Wenn Daten gelesen werden: 5,05-5,10V

    Wenn die Platte anläuft/hochdreht: kurzzeitig 4,85V

    Also alles innerhalb der Spec.


    Ich werde es erst mal so lassen und beobachten ob es Ausfälle gibt. Auf lange Sicht ist die Platte eh zu klein und wird ohnehin ersetzt.

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!