Zpracování chyby sběrnice ve službě Mongo

Mám službu Mongo, se kterou interaguje více hostitelů. Hostitel, na kterém běží služba Mongo, je docela zvláštní – má 3 TB RAM. Tento hostitel však také vyvolává občasné reakce na chyby sběrnice. Pokud během procesu služby Mongo dojde k chybě sběrnice, služba je zastavena a budou doručeny všechny procesy celeru (Python), které interagují se zdrojem, připojení odmítnuto.

Existuje způsob, jak povolit službu Mongo nějak se zotavit z chyby sběrnice? Může sharding pomoci s tímto problémem? Existuje nějaké další potenciální řešení chyby sběrnice, které lze provést na úrovni konfigurace aplikace? Byl bych vděčný za jakékoli návrhy, které mohou na tuto otázku nabídnout ostatní!

Postavil jsem Mongo ze zdroje na RedHatu, abych mohl použít jakoukoli nejnovější verzi, pokud to pomůže. Aktuálně nainstalovaná verze je 3.6.4. / p>

Komentáře

  • Chyby sběrnice pocházejí z nějakého procesu, který se snaží adresovat RAM, která tam není (nelze ji vyřešit). Myslím, že byste se měli podívat do HW / SW kompatibilita.
  • @dezso není možné tento problém vyřešit na úrovni aplikace? Nemohu ' v tomto případě ovlivnit hardware, ale mohu konfigurovat aplikace mongo …
  • No, jak to zní, MongoDB nedokáže správně zpracovat (adresovat) paměť. To je stěží něco, co můžete opravit vyladěním nastavení (ale říkám to, aniž byste ve skutečnosti věděli MongoDB). Navrhuji ' otevřít problém s vývojáři, mohou mít lepší nápad než kdokoli jiný.
  • @duhaime, můžete aktualizovat " Bus chyba ?. Pochází to ze softwarové úrovně nebo hardwarového štítku. Zkontrolovali jste " smartmontools " v prostředí linuxu?
  • @MdHaidarAliKhan Věřím, že tato chyba sběrnice pochází z hardwarová úroveň, ale ' bych rád zachytil výjimku na aplikační vrstvě …

Odpovědět

Zpracování chyby sběrnice ve službě Mongo

Podle Dokumentace MongoDB zde Bylo by také užitečné spustit smartctl (součást smartmontools ) pro kontrolu hardwarových chyb SMART:

sudo smartctl -a /dev/sdb 

I vy můžete spustit Linux fsck se používá ke kontrole a opravě souborových systémů Linux (ext2, ext3, ext4 atd.).

Podle toho, kdy byl soubor naposledy byl zkontrolován systém, systém během spouštění spustí fsck a zkontroluje, zda je souborový systém v konzistentním stavu. Správce systému by jej také mohl spustit ručně, pokud by došlo k potížím se souborovými systémy.

Ujistěte se, že spustíte fsck na nepřipojených souborových systémech, aby nedošlo k poškození dat problémy.

Další ref zde a zde

Odpověď

Chyba sběrnice je nejčastěji známkou programová chyba, v tomto případě samotná MongoDB, nebo zřídka hardwarová chyba. První věcí, kterou byste měli vyzkoušet, by byl upgrade na nejnovější stabilní verzi. Pokud problém přetrvává, kromě odeslání hlášení o chybě společnosti Mongo s tím nemůžete nic dělat.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *