Håndtering av bussfeil i Mongo Service

Jeg har en Mongo-tjeneste som flere verter kommuniserer med. Verten som Mongo-tjenesten kjører på er ganske spesiell – den har 3 TB RAM. Imidlertid kaster den verten også intermitterende Bus Error-svar. Hvis det oppstår en bussfeil i Mongo-tjenesteprosessen, stoppes tjenesten, og alle selleriprosesser (Python) som samhandler med ressursen, får servert Tilkobling nektet svar.

Er det en måte å tillate Mongo-tjenesten å gjenopprette på en eller annen måte etter en bussfeil? Kan skjæring hjelpe med dette problemet? Er det noen annen potensiell løsning på bussfeilen som kan gjøres på applikasjonskonfigurasjonsnivå? Jeg vil være takknemlig for forslag andre kan tilby på dette spørsmålet!

Jeg bygde Mongo fra kilden på RedHat, slik at jeg kan bruke en hvilken som helst ny versjon hvis det hjelper. Den installerte versjonen er 3.6.4.

Kommentarer

  • Bussfeil stammer fra en eller annen prosess som prøver å adressere RAM som ikke er der (kan ikke adresseres). Jeg antar at du bør se på HW / SW-kompatibilitet.
  • @dezso er det ikke mulig å løse dette problemet på applikasjonsnivå? Jeg kan ' t påvirke maskinvaren i dette tilfellet, men kan konfigurere Mongo-applikasjonen …
  • Vel, da det høres ut, kan MongoDB ikke håndtere (adressere) minnet ordentlig. Dette er neppe noe du kan fikse ved å tilpasse innstillingene (men jeg sier dette uten å vite MongoDB). Jeg ' foreslår at du åpner et problem med utviklerne, de kan ha en bedre ide enn noen her.
  • @duhaime, kan du oppdatere " Buss feil ?. Kommer det fra programvarenivå eller maskinvareetikett. Har du sjekket gjennom " smartmontools " i Linux-miljø?
  • @MdHaidarAliKhan Jeg tror denne bussfeilen kommer fra maskinvarenivå, men jeg ' vil fange unntaket ved applikasjonslaget …

Svar

Håndteringsbussfeil i Mongo Service

Iht. MongoDB-dokumentasjon her Det vil også være nyttig å kjøre smartctl (del av smartmontools ) for å se etter SMART maskinvarefeil:

sudo smartctl -a /dev/sdb 

Selv du kan kjøre Linux fsck verktøyet brukes til å sjekke og reparere Linux-filsystemer (ext2, ext3, ext4 osv.).

Avhengig av når sist en fil var systemet ble sjekket, kjører systemet fsck under oppstartstiden for å kontrollere om filsystemet er i konsistent tilstand. Systemadministrator kan også kjøre det manuelt når det er et problem med filsystemene.

Sørg for å utføre fsck på et umontert filsystem for å unngå datakorrupsjon. utgaver.

For din ytterligere referanse her og her

Svar

Bussfeil er oftest en indikasjon på programfeil, i dette tilfellet MongoDB selv, eller sjelden et maskinvareproblem. Som sådan ville det første å prøve å oppgradere til den siste stabile versjonen. Hvis problemet vedvarer, er det ikke mye du kan gjøre med det bortsett fra å sende en feilrapport til Mongo.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *