proč bych měl použít tar.xz místo tar.gz? xz je bezztrátový program pro kompresi dat a formát souboru [duplikát]

Tato otázka již má odpovědi zde :

Komentáře

  • Myslím, že musíte nastavit proveďte jednoduchý test a podívejte se, jaký kompresní program je pro vás " nejlepší ". Nikdo jiný vám to nemůže říct.

Odpovědět

gzip a xz používá dva různé algoritmy, a proto fungují odlišně, a to jak z hlediska úrovně komprese, které dosahují, tak z hlediska množství zdrojů, které při kompresi nebo dekompresi spotřebují.

V obecně xz dosahuje vyšších kompresních poměrů, ale potřebuje mnohem více paměti a času.

Já osobně pro archivaci dat použijte xz; velké soubory, které potřebuji na dlouho odložit. Jinak používám gzip, protože je to obvykle rychlejší.

Vyzkoušejte je a podívejte se, jak si vedou váš průměr tar (nebo cokoli jiného) souboru.

Odpověď

se v posledních letech stal trochu standardem, pokud jde o správu balíčků.

Použitý kompresní algoritmus LZMA2 xz je výjimečně efektivní s textovými (a „textovými“) daty. Osobně to používám téměř na cokoli, kde výpočetní rychlost kódování není problém (xz dekomprimuje hodně rychlejší než komprese, je to vlastně jeden z jeho návrhových cílů).

Takže je to skvělé pro věci, jako je archivace nebo zálohování (obecně řečeno, soubory, které se hodně dekomprimují, ale kde data nejsou neustále komprimována nebo měněna atd.). Není to tak skvělé rozhodnutí pro kompresi streamu – přinejmenším ne tak často, protože LZMA2 není při kompresi příliš lehký na zdroje.

Ale rád bych se vyjádřil k jednomu dalšímu prohlášení z vašeho: „should“. To, co byste měli nebo neměli použít, záleží na tom, k čemu vaše data potřebujete. Přestože xz a LZMA2 existují už léta, lidé stále považují komprimaci pomocí gz za záložní z důvodu kompatibility. Věci jako Trac nebo cgit nabídka .tar.gz, .7z a .tar.xz. S možností .tar.gz, protože byla „navždy“ a to “ je dobré nouzové opatření na jakémkoli zařízení, bez ohledu na to, jak minimální nebo staré.

Jako příklad lze uvést lzop je rychlé a šetří zdroje kompresor, který se často používá na kosmických lodích, ale jinak není příliš efektivní. Nemohl jsem však říci, že to není široce používáno. Často se používá v systémech, kde je důležitější rychle komprimovat něco s malým výkonem a výpočetním prostorem.

Takže to, co byste měli nebo neměli používat, je to, co vám dává největší smysl a lidé, kteří interagují s vašimi daty.


Jedna věc, která se mi nedávno vybavila: man stránky jsou běžně komprimovány pomocí gzip. Pokud se podíváte například do /usr/share/man/man1/, uvidíte spoustu souborů podobných mv.1.gz, pokud nejsou všechny komprimovány . Nyní by pravděpodobně mělo smysl přejít na .xz soubory kvůli lepší kompresi, ale prostorové zisky jsou minimální ve srovnání s negativními účinky vyřazení .gz pro .xz. Důvodem je téměř univerzální kompatibilita. Dokonce i otevření .gz komprimovaných souborů přímo v Vim funguje dobře a funguje jako transparentní komprese.

Odpovědět

Formát .xz poskytuje několik pokročilých funkcí. Současně byl udržován dostatečně jednoduchý, aby byl použitelný v mnoha vestavěných systémech. Zde je souhrn funkcí:

  • Čtení s náhodným přístupem: Data lze rozdělit do samostatně komprimovaných bloků. Každých obsahuje index bloků, který umožňuje omezené čtení s náhodným přístupem, když je velikost bloku dostatečně malá.
  • Kontroly integrity: Integrita všech hlaviček je vždy chráněna pomocí CRC32. . Integritu skutečných dat lze ověřit pomocí CRC32, CRC64, SHA-256 …
  • Zřetězení: Stejně jako u souborů .gz a .bz2 je možné zřetězit .xz soubory tak, jak jsou. Dekompresor může dekomprimovat zřetězený soubor, jako by se jednalo o běžný jednoproudový .xz soubor.
  • Výplň: K soubory k vyplnění, aby se vyplnily např blok na záložní pásku. Výplň musí být násobkem čtyř bajtů, protože velikost každého platného .xz souboru je násobkem čtyř bajtů.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *