..


Sponzorirani linkovi

Sažimanje datoteke. Algoritmi i softvera za usporedbu.

Članak je napisao Damiano Verda
Stranica 1 od 2

Među najčešćih operacija koja može biti korisna čak i za nekvalificirani korisnici prepoznati definitivno kompresije. Kroz ove transakcije, u stvari, bilo koju datoteku na vašem računalu mogu se vratiti, kako bi se zauzeti dio memorije od tvrdog diska. Mi promatramo, međutim, da, trenutno, ima veliki kapacitet tvrdih diskova na cijene prilično niske, tako da je korisnost programi za sažimanje će se pojaviti smanjivati. Ali ovo je hasty zaključak.

U stvari, na primjer, može biti zanimljivo za komprimiranje jedne ili više datoteka prije slanja putem e-pošte, kako bi se smanjiti vrijeme recepcije i prijenos. Zanimljivi i praktične toga i sposobnost za pohranu više dokumenata u jedan komprimirane datoteke, više praktičan za prijenos i manipulirati.

Ali što su glavne opcije na raspolaganju korisnicima za sažimanje datoteke ili datoteke? Ono što razlikuje različite softver dostupan? Neka nas ispitati prvi teorijski temelj softvera kompresije, čime se ilustrira glavne značajke kompresije.

Kompresije

Prvi razlike među kompresije mogu prepoznati između gubitaka algoritama, tj. bez gubitka kvalitete i gubljenje algoritama, u kojoj je smanjenje prostora na disku je popraćena gubitkom kvalitete. Često je teško uočiti pogoršanja u kvaliteti: na primjer, u slučaju mp3 kodiranja za audio datoteke.

Među najviše naširoko koristi algoritme identificirati bez sumnje "Huffman algoritma," Shannon-Fano algoritam i 'algoritam Lempel, Ziv i Briana. Iako ne ide u teorijska objašnjenja, mi ispitati glavne karakteristike 'Huffman algoritma, koji je obilježio povijest tehnike kompresije.

Mi odnose čitatelji zainteresirani za daljnje informacije o tehnikama Shannon-Fano i Lempel-Ziv-Welch veze s više specifičnih o ovoj temi:

Huffman algoritam

'S algoritam spada u kategoriju Huffman bez gubitaka, odnosno ne uvodi bilo kakav gubitak kvalitete. Mi scomporne rad u pet osnovnih koraka:

  • Se analizira i broji broj pojavljivanja osnovnih elemenata datoteka za sažimanje: pojedinačne znakove u tekstualnu datoteku, piksela u slikovnu datoteku.
  • Dva elementa su donijeli zajedno u rjeđe kategoriju koja predstavlja ih oboje. Tako na primjer, ako X i Y se javlja 8 puta 7 puta, to stvara kategoriji XY, sa 15 ponavljanje. U međuvremenu, komponente X i Y svaki dobiti različite marker koji ih identificira kao elementi uneseni u udruge.
  • Sljedeća dva predmeta su identificirani rjeđe u datoteku i sjedi kao novu kategoriju, koristeći isti postupak opisan u 2. koraku. Skupina XY može pretvoriti u ući u novi oblik i udruge, na primjer, XYZ kategoriji. Kada se to dogodi, X i Y dane su novi identifikator koji završava s Udrugom proširiti broj koji jedinstveno identificira svaki od dva slova u komprimirane datoteke će biti generiran.
  • Je li onda stvoren za daljnje korake, stablo se sastoji od niza binarnih grana, u kojem se pojavljuju češće iu kasnijim kombinacijama rjeđi elemenata u datoteku, a elementi su rijetko češće. Prema mehanizmu opisano, to znači da su rijetki elementi u nekomprimirani datoteke povezane s duljinom identifikacijski kod, koji raste svaki element nove udruge. Elementi se ponavljaju češće, umjesto izvorne datoteke nisu prisutni u "stablu udruga, tako da je njihov identifikacijski kod će biti što je kraće moguće.
  • Komprimirane datoteke se generira, zamjenjujući svaki element izvorne datoteke, broj proizvedenih na kraju lanca udruga temelji se na učestalosti tog elementa u izvorni dokument.
Dobitak prostora na kraju kompresije je zbog činjenice da su elementi koji se ponavljaju često su identificirani od strane kratko kod, koji zauzima manje prostora nego što zauzimaju svoje normalne kodiranje. Isto tako rijetke elemente u izvornu datoteku u komprimirane datoteke dobiti dugo kod, što može zahtijevati, za svaku od njih, područje znatno veće nego u okupiranom nekomprimirani file.

Od algebarski zbroj prostora ostvarena kodiranje kratke od najčešćih i prostor izgubio s kodiranja od najrjeđih dugo ste dobili omjer kompresije u produkciji "Huffman algoritma. Iz navedenog slijedi da je ova vrsta kompresije je učinkovitiji šire frekvencija razlike komponente izvorne datoteke, dok su siromašni rezultati kada je raspodjela elemenata uniformu.

U istoj kategoriji ...
E-učenje
HTML (tečaj) HTML (tečaj)
Označni jezik za web od 29 €.
Webmastere Napredni (tečaj) Webmastere Napredni (tečaj)
Postanite profesionalna webmastere. Od 39 €.
Webmastere baze (Prvi) Webmastere baze (Prvi)
Stvaranje web-od nule. Počevši od 29 €.
Sponzorirani linkovi