Quantcast

KTU pasiūlė naują lokaliai progresyvaus skaitmeninių vaizdų glaudinimo idėją

Neapdorota daugialypė informacinė terpė (grafika, garsas, vaizdas) tiek saugojimui, tiek perdavimui reikalauja didelių atminties resursų bei plačios kompiuterinių ryšio kanalų pralaidumo juostos.

Nepaisant akivaizdaus technologinio progreso, siejamo su didėjančia skaitmeninių duomenų apdorojimui orientuotos procesorinės įrangos sparta bei duomenų perdavimui skirtų kompiuterinių ryšio kanalų kokybe, nūdienos reikalavimai informacijos laikmenų talpai bei informacijos kanalų pralaidumui gerokai viršija esamas technines ir technologines galimybes.

Nuolat intensyvėjantys informaciniai srautai, kurių pagrindinę dalį sudaro grafinė informacija (skaitmeniniai vaizdai, vaizdų sekos), bei daugialype terpe grindžiami internetiniai duomenų taikymai vienareikšmiškai byloja apie tai, jog būtina ieškoti naujų efektyvaus grafinės informacijos (skaitmeninių vaizdų,, skaitmeninių signalų) kodavimo (suglaudinimo) algoritmų bei idėjų. Skaitmeninių vaizdų ir signalų suglaudinimas tampa centrine ašimi duomenų saugojimui ir perdavimui skirtose projektuojamose technologijose.

Žemiau pateiktoje lentelėje pateikti įvairūs daugialypės informacinės terpės tipai, neapdorotų duomenų apimtys, kompiuterinių ryšio kanalų pralaidumas bei duomenų perdavimo laikai. Daugeliu atveju informacijos perdavimo laikai nėra priimtini.

Daugialypė terpė (Duomenys)

Dydis/ Trukmė

Bitai/ Pikseliui arba Bitai/Imčiai

Duomenų apimtis(B-baitai)

Perdavimo juostos plotis(b-bitai)

Perdavimo laikas (28,8K  modemas)

Teksto puslapis

A4 formatas

Kintamas dydis

4-8 KB

32-64 Kb/Pusl.

1,1-2,2 sek.

Telefoninis pokalbis

10 sek.

8 Bitai/ Imčiai

80 KB

64 Kb/sek.

22,2 sek.

Vaizdas su pilka šviesos intensyvumo skale

 512×512

8 Bitai/ Pikseliui

262 KB

2,1Mb/Vaizdui

1 min. 13 sek.

Spalvotas vaizdas

 512×512

24 Bitai/ Pikseliui

786 KB

6,29 Mb/ Vaizdui

3 min. 39 sek.

Medicininis vaizdas

 2048 x 2048

12 Bitai/ Pikseliui

5,16 MB

41,3 Mb/ Vaizdui

23 min. 54 sek.

Superaukšto tikslumo vaizdas

 2048 x 2048

24 Bitai/ Pikseliui

12,58 MB

100 Mb/ Vaizdui

57 min. 52 sek.

vaizdo filmas

640×480 1 min.(30 kadrų/sek.)

24 Bitai/Pikseliui

1,66 GB

221 Mb/sek.

2 val. 7 min.54 sek.

Kalbant apie efektyvų skaitmeninių vaizdų kodavimą (suglaudinimą), turima omeny pakankamai didelis vaizdo suglaudinimo efektas, toleruotini vaizdo kodavimo ir dekodavimo laikai bei gera atkurto vaizdo kokybė. Beje, patys naujausi, efektyviausi ir populiariausi dabartiniu laikmečiu skaitmeninių vaizdų (signalų) suglaudinimo algoritmai realizuojami spektrinėje bangelių (Haaro, LeGallo, Daubechies) srityje.

Būtent diskrečiosios bangelės leidžia pasiekti gana aukštą (30-40 kartų) vaizdų suglaudinimo efektą, išsaugant vizualiai priimtiną po kodavimo atkurtų vaizdų kokybę, leidžia įgyvendinti progresyvaus vaizdų kodavimo idėją, kai atkuriamo vaizdo kokybė nuosekliai gerinama, pasiunčiant (įvertinant) nedidelius papildomus išsaugotos informacijos apie pradinį vaizdą bitus, ir panašiai.

Tačiau dauguma su efektyviu vaizdų kodavimu susijusių požiūrių bei algoritmų vis dar yra kūrimo ir tyrimų stadijoje. Juos kuria ir tyrinėja viso pasaulio mokslininkai, tame tarpe ir Lietuvos. Pavyzdžiui, Kauno technologijos universiteto Fundamentaliųjų mokslo fakulteto prof. J. Valantino suburta jaunųjų mokslininkų komanda (dokt. D. Kančelkis, magistrantai J. Žydelis, J. Ribokas bei L. Vaišnoraitė) šiuo metu sprendžia tokias dviejų pagrindinių krypčių problemas:

• Progresyvaus skaitmeninių vaizdų su pilka šviesos intensyvumo skale bei vienmačių skaitmeninių signalų efektyvaus kodavimo (suglaudinimo) metodų paieška, sudarymas ir tyrimas.

• Skaitmeninės informacijos (duomenų aibių, laiko eilučių) apdorojimas (interpoliavimas, ekstrapoliavimas, vizualizavimas ir pan.), taikant įvairias matematines priemones, tame tarpe naujausias fraktalines technologijas.

 Intensyviai tiriamos diskrečiosios bangelių transformacijos (Haar, Le Gall, Daubechies ir kt.), jų savybės bei su šiomis transformacijomis susiję šiuolaikiniai progresyvaus vaizdų suglaudinimo algoritmai – EZW (Embedded, Zero-tree, Wavelet), SPIHT (Set Partitioning in Hierarchical Trees) – bei galimos jų modifikacijos.

Tyrinėjant suglaudinimo algoritmus, reikia nepamiršti jų panaudojimo srities – sukurti universalius ir visais atvejais tinkamus sprendimus yra praktiškai neįmanoma, tad tenka gilintis į skirtingų sričių poreikius. Dažni atvejai, kai iš persiunčiamų vaizdinių duomenų gavėją domina tik dalis informacijos (atskiri gautų vaizdų fragmentai).

Pavyzdžiui, per nuotolį konsultuojančiam gydytojui siunčiame paciento vidaus medicininę diagnostinę nuotrauką. Labai tikėtina, jog gydytoją domins ne bendras matomas vaizdas, o tik kai kurie vaizdo fragmentai – kurie konkrečiai, mes nežinome, juos pasirinks pats gydytojas. Nežinodami, kurie vaizdo fragmentai gydytojui iš tiesų yra svarbūs, privalome jam nusiųsti visą originalią nuotrauką (tai užtrunka ilgą laiko tarpą) arba nusiųsti suglaudintą (bet „atpažįstamą“) nuotrauką, o vėliau sulaukti iš gydytojo prašymo, kuriuos fragmentus reiktų „iškirpti“ iš originalaus vaizdo ir nusiųsti jam su visomis detalėmis.

Būtent tokiems atvejams paskutinių tyrimų eigoje Kauno technologijos universiteto, Fundamentaliųjų mokslų fakulteto, Taikomosios matematikos katedros profesorius dr.  J. Valantinas kartu su jaunųjų mokslininkų komanda pasiūlė originalią lokaliai progresyvaus skaitmeninių vaizdų (signalų) suglaudinimo idėją, kai atsižvelgiant į vartotojo reikalavimus ypatinga sparta automatiškai išrenkamas, apdorojamas ir ryšio kanalu išsiunčiamas vartotoją (užsakovą) dominantis aukštos kokybės vaizdo (signalo) fragmentas. Idėjos realizavimui sudarytos efektyvios diskrečiųjų bangelių (Haaro ir LeGallo) spektro apskaičiavimo vaizdo (signalo) fragmentams procedūros.

Žemiau pateiktame paveikslėlyje (1 pav.) matyti, kaip galima pagerinti skaitmeninių vaizdų perdavimo kompiuterių kanalais efektyvumą, orientuojantis į vartotoją bei taikant lokaliai progresyvųjį vaizdų kodavimą. Preliminarus medicininio vaizdo  suglaudinimas (suglaudinimo efektas 30) ir po kodavimo atkurtas („atpažįstamas“) vaizdas („grubus“ įvertis; 1 pav., b) sudaro sąlygas užsakovui pasirinkti vieną ar kitą jį dominantį vaizdo fragmentą. Pakartotinas pasirinkto (lokalizuoto) vaizdo fragmento kodavimas leidžia išsiųsti vartotojui nedidelį papildomą kiekį informacijos, atskleidžiančios smulkias detales jo pasirinktame fragmente (1 pav., c).



Paveksle: Lokaliai progresyvus vaizdų kodavimas: (a) medicininis vaizdas originalas 256×256; (b) „grubus“ vaizdo įvertis (po kodavimo atkurtas vaizdas; suglaudinimo efektas 30);  (c) vartotoją dominantis aukštos kokybės vaizdo fragmentas 64×64.

Pastebėsime, jog vartotoją dominantis vaizdo fragmentas  pasiekia vartotoją 13,69 karto (laiko požiūriu) greičiau, negu tai įvyktų siunčiant originalų (neapdorotą) vaizdą.

Kol kas šie tyrimai dar nėra pilnai užbaigti – reikia įvertinti visus teikiamo metodo privalumus bei trūkumus. Tačiau dalis šiais metais gautų teorinio bei eksperimentinio tyrimo rezultatų jau buvo pristatyti (Pranešėjas J. Valantinas – „On the use of Le Gall wavelets in implementing locally progressive digital signal coding idea“) tarptautiniame simpoziume ISPA’2009 (6th International Symposium on Image and Signal Processing and Analysis; Austria, Salzburg).

Taip pat paskelbta mokslinė publikacija (J. Valantinas, D. Kančelkis – „A new wavelet-based approach to progressive encoding of regions of interest in a digital signal“) periodiniame moksliniame žurnale „Information Technology and Control“ (Vol. 38, No.3, p. 195-202).

Tolesnių sėkmingų tyrimų duomenų suglaudinimo srityje rezultatai bus reguliariai pristatyti fakulteto tinklaraštyje.



NAUJAUSI KOMENTARAI

Galerijos

Daugiau straipsnių