Pagproseso ng Quantimetric na Imahe: 5 Hakbang
Pagproseso ng Quantimetric na Imahe: 5 Hakbang
Anonim
Pagproseso ng Quantimetric na Imahe
Pagproseso ng Quantimetric na Imahe
Pagproseso ng Quantimetric na Imahe
Pagproseso ng Quantimetric na Imahe
Pagproseso ng Quantimetric na Imahe
Pagproseso ng Quantimetric na Imahe
Pagproseso ng Quantimetric na Imahe
Pagproseso ng Quantimetric na Imahe

(Inilalarawan ng nasa itaas na larawan ang paghahambing ng mayroon nang pamamaraan ng pagproseso ng imahe na may pagproseso ng dami ng laki. Tandaan ang pinabuting resulta. Ipinapakita ng tuktok na kanang imahe ang mga kakaibang artifact na nagmula sa maling palagay na ang mga larawan ay sumusukat sa isang bagay tulad ng ilaw. Ang kanang ibaba ng imahe ay nagpapakita ng mas mahusay na resulta sa pamamagitan ng paggawa ng parehong bagay sa dami.)

Sa Ituturo na ito matututunan mo kung paano lubos na mapagbuti ang pagganap ng mga umiiral na imaging o mga sistema ng pang-unawa sa paningin sa pamamagitan ng paggamit ng isang napaka-simpleng konsepto: Quantimetric image sensing

Ang pagproseso ng Quantimetric na imahe ay lubos na nagpapabuti sa anuman sa mga sumusunod:

  • Umiiral na pagproseso ng imahe tulad ng pag-deblur ng imahe;
  • Pag-aaral ng makina, paningin sa computer, at pagkilala sa pattern;
  • Nakasuot ng pagkilala sa mukha (tingnan ang https://wearcam.org/vmp.pdf), paningin batay sa AI at HI, atbp.

Ang pangunahing ideya ay upang i-pre-proseso nang una at i-post ang proseso ng mga imahe, tulad ng sumusunod:

  1. Palawakin ang dinamikong saklaw ng imahe o mga imahe;
  2. Iproseso ang imahe o mga imahe tulad ng karaniwang gusto mo;
  3. I-compress ang dynamic na saklaw ng imahe o mga imahe (hal. I-undo ang hakbang 1).

Sa nakaraang Mga Tagubilin, itinuro ko ang ilang mga aspeto ng pag-sensing ng HDR (High Dynamic Range) at sensimetric sensing, hal. linearity, superposition, atbp.

Ngayon ay gamitin natin ang kaalamang ito upang magamit.

Kumuha ng anumang umiiral na proseso na nais mong gamitin. Ang halimbawang ipapakita ko ay deblurring ng imahe, ngunit maaari mo rin itong gamitin para sa anupaman.

Hakbang 1: Palawakin ang Dynamic na Saklaw ng Iyong Larawan o Mga Larawan

Palawakin ang Dynamic na Saklaw ng Iyong Larawan o Mga Larawan
Palawakin ang Dynamic na Saklaw ng Iyong Larawan o Mga Larawan
Palawakin ang Dynamic na Saklaw ng Iyong Larawan o Mga Larawan
Palawakin ang Dynamic na Saklaw ng Iyong Larawan o Mga Larawan

(Mga Larawan na inangkop mula sa "Intelligent Image Processing", John Wiley at Sons Interscience Series, Steve Mann, Nobyembre 2001)

Ang unang hakbang ay upang mapalawak ang pabago-bagong saklaw ng input na imahe.

Perpektong dapat mo munang matukoy ang pagpapaandar ng tugon ng camera, f, at pagkatapos ay ilapat ang kabaligtaran na tugon, f kabaligtaran, sa imahe.

Ang mga karaniwang camera ay nakaka-compress ng dynamic range, kaya karaniwang nais naming maglapat ng isang malawak na pagpapaandar.

Kung hindi mo alam ang paggana ng tugon, magsimula sa pamamagitan ng pagsubok ng isang bagay na simple tulad ng pag-load ng imahe sa isang hanay ng imahe, paglalagay ng mga variable sa isang uri ng data tulad ng (float) o (doble), at itaas ang bawat halaga ng pixel sa isang exponent, tulad, tulad ng, halimbawa, pag-square ng bawat halaga ng pixel.

Katwiran:

Bakit natin ginagawa ito?

Ang sagot ay ang karamihan sa mga camera ay pinipilit ang kanilang pabagu-bagong saklaw. Ang kadahilanang ginagawa nila ito ay ang karamihan sa display media ay nagpapalawak ng dynamic na saklaw. Ito ay medyo hindi sinasadya: ang dami ng ilaw na inilalabas ng isang cathode-ray tube display sa telebisyon ay halos katumbas ng boltahe na itinaas sa exponent ng 2.22 upang kapag ang input ng boltahe ng video ay halos kalahating paraan, ang dami ng ilaw na inilalabas ay marami mas mababa sa kalahati.

Ang Photographic media ay din malawak na saklaw ng malawak. Halimbawa, ang isang potograpikong "walang kinikilingan" kulay abong card ay nagpapalabas ng 18% ng ilaw ng insidente (hindi 50% ng ilaw ng insidente). Ang gaanong ilaw (18%) ay itinuturing na nasa gitna ng tugon. Kaya't nakikita mo, kung titingnan namin ang isang graph ng output bilang isang pag-andar ng pag-input, ang display media ay kumilos na para bang perpektong mga linear display na naglalaman ng isang dynamic range expander bago ang perpektong linear na tugon.

Sa tuktok na pigura, sa itaas, maaari mong makita ang display na naka-box sa isang may tuldok na linya, at ito ay katumbas ng pagkakaroon ng isang expander bago ang perpektong linear display.

Dahil ang mga display ay likas na malawak, ang mga camera ay kailangang idisenyo upang maging compressive upang ang mga imahe ay magmukhang maganda sa mga umiiral na display.

Noong unang panahon kung kailan may libu-libong mga nagpapakita ng telebisyon at isa lamang sa dalawa o mga istasyon ng pagsasahimpapaw (hal. Isa o dalawang mga telebisyon na kamera), mas madaling ayusin upang mailagay ang isang compressive nonlinearity sa camera kaysa maalala ang lahat ng telebisyon at maglagay ng isa sa bawat tatanggap ng telebisyon.

Sa hindi sinasadya nakatulong din ito sa pagbawas ng ingay. Sa audio tinawag namin itong "Dolby" ("companding") at iginawad ang isang patent para dito. Sa video nangyari ito nang hindi sinasadya. Iminungkahi ni Stockham na kunin namin ang logarithm ng mga imahe bago iproseso ang mga ito, at pagkatapos ay kunin ang antilog. Ang hindi niya namalayan ay ang karamihan sa mga camera at display ay nagagawa na ito nang hindi sinasadya. Sa halip, ang iminungkahi ko ay gawin namin ang eksaktong kabaligtaran ng iminungkahi ng Stockham. (Tingnan ang "Intelligence Image Processing", John Wiley at Sons Interscience Series, pahina 109-111.)

Sa mas mababang larawan, nakikita mo ang iminungkahing anti-homomorphic (dami) na pagproseso ng imahe, kung saan naidagdag namin ang hakbang ng pagpapalawak at pag-compress ng dynamic range.

Hakbang 2: Iproseso ang Mga Imahe, o Gawin ang Computer Vision, Machine Learning, o ang Tulad

Ang pangalawang hakbang, pagkatapos ng paglawak ng malawak na saklaw, ay ang pagproseso ng mga imahe.

Sa aking kaso, gumanap lamang ako ng isang deconvolution ng imahe, na may blur function, ibig sabihin, ang deblurring ng imahe, tulad ng karaniwang kilala sa naunang art.

Mayroong dalawang malawak na kategorya ng sensimetric na sensing ng imahe:

  • Pagtulong sa mga tao na makita;
  • Makita ng mga tumutulong machine.

Kung sinusubukan naming tulungan ang mga tao na makita (na kung saan ay ang halimbawa na ipinapakita ko rito), hindi pa kami tapos: kailangan nating ibalik ang naprosesong resulta sa loob ng photospace.

Kung tinutulungan namin ang mga makina na makita (hal. Pagkilala sa mukha), tapos na kami ngayon (hindi na kailangang magpatuloy sa hakbang 3).

Hakbang 3: Muling pagkompromiso ang Dynamic na Saklaw ng Resulta

Kapag nagtatrabaho kami sa pinalawak na hanay ng pabagu-bago, sinabi namin na nasa "lightspace" (dami ng mga imahe ng space).

Sa pagtatapos ng Hakbang 2, nasa lightspace kami, at kailangan naming bumalik sa namespace.

Kaya ang hakbang na ito 3 ay tungkol sa pagbabalik sa namespace.

Upang maisagawa ang hakbang 3, simpleng siksikin ang pabago-bagong saklaw ng output ng Hakbang 2.

Kung alam mo ang paggana ng tugon ng camera, ilapat lamang ito, upang makuha ang resulta, f (p (q)).

Kung hindi mo alam ang paggana ng tugon ng camera, maglagay lamang ng isang magandang hula.

Kung na-square mo ang mga pixel ng imahe sa hakbang 1, ngayon ang oras upang kunin ang parisukat na ugat ng bawat pixel ng imahe upang bumalik sa iyong hula hinggil sa puwang ng mga imahe.

Hakbang 4: Maaari Mong Subukan ang Ibang Iba Pang Mga Pagkakaiba-iba

Maaari Mong Subukan ang Ibang Iba Pang Mga Pagkakaiba-iba
Maaari Mong Subukan ang Ibang Iba Pang Mga Pagkakaiba-iba
Baka Gusto Mong Subukan ang Ibang Iba Pang Mga Pagkakaiba-iba
Baka Gusto Mong Subukan ang Ibang Iba Pang Mga Pagkakaiba-iba
Maaari Mong Subukan ang Ibang Iba Pang Mga Pagkakaiba-iba
Maaari Mong Subukan ang Ibang Iba Pang Mga Pagkakaiba-iba
Baka Gusto Mong Subukan ang Ibang Iba Pang Mga Pagkakaiba-iba
Baka Gusto Mong Subukan ang Ibang Iba Pang Mga Pagkakaiba-iba

Ang deblurring ay isa lamang sa maraming mga posibleng halimbawa. Isaalang-alang, halimbawa, ang pagsasama-sama ng maraming mga exposure.

Kumuha ng anumang dalawang larawan tulad ng dalawa sa itaas. Ang isa ay kinuha sa araw, at ang isa sa gabi.

Pagsamahin ang mga ito upang makagawa ng isang mala-takipsilim na larawan.

Kung i-average mo lang silang magkasama parang basura. Subukan mo ito mismo!

Ngunit kung palawakin mo muna ang dynamic range ng bawat imahe, pagkatapos ay idagdag ang mga ito, at pagkatapos ay i-compress ang dynamic range ng kabuuan, mukhang mahusay ito.

Paghambingin ang pagproseso ng imahe (pagdaragdag ng mga imahe) sa pagproseso ng dami ng laki (pagpapalawak, pagdaragdag, at pagkatapos ay pag-compress).

Maaari mong i-download ang aking code at higit pang halimbawang materyal mula dito:

Hakbang 5: Pupunta Dagdag: Ngayon Subukan Ito Sa Mga Composite ng HDR Image

Pagpunta sa Dagdag: Ngayon Subukan Ito Sa Mga Composite ng HDR Image
Pagpunta sa Dagdag: Ngayon Subukan Ito Sa Mga Composite ng HDR Image

(Itaas na imahe: Ang HDR welding helmet ay gumagamit ng pagproseso ng imahe ng dami ng laki para sa mga pinalawak na reality overlay. Tingnan ang Slashgear 2012 Setyembre 12.)

Sa buod:

kumuha ng isang imahe, at ilapat ang mga sumusunod na hakbang:

  1. palawakin ang dinamikong saklaw ng imahe;
  2. iproseso ang imahe;
  3. siksikin ang dinamikong saklaw ng resulta.

At kung nais mo ng isang mas mahusay na resulta, subukan ang sumusunod:

makunan ng isang pluralidad ng iba't ibang nakalantad na mga imahe;

  1. palawakin ang dinamikong saklaw sa lightspace, ayon sa aking nakaraang Instructable sa HDR;
  2. iproseso ang nagresultang quantimetric na imahe, q, sa lightspace;
  3. siksikin ang dinamikong saklaw sa pamamagitan ng tonemap.

Magsaya at mangyaring i-click ang "Ginawa ko ito" at i-post ang iyong mga resulta, at magiging masaya akong magbigay ng puna o magbigay ng ilang nakabubuo na tulong.