Linser og optiske grundbegreber

PDF
Print
E-mail

Introduktion

En afgørende faktor for opnåelse af et robust MachineVision-system udgøres af billedkvaliteten. Derfor beror MachineVision-systemets funktionalitet, i høj grad, på valget og sammensætningen af afbildningssystemet - det vil sige hardwarekomponenterne; kamera og linse. Her gennemgås de fundamentale teorier og parametre, der ligger til grund for linser. Hovedformål hermed er at give overblik over samt skabe forståelse for forskellige linsetypers styrker og svagheder, således en hensigtsmæssig linse kan vælges til en given MachineVision-applikation. Desuden fokuseres på billedkvalitet, generelt.

 

Indhold

  • Indledning
  • Billedkvalitet
  • Fundamental linseteori
  • Linsetyper
  • Grænseflader

 

Indledning

Informationen, der opsamles af et MachineVision-system, passerer altid gennem en linse. Et fornuftigt valg af linse medvirker derfor til opnåelse af en tilfredsstillende billedkvalitet, hvorved den efterfølgende billedprocessering forenkles. En kameralinse består af et linsesystem samt en eller flere lukkemekanismer. Linsesystemet og lukkemekanismerne kontrollerer lysmængden, der tillades passage til kameraets afbildningssensor samt dybdeskarpheden - jævnfør figur 1. Har linsen en lille irisblænde, opnås stor dybdeskarphed, men samtidig medfører dette uønskede forvrængningseffekter. Derfor er linsevalget, i høj grad, applikationsafhængigt.

Afbildningssystemets fundamentale parametre
Indledningsvist er det hensigtsmæssigt at definere en række fundamentale optiske begreber, således der opnås generel forståelse for afbildningens væsentlige aspekter. De fundamentale begreber, der anvendes, er forklaret i nedenstående punktopstilling samt fremvist grafisk på figur 1.

  • Synsfelt, eller field-of-view (FOV), er det objektområde, der opfanges af linsen og som således projiceres ind på kameraets afbildningssensor.
  • Arbejdsafstand, eller working-distance (WD), er afstanden fra linsens front til det inspicerede emne.
  • Dybdeskarphed, eller depth-of-field (DOF), er den største afstandsdifferens, hvorunder afbildningssystemet er i stand til at holde emnet i fokus.
  • Sensorstørrelse er størrelsen af kamerasensorens aktive areal - typisk angivet som en horisontal dimension eller diameter.

 

 

Billedkvalitet

I og med billedkvaliteten er altafgørende for opnåelse af et robust MachineVision-system, er det essentielt at kende til parametrene, der har betydning herfor, og således opnå forståelse for de tilgængelige indstillingsmuligheder. Ofte forbindes et billedes kvalitet, fejlagtigt, alene med dets opløsning(er), til trods for at flere forskellige og indbyrdes afhængige faktorer øver indflydelse herpå - jævnfør figur 2. Der fokuseres herpå i det følgende.

 

1. Opløsninger

Ofte anvendes blot betegnelsen opløsning, når der tales om billedkvalitet. Denne betegnelse er imidlertid ukoncis, idet der eksisterer flere forskellige typer heraf, som enten er relateret til billedets generelle opløsning, emnet, der ønskes inspiceret eller den specifikke feature, som ønskes fastlagt. Generelt forefindes fem forskellige opløsningstyper indenfor MachineVision:

  • Billedopløsning
  • Rumlig opløsning
  • Featureopløsning
  • Målingsopløsning
  • Pixelopløsning

Billedopløsning (O_b)
Billedopløsningen udtrykker antallet af pixels i billedets horisontale og vertikale retning, og bestemmes af afbildningssensoren for digitale kameraer, men af framegrabberen, hvis der er tale om analoge kameraer. Typisk anvendes et billedformat på 4:3 for kameraer, eksempelvis 1024x768 pixels. Indenfor MachineVision eksisterer imidlertid andre billedformater end 4:3, idet disse, i visse tilfælde, er at foretrække - eksempelvis i form af et kvadratisk billedfelt.

Rumlig opløsning (O_r)
Rumlig opløsning udtrykker mappingen fra den virkelige verden til pixels på kameraets afbildningssensor. På denne måde sker en direkte kortlægning af virkelige objekter i forhold til sensoropløsningen, hvorfor der er tale om målinger i enheden mm pixel. For en given billedopløsning, afhænger den rumlige opløsning af synsfeltet samt forstørrelsen gennem kameraets objektiv.

Featureopløsning (O_f )
Featureopløsning er et udtryk for den mindste feature, som afbildningssystemet, pålideligt, kan afbilde. Selvom der kan forekomme objekter i et billede, der er mindre end én pixels udstrækning, er dets tilsynekomst upålidelig. I og med kameraer og framegrabbere udgør sampleudstyr, da pixels er sampledata, gælder Shannon’s Samplingssætning, der fremsiger, at der kræves mindst to pixels for at repræsentere et objekt i et billede. I og med praktisk anvendelig teknologi sjældent når de teoretiske grænser, siger en tommelfingerregel, at det er fornuftigt, at den mindste feature udspændes af minimum tre pixels. En udspænding af den mindste feature på tre pixels
kræver imidlertid både et højt kontrastforhold og et lavt støjniveau.

Målingsopløsning (O_m)
Målingsopløsningen specificerer den mindste detalje, som kan måles, dette i en fysisk enhed. Der er således tale om den mindste ændring i et objekts størrelse eller lokation, der kan detekteres og dermed måles. Målingsopløsningen er afhængig af den anvendte softwares og de benyttede billedprocesseringsalgoritmers evne til at beregne subpixels - det vil sige, hvor nøjagtigt subpixels kan beregnes ud fra de eksisterende pixels i billedet.

Pixelopløsning (O_p)
Pixelopløsningen udtrykker antallet af gråtoneværdier eller farver, der er repræsenteret i en pixel. Pixelopløsningen er afhængig af A/D-omsætteren, der enten sidder på kameraet eller framegrabberen. Indenfor monokrome MachineVision-systemer anvendes, almindeligvis, 8 bits per pixel, hvilket tilsvarer 256 gråtoneværdier. Farvesystemer anvender, typisk, 8 bits for hver af de tre primærfarver - rød, grøn og blå - tilsvarende et total på 16.777.216 tilgængelige farver.

 

2. Kontrast

Et billedes kontrast er et udtryk for, hvor mange detaljer, der kan ses, og er således, i høj grad, afhængig af valget af afbildningskomponenter. Opnåelse af en passende kontrast mellem testemnet og baggrunden er dimensionerende for MachineVision-systemets robusthed, og udgør ofte det egentlige formål med udvælgelsen og sammensætningen af de forskellige hardwarekomponenter. Desuden bidrager en hensigtsmæssig kontrast til, at den efterfølgende billedprocessering simplificeres. Jo højere kontrast billedet besidder, des bedre og således mere pålidelige resultater kan der opnås - som tommelfingerregel. Der forefindes dog ikke faste regler for, hvilken kontrast, der anbefales, idet dette, i høj grad, afhænger af de anvendte billedprocesseringsalgoritmer.

På figur 3 ses en illustration af kontrastens betydning for et billedes kvalitet. Det bør her bemærkes, at en processeringsenhed, eksempelvis en computer, i princippet, har mulighed for at processere alle tre billeder på figur 3 ens. Dog indbefatter den praktiske anvendelse af billedprocesseringsalgoritmer ofte menneskelig indblanding, eksempelvis i form af objektudvælgelse, hvorfor lavkontrast billeder bør undgås, så vidt det er muligt.


Fig. 3 : Kontrastens betydning for billedkvaliteten

  

3. Intensitet

Intensiteten udtrykker, i denne sammenhæng, billedets lysforhold. Et højintenst billede er lyst, mens et lavintenst billede fremstår mørkt - jævnfør figur 4. Intensiteten kan kontrolleres, hardwaremæssigt set, på følgende tre måder:

  • Justering af de anvendte lyskilders farve og/eller intensitet
  • Indstilling af kameraets eksponeringstid og/eller lukker
  • Justering af linsens irisblænde


Fig. 4 : Illustration af intensitetens betydning for billedkvaliteten

  

4. Fokus

Fokus er et udtryk for billedets skarphed, hvilket udelukkende kontrolleres af den valgte linse - dette i form af forskydning af dennes fokalpunkt - jævnfør afsnit omkring fundamental linseteori. Eksempler på henholdsvis et fokuseret og et uskarpt billede ses på figur 5. Indenfor MachineVision er det essentielt, at områder af interesse forefindes indenfor billedets fokuserede del(e), idet den erhvervede information ellers er upålidelig.


Fig. 5 : Illustration af fokuseringens betydning for et billede

  

5. Dybdeskarphed

I forlængelse af beskrivelsen af fokusaspektet er det naturligt at behandle begrebet dybdeskarphed. Dybdeskarpheden er et udtryk for linsens evne til at give en tilfredsstillende billedkvalitet, på trods af, at emnet befinder sig tættere på eller længere fra den optimale fokusafstand. Reelt set forefindes kun én afstand, hvor emnet er defineret til at være i fokus. Bevæges objektet ud af dette fokusfelt, forringes billedkvaliteten, idet billedet bliver uskarpt - jævnfør figur 6.


Fig. 6 : Illustration af fænomenet dybdeskarphed

Hvis de inspicerede emner befinder sig udenfor arbejdsafstanden, forringes både opløsningen og kontrasten. Derfor giver det kun mening at omtale dybdeskarphed, hvis denne er defineret i sammenhæng med en korresponderende opløsning og kontrast.

6. Forvrængning

Forvrængning er konkret set en optisk fejl i linsen, som medfører, at dele af det inspicerede objekt forstørres eller formindskes forkert i billedgengivelsen. Herudover bliver objektets elementer malplacerede i forhold til billedets centrum - jævnfør figur 7 Denne fejlplacering, af objektets elementer, betyder, at koordinaterne, som sendes til eksempelvis en robot, afviger fra de faktiske. Desuden gør forvrængningen det umuligt at foretage nøjagtige målinger ved billedets ydre kanter. Som følge heraf udgør forvrængning en yderst kritisk faktor indenfor MachineVision-applikationer, hvorfor det ofte er nødvendigt at kompensere herfor ved hjælp af kalibrering - typisk via den benyttede software. På figur 7 ses to typiske forvrængninger - tønde og pude - der kan optræde i et billede.


Fig. 7 : To forskellige typer af forvrængning

Tøndeforvrængning får billedet til at fremstå udadbøjet, mens pudeforvrængning har den modsatte effekt, hvilket betyder, at billedet fremstår indadbøjet omkring midten.
Betydningen af tøndeforvrængning er vistpå figur 8, hvor to rektangler, der i virkeligheden er lige store, er markeret. Arealerne måles imidlertid ikke til samme værdi, som følge af den tilstedeværende forvrængning. Da der er tale om tøndeforvrængning, er arealet af rektangel 2 mindre end arealet af rektangel 1, da dette er placeret længst fra billedets centrum.


Fig. 8 : Eksempel på tøndeforvrængningens praktiske betydning

7. Perspektiv

Perspektiv er det fænomen, som gør, at objekter, der er tæt på øjet, virker større, end objekter som er længere herfra. Fænomenet forekommer ligeledes indenfor afbildningssystemer, hvor forstørrelsen af objekter ændres med afstand fra linse og kamera - jævnfør figur 9.
Indenfor MachineVision-systemer, hvor der forekommer forskellige arbejdsafstande, på grund af emners forskellige orienteringer eller bevægelser relativt til linsen, kan perspektivfejl give markante problemer. Billedprocesseringen kan imidlertid simplificeres, hvis der foretages kompensering herfor via anvendelse af speciallinser - eksempelvis telecentriske linser - som beskrives senere under linsetyper. Dette mindsker desuden behovet for udførelse af kalibrering.


Fig. 9 : Illustation af perspektivfejl

  

Fundamental linseteori

Kortlæggelse af linsens funktion og virkemåde tager, typisk, udgangspunkt i den såkaldte "Thin Lens Model". Modellen forudsætter, at afstanden til objektet er mindst ti gange så stor som linsens fokallængde, hvilket ofte er tilfældet indenfor MachineVision-applikationer, hvorfor modellen vurderes gangbar.
Under opstilling og beskrivelse af modellen redegøres for centrale begreber og problemstillinger, der relaterer sig til linser, generelt. Hvis ikke tynde linser antages, kompliceres modellen, og dermed de matematiske udtryk, hurtigt, idet der således skal tages højde for ikke-konsistente forhold omkring lysets brydning. Det umiddelbare fokus, i den kommende gennemgang, lægges på aspekter, som har væsentlig betydning, når der skal vælges linse i relation til MachineVision-applikationer.


Definitioner

Indenfor MachineVision opfattes optik som lysstråler, der brydes og ændrer retning, når de rammer linsen. Den såkaldte "Chief"-linje, jævnfør figur 10, er en ret linje fra et inspiceret objektpunkt, gennem linsens centrum, til et korresponderende punkt på kameraets afbildningssensor. Alle andre stråler, der stammer fra dette objektpunkt, vil under brydningen i linsen, mødes i samme punkt, som "Chief"-linjen rammer afbildningssensoren. Lysstråler, som brydes ved linsens kanter, kaldes marginallinjer. Om disse rent faktisk afbildes, afhænger af synsfeltet, hvorfor der skal være fornuftig overensstemmelse mellem linsen og kameraets afbildningssensor, hvis marginallinjerne
ønskes afbilledet.

 

 


Fig. 10 : Illustation af perspektivfejl

Afstanden fra objektplanet til linsens centerlinje kaldes objektafstanden (L1), mens afstanden fra linsens centerlinje til kameraplanet benævnes billedafstanden (L2). Objekt- og billedafstanden samt fokallængden (FL) forbindes gennem relationen, der er opstillet i nedenstående formel.

 

Definition af og sammenhæng mellem fokallængde og forstørrelse

Fokallængden, også kaldet brændvidden, er et mål for det optiske systems evne til at fokusere og splitte lysstråler. Fokallængden er afstanden fra linsens centrum til det punkt, hvor de brudte lysstråler fra emnet mødes, bag linsen - jævnfør figur 10 til højre.
På figur 10 forefindes et emne af størrelsen y, der ses gennem en linse, hvorved emnets størrelse ændres til y’ på afbildningssensoren - som følge af lysets gennemgang af og brydning i linsen. Forholdet mellem y’ og y udtrykker den såkaldte forstørrelsesfaktor, β, der kan bestemmes ud fra
det opstillede udtryk i nedenstående formel.

 

Som formelen viser, udgør kameraets sensorstørrelse en central parameter, når linsens krævede forstørrelse skal specificeres - dette med henblik på understøttelse af det ønskede synsfelt. I praksis beregnes forstørrelsesfaktoren derfor som forholdet mellem synsfeltets (FOV) og afbildningssensorens horisontale dimension. Linsefabrikanter refererer ofte til forstørrelsen som enten MAG eller PMAG - den egentlige betydning heraf er fremvist på figur 11.

 


Fig. 11 : Forstørrelsesfaktorens betydning

Den nødvendige størrelse af PMAG-faktoren er applikationsafhængig, idet den kan relateres til den pågældende emnestørrelse og anvendte arbejdsafstand. Eksempelvis bør der vælges; PMAG>1, hvis der udelukkende ønskes kontrol af en given detalje, som forefindes på en kendt lokation. Ud fra ovenstående betragtninger, omkring forstørrelsesfaktoren, er det muligt at opstille et udtryk til beregning af fokallængden - jævnfør nedenstående formel.

Som standard fremstilles linser med fokallængder på henholdsvis; 8, 16, 25, 35 og 50 mm. Jo større fokallængde linsen har, des større forstørrelse er mulig. Disse aspekter behandles i yderligere afsnittet vedrørende linsetyper.

Dybdeskarphedsfysik
Dybdeskarpheden, DOF, er allerede blevet defineret i det indledende afsnit, men i det følgende fokuseres på de fysiske aspekter, der ligger til grund for, at billedforstyrrelser forekommer som følge heraf. Det generelle princip er skitseret på figur 12, hvor kameraets afbildningssensor fokuserer på et punkt, der ligger i en afstand L1 fra linsens centerakse. Denne fokusering resulterer i, at punkterne g_l og g_r, som befinder sig henholdsvis længere fra og tættere på sensoren, bliver ufokuserede cirkler.


Fig. 12 : DOF indflydelse på billedkvalitet

Hvis de to cirklers diametre er mindre end udstrækningen af én pixel, står det resulterende billede skarpt for punkter, der befinder sig i intervallet [(g + g_l) ; (g − g_r)]. Dybdeskarpheden kan derfor, i dette tilfælde, beregnes ud fra følgende formel.

DOF = (L1 + g_l) − (L1 − g_r) = g_l + g_r

Irisblænde
Dybdeskarpheden er desuden afhængig af linsens irisblænde, der er bestemmende for, hvor meget lys der lukkes gennem linsen og således ind til kameraets afbildningssensor. En lille irisblænde forøger dybdeskarpheden, mens en større formindsker denne. Et eksempel på praktisk anvendelse heraf er, når fotografer tager portrætfotografier. I sådanne tilfælde anvendes linser med en stor irisblænde, idet dette bevirker, at personens ansigt kommer i fokus, mens baggrunden bliver uskarp. Dette kan desuden relateres direkte til forskellige typer af MachineVision-applikationer.


F-stop-nummer
Åbningen af linsens irisblænde måles i antal f-stop-numre, k, der udgør en indstillelig størrelse på linsen. Matematisk set defineres f-stop-nummeret som i formelen nedenfor.

 

, hvor FL er fokallængden og R den effektive radius af iris. For tynde linser er R lig radius af linsen.

Jo mindre f-stop-nummer, der vælges, des mere lys tillades passage til kamerasensoren, hvilket giver ringe dybdeskarphedsegenskaber. Hvis der ønskes god dybdeskarphed, skal linsen indstilles til et højt f-stop-nummer. Dette kræver imidlertid, at der anvendes højintens belysning eller høj eksponeringstid, hvis brugbare billeder ønskes opnået.


Beregningsanvendeligt udtryk
Ud fra ovenstående er det muligt at opstille et andet beregningsudtryk for dybdeskarpheden, end det præsenterede i formel for beregning af DOF, dette via anvendelse af fokallængden og f-stop-nummeret.

 

Hvis den krævede dybdeskarphed til en given MachineVision-opgave kendes, kan der via omarrangering af formelen, isoleres forskellige væsentlige faktorer, der sikrer, at den nødvendige dybdeskarphed realiseres. Eksempelvis er det muligt at finde ud af, hvilket f-stop-nummer, der bør anvendes, hvilket kan være dimensionerende for linsevalget.

 

Linsetyper

Kameralinser, der anvendes indenfor MachineVision, opdeles typisk i følgende fire hovedkategorier:

  • Normal
  • Telecentrisk
  • Vidvinkel
  • Zoom

I det følgende fokuseres på egenskaberne og anvendelsesområderne for de forskellige linsetyper.


Normallinser

Normallinser genererer billeder, som besidder naturligt perspektiv - det vil sige, at objekter, som befinder sig tæt på linsen, fremstår større, end objekter, der befinder sig længere væk. Altså producerer normallinser billeder med stor forstørrelse, når objekterne er tæt på linsen. En umiddelbar fordel ved normallinser er, at de besidder stor blændeåbning, hvilket giver mulighed for billederhvervelse under mange forskellige lysforhold, som følge af variabelt f-stop.


Telecentriske linser

Telecentriske linser er i stand til at foretage optisk kompensering for perspektivfejl, hvorved emner opfattes som værende af samme størrelse, indenfor en hvis afstand til linsen. For det samme synsfelt, medfører en stor fokallængde mindre forstørrelsesændringer, hvorfor en telecentrisk linse opfører sig som om, at den har en uendelig fokallængde. Et objekt, der flyttes frem og tilbage kommer ind og ud af fokus, men dets størrelse i billedet forbliver den samme. Indenfor dybdeskarphedsområdet, giver telecentriske linser ingen forstørrelsesfejl, hvilket gør kalibreringen mindre kompleks.
Indenfor MachineVision er telecentriske linser ideelle i henhold til måleapplikationer som følge af ovenstående. I og med telecentriske linser fremviser hele synsfeltet fra samme perspektivvinkel, opnås at bunden af huller kan ses, uanset deres position indenfor synsfeltet. Problemet med brugen af telecentriske linser, indenfor MachineVision-applikationer, er imidlertid, at emnet, ikke må være større end frontlinsens diameter.


Vidvinkellinser

Vidvinkellinser anvendes typisk, når der ønskes en udvidelse af synsfeltet. For at opnå en større synsvinkel skal linsens centrum være tættere på afbildningssensoren, hvorfor vidvinkellinser har korte fokallængder. Ud over at give en bredere vinkel, er billedet produceret af en vidvinkellinse mere udsat for perspektivfejl samt tøndeforvrængning. Dette skyldes primært, at de ofte placeres markant tættere på det inspicerede objekt.
Vidvinkellinser bør udelukkende anvendes i relation til MachineVision-applikationer, hvis der er tale om detekteringsopgaver - eksempelvis pick-and-place-operationer.


Zoomlinser

Zoomlinser er en mekanisk samling af linseelementer, der giver mulighed for variation af linsens fokallængde, og dermed synsvinkel - dette i modsætning til almindelige linser, der har én fikseret fokallængde. Førnævnte giver mulighed for zoom.
Indenfor MachineVision er zoom-linser anvendelige i henhold til prototypefremstilling, hvor den krævede fokallængde endnu ikke er bestemt, idet de kan sættes til en arbitrær fokallængde. Zoomlinser er større, mindre robuste, dyrere og har smallere åbningsmuligheder end tilsvarende linser med fikserede fokallængder. Desuden har de ofte tendens til markant forvrængning.


Umiddelbare udvælgelseskriterier

Afhængigt af hvilket afbildningssystem der er tale om, skal forskellige linser, filtre og frontlinser anvendes. Dette er vigtigt at holde sig for øje, når afbildningssystemet sammensættes. En tommelfingerregel er, at linsen, som minimum, bør være større end kameraets afbildningssensor, således kanten af irisblænden ikke afbildes.

 

Grænseflader

I og med MachineVision-kameraer typisk forhandles uden linse(r), er det nødvendigt at være opmærksom på grænsefladen mellem linse og kamera. Den overvejende del af MachineVisionkameraer understøtter enten C- eller CS-mount, som er vist på figur 13.


Fig. 13 : Fremvisning af C- og CS-mount-linser.

Til trods for at de to typer, reelt set, benytter samme fatning, kan samme linse ikke umiddelbart benyttes indenfor begge fatningstyper. Dette skyldes, at en C-mount-linse (Cine mount) danner et fokalplan 17,5 mm bag kameraets flange, mens en CS-mount-linse (Cine Short mount) danner fokalplanet 12,5 mm bag flangen - jævnfør figur 13. Det er imidlertid muligt at benytte en C-mount-linse i et CS-mount-kamera. Dette kræver blot anvendelse af en relativt simpel adapterløsning - i form af en spacer-ring. Derimod er det ikke muligt at anvende en CS-mount-linse i et C-mount-kamera.

Kilder:

A. Erhardt Ferron. Theory and applications of Digital Image Processing. University of applied Sciences Offenburg, 1st edition, 2000.
Alexander Hornberg. Handbook of Machine Vision. Wiley-WCH, 1st edition, 2006.
Howard E. Burdick. Digital Imaging - theory and applications. McGraw-Hill, 1st edition, 1997.
Thomas Baltzer Moeslund Lektor ved Institut for Medieteknologi og Ingeniørvidenskab.
Rafael C. Gonzalez and Richard E. Woods. Digital Image Processing. Prentice Hall, 2nd edition, 2002.
http://www.wikipedia.org/ - wikipedia; the free encyclopedia.
Bruce G. Batchelor and Frederick Waltz. Intelligent Machine Vision - Techniques, Implementations and Applications. Springer, 1st edition, 2001.
http://www.mellesgriot.com/pdf/catalogx/x_14_6-15.pdf - mellesgriot- the practical application of light.
Thomas Baltzer Moeslund. Powerpointslides fra kurset "MachineVision", 6. semester på VT-linjen. 2006.
http://www.1394imaging.com - the imaging source - basic optics.