AI Ordliste: Billeder og Video

Diffusion Model

En type AI-model der genererer billeder ved gradvist at forbedre tilfældig støj til meningsfuldt indhold. Disse modeller lærer at fjerne støj trin for trin, indtil et klart billede fremkommer, baseret på tekstbeskrivelser eller andre inputs.

Eksempel: Stable Diffusion og DALL-E bruger diffusionsmodeller til at skabe fotorealistiske billeder ud fra tekstbeskrivelser som "en futuristisk by med flyvende biler i solnedgang".

Generative Adversarial Network (GAN)

Et AI-system bestående af to konkurrerende netværk: en generator, der skaber indhold, og en diskriminator, der bedømmer om indholdet ser ægte ud. Gennem denne "konkurrence" lærer GAN'en at skabe stadigt mere realistiske billeder.

Eksempel: StyleGAN kan skabe fotorealistiske ansigter af personer, der ikke eksisterer, med naturlige detaljer som rynker, hår og hudtekstur.

Prompt-to-Image

Teknikken hvor en tekstbeskrivelse (prompt) omdannes til et billede af en AI. Kvaliteten af det genererede billede afhænger i høj grad af promptens detaljer, nøjagtighed og kreative anvisninger.

Eksempel: Med prompten "En detaljeret cyberpunk scene af København i år 2100, med neonlys, flyvende droner og hologrammer, digital art stil" kan en AI generere en futuristisk byvisning.

Image-to-Image

En AI-teknik hvor et eksisterende billede transformeres baseret på tekstanvisninger eller andre billedstile. Dette giver mulighed for at ændre specifikke aspekter af et billede eller anvendelse af nye stilarter.

Eksempel: Et foto af et hus kan transformeres til at se ud som et maleri af Van Gogh, eller en dagscene kan ændres til en natscene med samme komposition.

Inpainting

Teknik hvor AI udfylder eller erstatter manglende eller markerede dele af et billede baseret på den omkringliggende kontekst og brugeranvisninger. Bruges ofte til billedredigering eller fjernelse af uønskede elementer.

Eksempel: En fotograf kan markere en fremmed person i baggrunden af et billede, og AI'en vil erstatte personen med en realistisk fortsættelse af baggrunden.

Neural Style Transfer

En AI-teknik der anvender stilen fra ét billede (f.eks. et berømt kunstværk) på indholdet af et andet billede, mens strukturen og kompositionen bevares. Dette skaber et nyt billede, der kombinerer begge elementer.

Eksempel: Et almindeligt portræt kan transformeres til at have samme maleriske stil som Edvard Munchs "Skriget", mens ansigtets struktur og udtryk bevares.

Computer Vision

Feltet inden for AI, der giver computere evnen til at "se" og forstå indholdet af digitale billeder og videoer. Computer vision-systemer kan identificere objekter, ansigter, tekst, aktiviteter og meget mere i visuelle medier.

Eksempel: Et computer vision-system kan analysere overvågningsvideo fra en butik for at tælle kunder, spore bevægelsesmønstre og identificere potentielle sikkerhedsproblemer.

Deepfake

Syntetiske medier hvor en persons ansigt eller stemme realistisk erstattes med en andens ved hjælp af AI-teknikker. Kan bruges både kreativt og til misinformation, hvilket rejser etiske bekymringer.

Eksempel: En deepfake-video kan få det til at se ud som om en politiker siger noget, de aldrig har sagt, eller placere en skuespiller i en filmscene, de aldrig har indspillet.

Video Diffusion Model

En udvidelse af diffusionsmodeller til videogenerering, hvor AI ikke kun skaber enkelte billeder, men sammenhængende sekvenser af billeder der bevæger sig naturligt over tid baseret på tekstbeskrivelser.

Eksempel: Med prompten "En tidsforkortelse af en blomst, der åbner sine kronblade i solskin" kan en video diffusion model skabe en kort realistisk videosekvens af denne process.

Image Segmentation

Processen hvor et billede opdeles i forskellige segmenter for at identificere og isolere specifikke objekter eller regioner. Dette muliggør præcis analyse og manipulation af billedets forskellige elementer.

Eksempel: I et medicinsk billede kan image segmentation bruges til at isolere og fremhæve en tumor fra det omkringliggende væv, så læger kan måle dens præcise størrelse og form.