Kako AI generira slike iz teksta?

AI koristi difuzijske modele koji počinju od nasumičnog šuma i iterativno "uklanjaju šum" predviđajući piksele na temelju naučenih matematičkih odnosa između riječi i vizualnih obrazaca. Proces ne kopira postojeće slike, već generira svaki piksel iznova.

Smije li se u Hrvatskoj komercijalno koristiti AI-generirane slike?

Da, ali uz ograničenja. Potpuno AI-generirane slike nisu zaštićene autorskim pravom u Hrvatskoj i padaju u javnu domenu. Međutim, morate provjeriti uvjete korištenja platforme (npr. Midjourney zahtijeva pretplatu za komercijalnu upotrebu) i poštovati EU AI Act koji zahtijeva označavanje AI sadržaja.

Koliko košta DALL-E 3 u Hrvatskoj?

DALL-E 3 je dostupan kroz ChatGPT Plus pretplatu koja košta približno €22 – €24 mjesečno u Hrvatskoj (uključujući 25% PDV). Alternativno, možete koristiti besplatnu verziju putem Microsoft Bing Image Creatora s ograničenjem od 15 brzih slika dnevno.

Što je EU AI Act i kako utječe na text-to-image alate?

EU AI Act je europska regulativa koja kategorizira AI sustave prema riziku. Text-to-image alati moraju biti transparentni o trening podacima, obavezno označavati AI-generirani sadržaj i poštovati autorska prava. Kršenje može rezultirati novčanim kaznama do 35 milijuna EUR ili 7% globalnog godišnjeg prometa.

Može li AI generirati slike u stilu poznatih hrvatskih umjetnika?

Tehnički može, ali većina platformi (DALL-E 3, Adobe Firefly) blokira zahtjeve koji specificiraju imena živih umjetnika radi zaštite intelektualnog vlasništva. Međutim, možete koristiti generičke stilske opise poput "impresionizam", "nadrealizam" ili "mediteranski realizam" bez spominjanja konkretnih imena.

Kako AI stvara realistične slike iz tekstualnih uputa: Tehnologija, zakoni i cijene

Što je text-to-image AI i kako funkcionira

Text-to-image umjetna inteligencija omogućava stvaranje potpuno novih, realističnih slika iz jednostavnih tekstualnih uputa. Za razliku od uvriježenog mišljenja, AI ne "kolaža" postojeće fotografije s interneta, već generira svaki piksel iznova koristeći difuzijske modele.

Kada hrvatski korisnik upiše upit poput "zalazak sunca nad Jadranskim morem", AI ne pretražuje bazu slika. Umjesto toga, proces počinje od potpuno nasumičnog statičkog šuma (Gaussian noise). Model je tijekom treninga naučio matematičke odnose između riječi i vizualnih obrazaca - oblika, boja, tekstura, kompozicija. Iterativno, korak po korak, AI "uklanja šum" predviđajući i generirajući nove piksele dok se ne formira koherentna slika. Ovaj proces zasnovan je na difuzijskim modelima poput Stable Diffusion, DALL-E 3 ili Midjourney, koji su revolucionirali industriju vizualnog sadržaja.

Prema podacima tržišnih analiza, globalno tržište AI generatora slika vrijedi oko 3,16 milijardi USD u 2025. godini, s projektiranom godišnjom stopom rasta od preko 32% do 2035. godine. Platforme poput Midjourneya imaju više od 10 milijuna aktivnih korisnika koji svakodnevno generiraju preko 500 milijuna slika. Ovaj eksplozivan rast potvrđuje da text-to-image AI nije prolazni trend, već temeljna tehnologija koja mijenja način stvaranja vizualnog sadržaja.

Najčešća zabluda: AI ne "krade" slike s interneta

Najraširenija javna zabuna jest da AI izrezuje i slaže djeliće postojećih fotografija s interneta u novu sliku - kao digitalni kolaž. To je fundamentalno netočno.

Difuzijski modeli ne pohranjuju niti jednu sliku iz trening skupa podataka. Umjesto toga, tijekom treninga (koji traje tjednima na superračunalima), AI uči apstraktne statističke obrasce - kako se određeni objekti, svjetlost, perspektiva ili stil manifestiraju kroz piksele. Kada generirate sliku, svaki piksel se računa iznova, a rezultat je matematički jedinstven. To je sličnije tome kako slikar koji je proučavao tisuće pejzaža može naslikati novo more iz mašte, bez da kopira bilo koju konkretnu fotografiju.

Ova distinkcija je ključna za razumijevanje autorskih prava. AI ne krši copyright izravnim kopiranjem, ali etička pitanja ostaju: je li fer trenirati model na milijunima slika bez izričite dozvole autora? Prema istraživanju objavljenom 2025. godine, otkrivanje korištenja generativne AI dosljedno smanjuje povjerenje publike, bez obzira na kontekst. Umjesto skrivanja AI alata iz straha, stručnjaci pozivaju na normalizaciju AI-a kao legitimnog profesionalnog sredstva uz jasnu transparentnost.

EU AI Act i hrvatska regulativa: Što smijete, a što ne

Hrvatska, kao članica EU, primjenjuje EU AI Act - najstrožu svjetsku regulativu za umjetnu inteligenciju. Ovaj zakon obavezuje transparentnost i zaštitu autorskih prava u generativnoj AI.

EU AI Act (dostupan na artificialintelligenceact.eu) kategorizira AI sustave prema riziku. Text-to-image alati spadaju u kategoriju "visokog rizika" kada se koriste za stvaranje deepfake sadržaja, dezinformacija ili manipulaciju javnim mnijenjem. Zakon zahtijeva:

Obavezno označavanje: Sve AI-generirane slike moraju biti jasno označene kao takve, posebno ako su fotorealističke ili prikazuju osobe.
Transparentnost trening podataka: Pružatelji AI usluga (OpenAI, Midjourney, Google) moraju objaviti sažetke podataka korištenih za trening modela.
Zaštita autorskih prava: Modeli ne smiju kršiti EU zakonodavstvo o intelektualnom vlasništvu.

U Hrvatskoj, autorsko pravo regulira Zakon o autorskom pravu i srodnim pravima (Narodne novine). Ključna odredba: autorstvo je vezano isključivo za ljudsku kreativnost. Potpuno AI-generirane slike ne mogu biti zaštićene autorskim pravom i padaju u javnu domenu. Međutim, ako čovjek može dokazati značajan kreativni doprinos - kompleksno prompt inženjerstvo kombinirano s opsežnom ručnom naknadnom obradom u alatima poput Photoshopa - konačni rad može biti zaštićen.

Prema stajalištu OECD AI Policy (oecd.ai), transparentnost je ključna jer su ovi modeli trenirani na ogromnim, nestrukturiranim skupovima podataka s interneta. Njihovi procesi donošenja odluka mogu biti neprozirni, što zahtijeva jasno upravljanje podacima i transparentnost kako bi se izgradilo javno povjerenje i ublažile algoritamske pristranosti.

Kako Google, OpenAI i Adobe rješavaju problem deepfakeova

Vodeći proizvođači AI alata uvode tehnološke zaštite protiv zloupotrebe: digitalne vodene žigove, blokiranje poznatih osoba i trening na licenciranim podacima.

Google Imagen 3 i SynthID vodeni žig

Prema Google AI Blogu, borba protiv vizualne dezinformacije je kritični prioritet. Googleov najnoviji model, Imagen 3, ugrađuje nevidljivi digitalni vodeni žig nazvan SynthID u sve generirane slike. Ovaj žig trajno identificira sliku kao AI-generiranu čak i ako je obrezana, komprimirana ili editirana. SynthID je kriptografski otporan i omogućava provjeru autentičnosti bez vidljivog utjecaja na estetiku slike.

OpenAI DALL-E 3 i blokiranje stilova živih umjetnika

OpenAI je u službenom blogu istaknuo da DALL-E 3 ima ugrađene sigurnosne mehanizme. Model je programiran da odbije zahtjeve koji traže slike u stilu živih umjetnika ili specificiraju imena javnih osoba. Na primjer, ako unesete "slika u stilu Banksy" ili "portret Kolinde Grabar-Kitarović", DALL-E 3 će odbiti generirati sliku kako bi zaštitio intelektualno vlasništvo i spriječio štetne deepfakeove.

Adobe Firefly: Komercijalnosigurna AI

Adobe Firefly je jedinstven jer je treniran isključivo na licenciranim slikama iz Adobe Stock biblioteke i javno dostupnim sadržajima čija su autorska prava istekla. To ga čini najsigurnijom opcijom za hrvatska poduzeća koja žele izbjegavati pravne sporove. Firefly je integriran u Adobe Creative Cloud i omogućava generiranje slika, tekstura i efekata bez rizika kršenja copyrighta.

Koliko koštaju AI alati za generiranje slika u Hrvatskoj (2025/2026)

Za hrvatske korisnike i poduzeća, cijene text-to-image platformi u eurima (EUR) variraju od besplatnih opcija do profesionalnih pretplata. Evo pregleda najpopularnijih alata.

Platforma	Cijena (EUR/mjesečno)	Značajke	Za koga
ChatGPT Plus (DALL-E 3)	€22 - €24	Konverzacijsko sučelje, integrirano s ChatGPT-om, odlično za početnike	Početnici, content kreatori
Midjourney Basic	€9.20	~200 brzih slika, Discord sučelje, industrijski standard za umjetničku kvalitetu	Freelanceri, dizajneri
Midjourney Standard	€27.60	Neograničen "Relax" mod (sporije generiranje), komercijalna licenca	Profesionalci, agencije
Adobe Firefly (Creative Cloud)	€60 - €70	Komercijalnosiguran, integriran u Photoshop/Illustrator, licencirani podaci	Poduzeća, marketinške agencije
Google Imagen 3 (Gemini Advanced)	€18 - €22	Fotorealizam, izvrsno renderiranje teksta, SynthID vodeni žig	Korisnici Google ekosustava

Važna napomena: Sve cijene uključuju 25% PDV koji se primjenjuje u Hrvatskoj pri plaćanju stranim platformama. Većina alata prima plaćanje karticama, a cijene su izražene u USD, pa konačan iznos u eurima može varirati ovisno o tečaju.

Besplatne alternative za hrvatske korisnike

Za one koji žele eksperimentirati bez financijskog ulaganja, postoje besplatne opcije:

Microsoft Bing Image Creator: Pokrenut DALL-E 3 tehnologijom, potpuno besplatan uz Microsoft račun. Ograničenje: 15 "brzih" slika dnevno, zatim sporije generiranje.
Leonardo.ai: 150 besplatnih tokena dnevno, odličan za hobiste i učenje.
Craiyon (bivši DALL-E mini): Potpuno besplatan, ali niža kvaliteta i sporije generiranje.

Praktični savjeti: Kako pisati bolje promptove za hrvatske teme

Kvaliteta AI-generirane slike izravno ovisi o preciznosti tekstualne upute (prompta). Za hrvatske korisnike koji žele stvarati lokalizirani sadržaj, evo strukture optimalnog prompta.

Anatomija dobrog prompta

Subjekt: Što želite prikazati? (npr. "stara hrvatska kuća")
Detalji: Specificirajte boje, materijale, raspoloženje ("kameni zid, crveni crijep, maslinovo stablo")
Stil: Fotografija, ilustracija, ulje na platnu? ("fotorealistična fotografija, zlatni sat")
Kompozicija: Kut kamere, kadraža ("široki kut, pogled odozdo")
Osvjetljenje: Prirodno, studio, dramatično ("meko mediteransko sunce, duga sjena")

Primjer: Loš vs. dobar prompt

Loš prompt: "Hrvatska plaža"

Dobar prompt: "Fotorealistična fotografija malene šljunčane plaže na jadranskoj obali, kristalno plavo more, bijeli brodić vezan uz pristanište, stari borovi, zlatni sat, široki kut, profesionalna fotografija, 8K rezolucija"

Razlika je dramatična. AI modeli reagiraju na specifičnost. Što je prompt detaljniji, AI ima manje prostora za proizvoljnu interpretaciju.

Hrvatski kontekst: Gradovi, znamenitosti, tradicija

Kada generirate slike za hrvatski sadržaj, koristite specifične termine:

Umjesto "old European city", koristite "Dubrovnik old town stone walls"
Umjesto "traditional food", koristite "Croatian peka dish, lamb under iron bell, fireplace"
Umjesto "coastal landscape", koristite "Dalmatian coast, Adriatic Sea, cypress trees"

AI modeli su trenirani na globalnim podacima, ali prepoznaju specifične geografske i kulturne termine. Midjourney i DALL-E 3 izvrsno razumiju "Plitvice Lakes", "Split Diocletian Palace" ili "Zagreb Ban Jelačić Square".

Etička pitanja: Umjetnici, autorska prava i budućnost kreativnosti

Text-to-image AI izaziva fundamentalna pitanja o vrijednosti ljudske kreativnosti, fer konkurenciji i ekonomskoj održivosti kreativnih profesija.

Mnogi hrvatski ilustratori, fotografi i dizajneri osjećaju prijetnju. Ako AI može generirati logo za 10 EUR mjesečno, zašto bi klijent platio 500 EUR dizajneru? Ova napetost je realna i globalna. Međutim, povijesno gledano, svaka tehnološka revolucija - od kamere do Photoshopa - izazvala je slične strahove. Kamera nije uništila slikarstvo; redefinirala je njegovu svrhu.

Prema istraživanju objavljenom 2025., transparentnost o korištenju AI-a dosljedno smanjuje povjerenje publike. Stručnjaci tvrde da skrivanje AI alata iz straha nije rješenje. Umjesto toga, industrija mora aktivno raditi na normalizaciji AI-a kao legitimnog profesionalnog alata uz jasnu etičku upotrebu.

Autorska prava: Tko je vlasnik AI-generirane slike?

U Hrvatskoj, kao što je navedeno, potpuno AI-generirane slike ne mogu biti zaštićene autorskim pravom. Međutim, situacija je složenija:

Ako dizajner koristi AI kao alat u većem kreativnom procesu (prompt + ručna obrada + kompozicija), konačni rad može biti zaštićen.
Ako AI generira sliku koja slučajno izgleda identično postojećem zaštićenom djelu, tko je odgovoran? Korisnik ili platforma?
Ako umjetnik dokaže da je AI model treniran na njegovim djelima bez dozvole, ima li pravo na odštetu?

Ova pitanja trenutno se rješavaju na sudovima diljem svijeta. U SAD-u, nekoliko tužbi protiv Stability AI, Midjourney i DeviantArt još uvijek traje. EU AI Act postavlja pravni okvir, ali sudska praksa će tek definirati granice.

Budućnost text-to-image AI: Što nas čeka u 2026. i dalje

Sljedeća generacija text-to-image modela bit će brža, jeftinija i sposobnija za razumijevanje konteksta. Ključni trendovi uključuju personalizaciju, integraciju s 3D i video AI te strožu regulaciju.

Personalizirani AI modeli

Platforme poput Midjourney već testiraju mogućnost treniranja personaliziranih modela na vlastitim slikama. Za hrvatskog poduzetnika to znači: možete "naučiti" AI prepoznati vaš brend, boje, stil, čak i specifične proizvode, a zatim generirati beskrajne varijacije marketinškog materijala.

Integracija s 3D i videom

Text-to-3D modeli (poput OpenAI Shap-E) omogućavaju generiranje 3D objekata iz teksta. Text-to-video AI (Runway Gen-3, Pika Labs) stvara kratke video isječke. Kombinacija ovih tehnologija omogućit će stvaranje cijelih animiranih scena iz jednostavnih uputa.

Regulacija i certificiranje

EU AI Act zahtijevat će certificiranje visoko-rizičnih AI sustava. Platforme će morati proći neovisne revizije, dokazati transparentnost trening podataka i implementirati robusne sigurnosne mehanizme. Za hrvatske korisnike to znači veću sigurnost i povjerenje u alate koje koriste.