AI DAGELIJKS

Google Gemini multimodaal: tekst, beeld en video in één tool

24 mei 2026 | Boris Kusters

Inhoud

Google Gemini multimodaal: tekst, beeld en video in één tool

Een journalist van The Verge deepfaktte vorig jaar het knuffelhert van zijn zoontje. Met een paar prompts in Gemini leek het pluche beest opeens op vakantie te zijn. Het was een experiment, maar het liet zien hoe dichtbij dit soort tools al waren. Deze week zette Google er een flinke schep bovenop.

Het nieuwe any-to-any Gemini-model neemt zo'n beetje alles wat je erin gooit, tekst, een foto, audio of video, en geeft het in een ander formaat weer terug. Je hoeft niet meer te schakelen tussen een tekstgenerator, een beeldtool en een aparte video-app. Eén model, één werkstroom.

Voor het Nederlandse MKB is dat geen speeltje, maar een verschuiving in hoe je content maakt. In dit artikel lees je wat een any-to-any model precies is, wat het concreet betekent voor je marketing, hoe Gemini zich verhoudt tot ChatGPT, en hoe je het zelf test zonder je klantdata of je reputatie op het spel te zetten.

Wat is een any-to-any AI-model precies?

De meeste AI-tools die je tot nu toe gebruikte, zijn eenrichtingsverkeer. Een tekstmodel maakt tekst van tekst. Een beeldgenerator maakt een plaatje van een prompt. Wilde je van een foto een video, dan had je daar weer een ander gereedschap voor nodig, met een eigen account en een eigen abonnement.

Een any-to-any model gooit die schotten eruit. Je geeft input in welk formaat dan ook, en je kiest in welk formaat de output terugkomt. Een gesproken memo wordt een blogtekst. Een productfoto wordt een korte promovideo. Een ruwe schets wordt een nette afbeelding met de juiste verhoudingen. Dat allemaal binnen hetzelfde Gemini-model, zonder bestanden heen en weer te slepen.

Technisch is dat knap, maar de echte winst zit in de eenvoud. Minder tools betekent minder accounts, minder losse facturen en minder tijd kwijt aan het aan elkaar knopen van losse stappen. Voor een ondernemer die zelf de marketing draait, scheelt dat letterlijk uren per week.

Wat verandert dit concreet voor je MKB-content?

Stel je runt een webshop. Je maakt één goede productfoto, en het model levert je in één sessie vijf vierkante varianten voor Instagram, een liggende banner voor je homepage en een korte video van tien seconden voor je advertenties. Geen fotostudio, geen losse videobewerker, geen designer die er drie dagen over doet.

Of je bent dienstverlener. Je spreekt na een klantgesprek twee minuten in op je telefoon, en je krijgt er een blogartikel, een nieuwsbrieftekst en een setje social posts uit terug, inclusief passende beelden. De drempel om consistent zichtbaar te blijven wordt een stuk lager.

Dat dit serieus is, zie je aan hoe de grote merken het inzetten. IBM bouwde samen met Scuderia Ferrari HP een systeem dat van Formule 1-fans superfans maakt, met gepersonaliseerde content en beleving rond elke race. Jij hebt geen IBM-budget, maar het principe is precies hetzelfde: relevante content op maat, automatisch geproduceerd. De technologie die daarvoor nodig is, zit nu in een tool waar je vanaf je laptop bij kunt.

De valkuil is dat iedereen straks dezelfde gladde AI-content maakt. Het verschil zit dan niet in de tool, maar in jouw kennis van je klant en je vakgebied. De AI versnelt de productie, jij blijft verantwoordelijk voor de inhoud die ertoe doet.

Gemini vs ChatGPT voor MKB-content

De meest gestelde vraag op dit moment: moet ik bij Google blijven of overstappen, of houd ik gewoon ChatGPT? Het korte antwoord: het hangt af van wat je het meeste maakt. Hieronder de twee naast elkaar.

Google Gemini: sterk als je veel met beeld en video werkt en die het liefst in één omgeving genereert. Het any-to-any model maakt het schakelen tussen formaten overbodig, en Gemini is diep verweven met Google Workspace, Docs, Gmail en Drive. Werk je al in dat ecosysteem, dan is de stap klein. Voor wie zelf iets wil bouwen biedt Google bovendien een gratis speelomgeving om mee te experimenteren.

ChatGPT (OpenAI): nog altijd de sterkste allrounder voor tekst, redeneerwerk en het verwerken van documenten. Het ecosysteem van eigen GPT's en integraties is groot, en voor puur tekstwerk, klantenservice-scripts en analyses is het volwassen en betrouwbaar. De beeld- en videofuncties zijn goed, maar het naadloze any-to-any van het nieuwe Gemini-model is een ander niveau.

De praktische keuze: maak je vooral teksten en analyses, dan is er geen dwingende reden om ChatGPT in te ruilen. Draait je marketing op visuele content, beeld en video, en wil je dat in één werkstroom, dan is het nieuwe Gemini-model het uitproberen waard. Veel ondernemers in het MKB Nederland kiezen overigens niet, maar gebruiken beide naast elkaar voor waar ze het beste in zijn. De abonnementskosten van twee tools wegen meestal ruim op tegen de tijdwinst.

Zo test je Gemini zelf, zonder risico

Je hoeft niets te installeren om te beginnen. Het model is bereikbaar via de Gemini-app en, voor wie verder wil, via de gratis ontwikkelomgeving van Google. Daarin kun je prompts en formaten uitproberen zonder meteen een abonnement af te sluiten.

Werk in deze volgorde. Eén: kies een taak waarvan je het goede resultaat al kent, bijvoorbeeld een social post die vorige maand goed liep. Twee: laat het model die nabootsen en beoordeel of het in de buurt komt. Drie: pas pas daarna toe op nieuw werk. Zo bouw je vertrouwen op gebaseerd op resultaat, niet op de hype.

Houd het in het begin bij niet-gevoelige content: marketingbeelden, algemene teksten, conceptvideo's. Gooi geen klantgegevens, offertes of persoonsgegevens in een AI-tool zolang je niet zeker weet waar die data terechtkomt en of die gebruikt wordt om het model te trainen. Dat is geen overdreven voorzichtigheid, dat is gewoon de AVG.

De keerzijde: deepfakes, stemmen en de EU AI Act

Diezelfde kracht die jou sneller laat werken, maakt misbruik ook makkelijker. Het deepfake-knuffelhert van The Verge was onschuldig, maar de techniek erachter is dat niet altijd. Deze week bleek dat mensen met AI de stemmen van overleden piloten reconstrueerden uit een spectrogram-afbeelding van cockpitopnames. De Amerikaanse onderzoeksraad NTSB blokkeerde daarop tijdelijk de toegang tot zijn dossiersysteem. Wat technisch kan, gebeurt ook.

Voor jou als ondernemer zijn er twee harde grenzen. Eén: zet geen echte personen, klanten, medewerkers of bekende gezichten, in AI-beeld of -video zonder hun toestemming. Twee: wees eerlijk dat content door AI is gemaakt waar dat relevant is. Onder de EU AI Act komen er transparantieverplichtingen aan voor AI-gegenereerde en gemanipuleerde content, en die gelden ook voor het MKB.

De ironie is dat vertrouwen juist jouw voordeel wordt. Als half internet straks vol staat met anonieme AI-beelden, valt een ondernemer die open is over wat echt en wat gegenereerd is, positief op. Transparantie is geen rem, het is een onderscheidend kenmerk.

Wat dit betekent voor jou

Mijn nuchtere take: het nieuwe any-to-any Gemini-model is een echte stap vooruit, geen marketingpraatje. De tijdwinst voor wie veel beeld en video maakt is reëel, en de drempel om te beginnen is laag. Maar de tool maakt je niet vanzelf beter, hij maakt je sneller. Het verschil blijf jij maken met je kennis van je klant en je vak.

Waar het MKB concreet baat bij heeft: minder losse tools, lagere kosten en de mogelijkheid om consistent zichtbaar te blijven zonder een heel marketingteam. Begin klein, test op je eigen werk, en houd de AVG en de EU AI Act in je achterhoofd. Dan is dit geen risico, maar gewoon een snellere manier van werken. Wil je sparren over hoe dit in jouw contentaanpak past, dan denk ik graag een half uur mee.

Werkt deze AI-ontwikkeling door in jouw bedrijf? vindbaarheid verbeteren.

Veelgestelde vragen

Wat is een any-to-any AI-model?

Een any-to-any model neemt input in elk formaat (tekst, beeld, audio of video) en zet dat om naar elk gewenst outputformaat, allemaal binnen één model. Je maakt bijvoorbeeld van een ingesproken memo een blogtekst, of van een foto een video, zonder tussen losse tools te schakelen.

Is Google Gemini gratis te gebruiken?

Er is een gratis versie waarmee je het model kunt uitproberen, plus een gratis ontwikkelomgeving van Google om mee te experimenteren. Voor zakelijk gebruik met persoonsgegevens kies je een betaald plan met een verwerkersovereenkomst, zodat je AVG-proof werkt.

Gemini of ChatGPT: wat is beter voor MKB-content?

Voor puur tekstwerk en analyses is ChatGPT nog steeds een sterke allrounder. Maak je vooral beeld en video en wil je dat in één werkstroom, dan is het nieuwe multimodale Gemini-model het uitproberen waard. Veel ondernemers gebruiken beide naast elkaar.

Mag ik AI-video's van mijn producten zomaar gebruiken onder de AVG?

Beeld en video van je eigen producten zonder herkenbare personen mag je gewoon gebruiken. Komen er echte klanten, medewerkers of bekende gezichten in beeld, dan heb je toestemming nodig. Onder de EU AI Act komen er bovendien labelverplichtingen voor gemanipuleerde content aan.

Hoe begin ik veilig met Gemini in mijn bedrijf?

Start met niet-gevoelige content zoals marketingbeelden en algemene teksten. Test eerst op werk waarvan je het goede resultaat al kent, en gooi geen klantgegevens of offertes in de tool tot je weet waar die data terechtkomt. Lees de voorwaarden over datagebruik voordat je iets uploadt.

Kan Gemini ook Nederlandse content maken?

Ja, Gemini werkt prima in het Nederlands voor zowel tekst als beeldonderschriften. Let wel op toon en vakjargon: een model schrijft snel te algemeen, dus controleer altijd of de tekst klinkt zoals jouw bedrijf en jouw klant het zou zeggen.