Introductie
Met de publieke introductie van ChatGPT en de opkomst van artificiële intelligentie in het algemeen werd snel duidelijk wat voor een enorme impact deze technologie zou hebben op het technologielandschap en onze toekomst. Met Audai wilden een collega-student en ikzelf de koe bij de horens vatten en een app ontwikkelen waarmee gebruikers hun ideeën binnen enkele minuten konden omzetten in echte menselijke spraak. Alle moeite die gepaard gaat met het creëeren van professionele audio (kiezen stemacteurs, huren van een studio, eindeloze heropnames) zou tot het verleden behoren. Klinkt vrij gek, toch? Net als het avontuur dat we aangingen om dit idee te ontwikkelen.
Ontwikkeling
Aanvankelijk hadden we het idee om een app te maken waarmee gebruikers hun eigen podcasts en audioboeken konden creëren, gebaseerd op hun invoer. Ons doel was om uiteindelijk (en voor de eerste keer ooit) een eigen app te publiceren op de App Store en Play Store. We schreven ons in voor de Start Academy Startup Track, georganiseerd door Vlajo & BNP Paribas Fortis. Via deze weg hoopten we in contact te komen met allerlei professionals in het veld die ons mogelijks konden helpen dit plan te realiseren. We zochten contact met een potentiële coach die ons graag wilde begeleiden, en al na de eerste bijeenkomst draaide ons plan 180 graden: Onze coach wees ons erop dat we, in plaats van ons te richten op een klantgericht product, meer kans van slagen zouden hebben als we een applicatie zouden ontwikkelen die bedrijven tijd en geld zou besparen; immers de twee meest waardevolle middelen van elk bedrijf.
Gedurende enkele maanden werkten we hard om dit idee te realiseren. Terwijl ik me richtte op de gehele ontwikkeling, focuste mijn collega zich op alle zaken die met marketing en financiën te maken hadden. De frontend van de applicatie werd gecreëerd met het Flutter framework (Dart), zodat het compatibel zou zijn voor Android-, iOS-, MacOS- en Windows-apparaten. Voor de backend werd Firebase gebruikt. Dit soort backendoplossing is vrij eenvoudig, maar dekte de volledige lading. Hierna resteerde ons alleen nog het vinden van de beste technologieën. Het proces werd opgesplitst in twee delen, waarbij elk deel een AI oplossing nodig had: Idee-naar-tekst en tekst-naar-spraak. De oplossing voor het eerste deel was snel besloten, gezien het al ongeveer drie maanden in het nieuws was: Het GPT-3 model. Het tweede deel was een moeilijkere keuze vanwege de sterk concurrerende 'Big 3' in deze categorie: Google Cloud Services, Microsoft Azure en Amazon AWS. Alle drie de cloudservices boden een fantastische oplossing voor onze tekst-naar-spraak behoeften, maar uiteindelijk kozen we voor het Azure-model omdat het het meest flexibele was van de drie.
Vanaf het begin hadden we onszelf een deadline gesteld voor het proof-of-concept: 18 april 2023. Dit was ook de deadline voor het indienen van de pitchvideo's voor de Startup Track. We slaagden erin om ons aan de deadline te houden en kwalificeerden onszelf voor de halve finale, waar we live zouden pitchen voor potentiële investeerders en ondernemers. Helaas kwam het verhaal hier aan zijn einde, maar wat was het een avontuur.
Terugblik
Tijdens het project hebben we verschillende waardevolle lessen geleerd. Ten eerste werd het belang van het kiezen van de juiste combinatie van AI modellen voor specifieke taken duidelijk. Het gebruik van OpenAI's GPT-modellen en de Azure TTS-service bleek een winnende combinatie, resulterend in hoogwaardige en samenhangende spraakoutput. Ten tweede kan het belang van gebruikerservaring en intuïtieve app-interfaces niet genoeg worden benadrukt. Het zorgen voor een naadloze en gebruiksvriendelijke ervaring verbetert de adoptie en betrokkenheid. Ten slotte toonde de samenwerking tussen verschillende AI-technologieën het potentieel aan om verschillende diensten te combineren om innovatieve oplossingen te creëren.
Als ik kijk naar het ondernemerschap en de zakelijke kant van dit hele project, denk ik dat de meest waardevolle les veruit het belang is van een goed netwerk. Wees niet bang om mensen te benaderen, tweede meningen te vragen en uit te zoeken waarom jouw waterdicht idee in de toekomst misschien lek kan slaan.