Andrew Mason’ s Descript snags $15M, verwerft Lyrebird om gebruikers tekst te laten typen om audio te maken in hun eigen stemmen

@ingridlunden/3:19 am PDT • 18 September 2019

image credits: Chaiyons021 /

De boom in populariteit voor podcasting heeft een nieuwe stem gegeven aan de wereld van gesproken woord inhoud die grotendeels voor dood was achtergelaten met de daling van broadcast radio. Nu rijden op de golf van die groei, een startup genaamd Descript dat is het bouwen van tools om de kunst van het maken van podcasts te maken — of andere inhoud die het werken met audio — een beetje makkelijker met audio transcriptie en editing tools, heeft een trio van nieuwsaankondigingen: financiering, een overname en de lancering van een nieuwe tool die een deel van de magie van natuurlijke taalverwerking en AI brengt naar het medium door mensen te laten maken van hun eigen stemmen op basis van tekst die ze typen.

Descript, de nieuwste startup van Groupon oprichter Andrew Mason, gemaakt als een spin-off van zijn audio-guide business Detour (die werd overgenomen door Bose vorig jaar), is vandaag de aankondiging van $15 miljoen in de financiering, een Serie A Voor het uitbreiden van het bedrijf (met inbegrip van het inhuren van meer mensen) die afkomstig is van Andreessen Horowitz (het ook gefinancierd de startup ‘ s zaad ronde in 2017) en Redpoint.

samen met dat, het bedrijf heeft een kleine Canadese startup, Lyrebird — die had, net als Descript, ook gebouwd audio-editing tools. Samen, de twee zijn het uitrollen van een nieuwe functie voor Descript genaamd Overdub: mensen zullen nu in staat zijn om “sjablonen” van hun stemmen die ze op hun beurt kunnen gebruiken om audio te maken op basis van woorden die ze typen, onderdeel van een grotere productie suite die ook zal laten gebruikers bewerken meerdere stemmen op meerdere tracks. De audio kan standalone, of de audio track voor een video.

(De videotranscriptie werkt een beetje anders: wanneer u woorden toevoegt of verwijdert, maakt de video sprongen om rekening te houden met de veranderingen in timing.)

overdub is de nieuwste toevoeging aan een product waarmee gebruikers direct transcripties van audiotekst kunnen maken die vervolgens kunnen worden gesneden en mogelijk kunnen worden uitgebreid met muziek van andere audio met behulp van drag-and-drop tools die podcasters de noodzaak ontnemen om software voor geluidstechniek en bewerking te leren. De niet-technische nadruk van het product heeft Descript een volgende gegeven onder podcasters en anderen die transcriptie software gebruiken als onderdeel van hun audio productie suites. Het product is geprijsd in een freemium-formaat: geen kosten voor maximaal vier uur spraakinhoud, en $10 per maand daarna.

isometrischoverdubapp screenshotopname

In het tijdperk van marktbepalend, verkiezingswinnend fake news ondersteund en ondersteund door technologie, u zou vergeven worden voor het afvragen of overdub misschien niet een snelweg naar Deep Fake City, waar je de technologie kunt gebruiken om elke vorm van “verklaringen” van beroemde stemmen te creëren.

Mason vertelt me dat het bedrijf een manier heeft gebouwd om dat te voorkomen.

de demo op de startpagina van het bedrijf is gemaakt met een speciale eigen stem, alleen voor illustratieve doeleinden, maar om de bewerkings-en vergrotingsfunctie voor een stuk van hun eigen audio te activeren, moeten gebruikers eerst een aantal statements opnemen die worden herhaald, gebaseerd op tekst die on the fly en in real time is gemaakt. Deze audioclips worden vervolgens gebruikt om uw digitale stemprofiel vorm te geven.

Dit betekent dat je bijvoorbeeld geen audio van Donald Trump in het systeem kunt invoeren om een versie van de president te maken die zegt dat het hem vreselijk spijt dat hij suggereerde dat het bouwen van muren tussen de VS en Mexico een goed idee was, en dat dit Amerika in feite niet weer groot zou maken. (Jammer.)

maar als je je abonneert op het idee dat technologische vooruitgang in NLP en AI in het algemeen iets van Pandora ‘ s doos zijn, is de kat al uit de zak, en zelfs als Descript dit niet toelaat, zal iemand anders waarschijnlijk dit soort technologie hacken voor meer snode doeleinden. Het antwoord, zegt Mason, is om hierover te blijven praten en ervoor te zorgen dat mensen het potentieel en de valkuilen begrijpen.

“mensen hebben al de mogelijkheid gecreëerd om diepe vervalsingen te maken,” zei Mason. “We mogen verwachten dat niet iedereen dezelfde beperkingen zal volgen als wij. Maar een deel van onze rol is het creëren van bewustzijn van de mogelijkheden. Je stem is je identiteit, en je moet die stem bezitten. Het is een kwestie van privacy.”

de ontwikkelingen onderstrepen de nieuwe kans die zich heeft voorgedaan bij het aanboren van een aantal ontwikkelingen op het gebied van kunstmatige intelligentie om een groeiende markt aan te pakken. Aan de ene kant is het een grote markt: alleen al op basis van advertentie — inkomsten, podcasting zal naar verwachting brengen in ongeveer $679 miljoen dit jaar, en $1 miljard door 2021, volgens de IAB-een reden waarom bedrijven als Spotify en Apple zijn grote inzet op het als aanvulling op hun muziek streaming bedrijven.

aan de andere kant is het gebied van de productietools voor podcasters een zeer drukke markt, met een aantal startups en anderen die een heleboel tools die allemaal vrij goed werken in het identificeren van wat mensen zeggen en het nauwkeurig transcriberen.

op de voorzijde van transcriptie en het gebied waar Descript werkt, zijn rivalen zoals Trint, Wreally en Otter, onder vele anderen. Decript zelf maakt niet eens de basis NLP software; het maakt gebruik van Google, als basic NLP is nu een gebied dat in wezen is geworden “commoditized,” zei Mason in een interview.

dat maakt het creëren van nieuwe functies, het aanboren van AI en andere ontwikkelingen des te essentiëler, als we kijken of een tool naar voren komt als een duidelijke leider op dit specifieke gebied van SaaS.

” In live multi-user samenwerking, is er nog steeds geen andere tool die heeft gedaan wat we hebben gedaan met grote ongecomprimeerde audiobestanden. Dat is geen kleine prestatie, en het heeft tijd gekost om het goed te krijgen,” zei Mason. “Ik heb deze overgang van documenten naar spreadsheets naar productontwerp gezien. Niemand zou hebben gedacht van iets als product design te zijn enorme ruimte, maar gewoon door het nemen van deze tools voor samenwerking en met succes over te dragen naar de cloud, bedrijven als Figma zijn ontstaan. En zo zijn we hier bij betrokken geraakt.”

{{title}}

{{date}} {{author}}

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.