Andrew Masons Descript snags $15m, förvärvar Lyrebird för att låta användare skriva text för att skapa ljud i sina egna röster

@ingridlunden/3:19 am PDT • September 18, 2019

Bildkrediter: chaiyons021 /

bommen i popularitet för podcasting har gett en ny röst till världen av talat ordinnehåll som till stor del hade lämnats för död med nedgången av sändningsradio. Nu rider vågen av den tillväxten, en start som heter Descript som bygger verktyg för att göra konsten att skapa podcasts — eller något annat innehåll som innebär att arbeta med ljud — lite lättare med ljudtranskription och redigeringsverktyg, har en trio av nyhetsmeddelanden: finansiering, ett förvärv och lanseringen av ett nytt verktyg som ger en del av magin i naturlig språkbehandling och AI till mediet genom att låta människor skapa ljud av sina egna röster baserat på text som de skriver.

Descript, den senaste uppstarten från Groupon-grundaren Andrew Mason, skapad som en spin-off av hans audio-guide business Detour (som förvärvades av Bose förra året), meddelar idag 15 miljoner dollar i finansiering, en serie A för att utöka verksamheten (inklusive att anställa fler personer) som kommer från Andreessen Horowitz (det finansierade också startupens frörunda i 2017) och Redpoint.

tillsammans med det har företaget förvärvat en liten Kanadensisk start, Lyrebird-som, liksom Descript, också byggt ljudredigeringsverktyg. Tillsammans rullar de två ut en ny funktion för Descript som heter Overdub: människor kommer nu att kunna skapa ”mallar” av sina röster som de i sin tur kan använda för att skapa ljud baserat på ord som de skriver, en del av en större produktionssvit som också låter användare redigera flera röster på flera spår. Ljudet kan vara fristående eller ljudspåret för en video.

(videotranskriptionen fungerar lite annorlunda: när du lägger till ord eller tar ut dem gör videon hopp för att ta hänsyn till förändringarna i timing.)

Overdub är det senaste tillskottet till en produkt som låter användare skapa omedelbara transkriptioner av ljudtext som sedan kan klippas och potentiellt förstärkas med musik från annat ljud med dra-och-släpp-verktyg som tar bort behovet av podcasters att lära sig ljudteknik och redigeringsprogram. Produktens icke-tekniska betoning har gett Descript följande bland podcasters och andra som använder transkriptionsprogramvara som en del av deras ljudproduktionssviter. Produkten är prissatt i ett freemium-format: ingen kostnad för upp till fyra timmars röstinnehåll och $10 per månad efter det.

isometriskoverdubapp skärmdumpinspelning

i en tid av marknadsdefinierande, valvinnande falska nyheter hjälpte och med hjälp av teknik skulle du bli förlåtad för att undra om overdub kanske inte är en motorväg till Deep Fake City, där du kan använda tekniken för att skapa något sätt av ”uttalanden” av kända röster.

Mason berättar för mig att företaget har byggt ett sätt att hålla det från att kunna hända.

demo på företagets hemsida skapas med en speciell egen röst bara för illustrativa ändamål, men för att faktiskt aktivera redigerings-och förstärkningsfunktionen för en del av sitt eget ljud måste användarna först spela in ett antal uttalanden som upprepas tillbaka, baserat på text skapad i farten och i realtid. Dessa Ljudklipp används sedan för att forma din digitala röstprofil.

det betyder att du till exempel inte kan mata ljud av Donald Trump in i systemet för att skapa en version av presidenten som säger att han är väldigt ledsen för att föreslå att bygga väggar mellan USA och Mexiko var en bra ide, och att detta inte skulle göra Amerika bra igen. (Synd.)

men om du prenumererar på tanken att tekniska framsteg i NLP och AI totalt sett är något av en Pandoras låda, är katten redan ur väskan, och även om Descript inte tillåter det, kommer någon annan sannolikt att hacka den här typen av teknik för mer skändliga ändar. Svaret, säger Mason, är att fortsätta prata om detta och se till att människor förstår potentialen och fallgroparna.

”människor har redan skapat förmågan att göra djupa förfalskningar”, sa Mason. ”Vi borde förvänta oss att inte alla kommer att följa samma begränsningar som vi har följt. Men en del av vår roll är att skapa medvetenhet om möjligheterna. Din röst är din identitet, och du måste äga den rösten. Det är en fråga om integritet, i grund och botten.”

utvecklingen understryker den nya möjligheten som har öppnats för att knacka på några av utvecklingen inom artificiell intelligens för att ta itu med vad som är en växande marknad. Å ena sidan är det en stor marknad: baserat bara på annonsintäkter, förväntas podcasting ta in cirka 679 miljoner dollar i år och 1 miljard dollar år 2021, enligt IAB — en anledning till att företag som Spotify och Apple satsar stort på det som ett komplement till deras musikströmmande företag.

å andra sidan är området produktionsverktyg för podcasters en mycket trångt marknad, med ett antal startups och andra som lägger ut många verktyg som alla fungerar ganska bra för att identifiera vad folk säger och transkribera det exakt.

på framsidan av transkriptionen och det område där Descript arbetar, inkluderar rivaler som Trint, Wreally och Otter, bland många andra. Decript själv skapar inte ens sin grundläggande NLP-programvara; den använder Googles, eftersom basic NLP nu är ett område som i huvudsak har blivit ”commoditized”, säger Mason i en intervju.

som gör att skapa nya funktioner, utnyttja AI och andra framsteg, desto viktigare, som vi ser för att se om ett verktyg framträder som en tydlig ledare inom detta område av SaaS.

” i live multiuser collaboration finns det fortfarande inget annat verktyg där ute som har gjort vad vi har gjort med stora okomprimerade ljudfiler. Det är ingen liten bedrift, och det har tagit tid att få det rätt,” sade Mason. ”Jag har sett denna övergång manifest från dokument till kalkylblad till produktdesign. Ingen skulle ha tänkt på något som produktdesign för att vara stort utrymme men bara genom att ta dessa verktyg för samarbete och framgångsrikt portera dem till molnet har företag som Figma dykt upp. Och det var så vi blev involverade här.”

{{title}}

{{date}} {{author}}

Lämna ett svar

Din e-postadress kommer inte publiceras.