Andrew Mason’ S Descript snags $15m, kjøper Lyrebird for å la brukerne skrive tekst for å lage lyd i sine egne stemmer

@ingridlunden/3:19 am PDT • September 18, 2019

bilde credits: chaiyons021 /

bommen I POPULARITET FOR PODCASTING Har Gitt En Ny stemme til verden av talte ord innhold som hadde vært i stor grad etterlatt for død med nedgangen av kringkastingsradio. Nå kjører bølgen av den veksten, en oppstart kalt Descript som bygger verktøy for å gjøre kunsten å lage podcaster — eller annet innhold som involverer å jobbe med lyd — litt enklere med lydtranskripsjon og redigeringsverktøy, har en trio av nyhetsmeldinger: finansiering, et oppkjøp og lanseringen av et nytt verktøy som bringer noe av magien til naturlig språkbehandling og AI til mediet ved å la folk lage lyd av egne stemmer basert på tekst som de skriver.Descript, Den siste oppstarten Fra Groupon grunnlegger Andrew Mason, opprettet som en spin-off av hans audio-guide business Omvei (som ble kjøpt opp Av Bose i fjor), annonserer i dag $15 millioner i finansiering, En Serie A for å utvide virksomheten (inkludert å ansette flere mennesker) som kommer fra Andreessen Horowitz (det finansierte også oppstartens frørunde i 2017) og Redpoint.sammen med det har selskapet kjøpt en Liten Kanadisk oppstart, Lyrebird — som, som Descript, også hadde bygget lydredigeringsverktøy. Sammen, de to ruller ut en ny funksjon for Descript kalt Overdub: folk vil nå kunne lage «maler» av sine stemmer som de kan i sin tur bruke til å lage lyd basert på ord som de skriver, en del av en større produksjon suite som også vil la brukerne redigere flere stemmer på flere spor. Lyden kan være frittstående, eller lydsporet for en video.

(videotranskripsjonen fungerer litt annerledes: når du legger til ord, eller tar dem ut, hopper videoen for å ta hensyn til endringene i timingen.Overdub er det nyeste tillegget til et produkt som lar brukerne lage øyeblikkelige transkripsjoner av lydtekst som deretter kan klippes og potensielt forsterkes med musikk fra annen lyd ved hjelp av dra-og-slipp-verktøy som tar bort behovet for podcastere for å lære lydteknikk og redigeringsprogramvare. Den ikke-tekniske vektlegging av produktet har gitt Descript en følgende blant podcastere og andre som bruker transkripsjon programvare som en del av deres lydproduksjon suiter. Produktet er priset i et freemium-format: ingen kostnad for opptil fire timers taleinnhold, og $10 per måned etter det.

isometriskoverdubapp skjermbildeopptak

i en alder av markedsdefinerende, valgvinnende falske nyheter hjulpet og støttet av teknologi, ville du bli tilgitt for å lure på om overdub kanskje ikke er en motorvei til dyp falsk by, hvor du kan bruke teknologien til å lage noen form for «uttalelser» av berømte stemmer.Mason forteller meg at selskapet har bygget en måte å holde det fra å kunne skje.demoen på selskapets hjemmeside er opprettet med en spesiell proprietær stemme bare for illustrative formål, men for å faktisk aktivere redigering og forstørrelsesfunksjonen for et stykke egen lyd, må brukerne først registrere en rekke uttalelser som gjentas tilbake, basert på tekst opprettet på fly og i sanntid. Disse lydklippene brukes deretter til å forme din digitale stemmeprofil.Dette betyr at Du for eksempel ikke kan mate Lyd Av Donald Trump inn i systemet for å lage en versjon av presidenten som sier at han er veldig lei meg for å foreslå at bygge vegger mellom USA og Mexico var en god ide, og at dette faktisk ikke ville gjøre Amerika Stort igjen. (Synd.Men hvis du abonnerer på ideen om at teknologiske fremskritt I NLP og AI generelt er noe av En Pandoras boks, er katten allerede ute av posen, og selv Om Descript ikke tillater det, vil noen andre trolig hacke denne typen teknologi for mer falske ender. Svaret, Mason sier, er å fortsette å snakke om dette og sørge for at folk forstår potensialene og fallgruvene.»Folk har allerede skapt evnen til å lage dype feil,» Sa Mason. «Vi bør forvente at ikke alle kommer til å følge de samme begrensningene som vi har fulgt. Men en del av vår rolle er å skape bevissthet om mulighetene. Din stemme er din identitet, og du må eie den stemmen. Det er et spørsmål om personvern, i utgangspunktet.»

utviklingen understreker den nye muligheten som har åpnet seg i å tappe noen av utviklingen i kunstig intelligens for å ta opp det som er et voksende marked. På den ene siden er det et stort marked: basert bare på annonseinntekter alene, forventes podcasting å bringe inn rundt 679 millioner dollar i år, og 1 milliard dollar innen 2021, ifølge IAB — en grunn til at selskaper som Spotify Og Apple satser stort på det som et supplement til deres musikkstrømmingsvirksomheter.På den annen side er området med produksjonsverktøy for podcastere et veldig overfylt marked, med en rekke oppstart og andre som legger ut mange verktøy som alle fungerer ganske bra for å identifisere hva folk sier og transkribere det nøyaktig.

på forsiden av transkripsjon og området Der Descript fungerer, rivaler inkluderer slike Som Trint, Wreally og Otter, blant mange andre. Decript selv lager ikke engang sin grunnleggende nlp-programvare; Den bruker Googles, da basic NLP nå er et område som i hovedsak har blitt «commoditized», Sa Mason i et intervju.

Som gjør skape nye funksjoner, tappe INN AI og andre fremskritt, desto mer viktig, som vi ser for å se om ett verktøy fremstår som en klar leder i dette området Av SaaS.

«i live multiuser-samarbeid er det fortsatt ikke noe annet verktøy der ute som har gjort det vi har gjort med store ukomprimerte lydfiler. Det er ingen liten prestasjon, og det har tatt tid å få det riktig,» Sa Mason. «Jeg har sett denne overgangen manifest fra dokumenter til regneark til produktdesign. Ingen ville ha tenkt på noe som produktdesign for å være stor plass, men bare ved å ta disse verktøyene for samarbeid og vellykket porting dem til skyen, har selskaper som Figma dukket opp. Og det var slik vi ble involvert her.»

{{title}}

{{date}}{{author}}

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.