andre Masons Descript snags $15m, erhverver Lyrebird for at lade brugerne skrive tekst for at skabe lyd i deres egne stemmer

@ingridlunden/3:19 AM PDT • 18.September 2019

billedkreditter: chaiyons021 /

bommen i popularitet for podcasting har givet en ny stemme til en verden af talte ordindhold, der stort set var blevet efterladt til døde med nedgangen i udsendelsesradio. Nu kører bølgen af denne vækst, en opstart kaldet Descript, der bygger værktøjer til at gøre kunsten at skabe podcasts — eller ethvert andet indhold, der involverer at arbejde med lyd — lidt lettere med lydtranskriptions-og redigeringsværktøjer, har en trio af nyhedsmeddelelser: finansiering, en erhvervelse og lanceringen af et nyt værktøj, der bringer noget af magien ved naturlig sprogbehandling og AI til mediet ved at lade folk skabe lyd af deres egne stemmer baseret på tekst, som de skriver.description, den seneste opstart fra Groupon grundlægger, skabt som en spin-off af hans audio-guide business omvej (som blev erhvervet af Bose sidste år), annoncerer i dag $15 millioner i finansiering, en Serie A til udvidelse af virksomheden (herunder ansættelse af flere mennesker), der kommer fra Andreessen (det finansierede også opstartens frørunde i 2017) og Redpoint.

sammen med det har virksomheden erhvervet en lille canadisk opstart, Lyrebird — som ligesom Descript også havde bygget lydredigeringsværktøjer. Sammen, de to udruller en ny funktion til Descript kaldet Overdub: folk vil nu være i stand til at oprette “skabeloner” af deres stemmer, som de igen kan bruge til at oprette lyd baseret på ord, som de skriver, del af en større produktionssuite, der også giver brugerne mulighed for at redigere flere stemmer på flere spor. Lyden kan være enkeltstående eller lydsporet til en video.

(videotranskriptionen fungerer lidt anderledes: når du tilføjer ord eller tager dem ud, springer videoen for at tage højde for ændringerne i timingen.)

Overdub er den seneste tilføjelse til et produkt, der giver brugerne mulighed for at oprette øjeblikkelige transkriptioner af lydtekst, der derefter kan klippes og potentielt forstærkes med musik fra anden lyd ved hjælp af træk-og-slip-værktøjer, der fjerner behovet for podcastere til at lære lydteknik og redigeringsprogrammer. Den ikke-tekniske vægt af produktet har givet Descript en følgende blandt podcastere og andre, der bruger transskription programmel som en del af deres lyd produktion suiter. Produktet er prissat i et freemium-format: gratis for op til fire timers stemmeindhold og $10 pr.

isometriskoverdubapp screenshotoptagelse

i en alder af markedsdefinerende, valgvindende falske nyheder hjulpet og tilskyndet af teknologi, ville du blive tilgivet for at undre dig over, om overdub måske ikke er en motorvej til Deep Fake City, hvor du kunne bruge teknologien til at skabe nogen form for “udsagn” af berømte stemmer.

Mason fortæller mig, at virksomheden har bygget en måde at forhindre, at det kan ske.

demoen på virksomhedens hjemmeside er oprettet med en speciel proprietær stemme kun til illustrative formål, men for faktisk at aktivere redigerings-og forstærkningsfunktionen til et stykke af deres egen lyd, skal brugerne først optage et antal udsagn, der gentages tilbage, baseret på tekst oprettet på farten og i realtid. Disse lydklip bruges derefter til at forme din digitale stemmeprofil.det betyder, at du ikke kan føje lyd af Donald Trump ind i systemet for at oprette en version af præsidenten, der siger, at han er frygtelig ked af at foreslå, at bygning af vægge mellem USA og USA var en god ide, og at dette faktisk ikke ville gøre Amerika stort igen. (Ærgerligt .)

men hvis du abonnerer på ideen om, at teknologiske fremskridt i NLP og AI generelt er noget af en Pandoras kasse, er katten allerede ude af posen, og selvom Descript ikke tillader det, vil en anden sandsynligvis hacke denne form for teknologi til mere uhyggelige ender. Svaret, siger Mason, er at fortsætte med at tale om dette og sørge for, at folk forstår potentialerne og faldgruberne.”folk har allerede skabt evnen til at lave dybe forfalskninger,” sagde Mason. “Vi skal forvente, at ikke alle vil følge de samme begrænsninger, som vi har fulgt. Men en del af vores rolle er at skabe bevidsthed om mulighederne. Din stemme er din identitet, og du skal eje den stemme. Det er dybest set et spørgsmål om privatlivets fred.”

udviklingen understreger den nye mulighed, der er åbnet for at udnytte nogle af udviklingen inden for kunstig intelligens til at tackle det, der er et voksende marked. På den ene side er det et stort marked: baseret kun på annonceindtægter alene forventes podcasting at indbringe omkring $679 millioner i år og $1 milliard i 2021, ifølge IAB — en af grundene til, at virksomheder som Spotify og Apple satser stort på det som et supplement til deres musikstreaming-virksomheder.

på den anden side er området med produktionsværktøjer til podcastere et meget overfyldt marked, hvor en række startups og andre lægger en masse værktøjer, som alle fungerer ganske godt til at identificere, hvad folk siger og transkribere det nøjagtigt.

på forsiden af transskription og det område, hvor Descript arbejder, rivaler omfatter folk som Trint, kranse og Odder, blandt mange andre. Decript selv skaber ikke engang sit grundlæggende NLP-program; det bruger Googles, da basic NLP nu er et område, der i det væsentlige er blevet “commoditiseret”, sagde Mason i en samtale.

det gør oprettelse af nye funktioner, udnyttelse af AI og andre fremskridt, desto mere vigtigt, da vi ser for at se, om et værktøj fremstår som en klar leder inden for dette særlige område af SaaS.

“i live multiuser-samarbejde er der stadig intet andet værktøj derude, der har gjort, hvad vi har gjort med store ukomprimerede lydfiler. Det er ikke nogen lille bedrift, og det har taget tid at få det rigtigt,” sagde Mason. “Jeg har set denne overgang manifest fra dokumenter til regneark til produktdesign. Ingen ville have tænkt på, at noget som produktdesign var et stort rum, men bare ved at tage disse værktøjer til samarbejde og med succes overføre dem til skyen, er virksomheder som Figma opstået. Og sådan blev vi involveret her.”

{{title}}

{{date}} {{author}}

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.