Andrew Mason je Descript úskalí $15M, získává Lyrebird nechat uživatele, zadejte text, který chcete vytvořit audio v jejich vlastní hlasy

@ingridlunden/3:19 PDT • 18. září 2019

Obrázek Kreditů: ChaiyonS021 /

boom v popularitě pro podcasting dal nový hlas do světa mluveného slova obsah, který byl do značné míry ponechán smrti s poklesem rozhlasové vysílání. Teď se veze na vlně růstu, startup s názvem Descript, že staví nástroje, aby se umění vytvářet podcasty — nebo jakýkoli jiný obsah, který zahrnuje práci s audio — trochu jednodušší s audio transkripce a úpravy nástrojů, má trio novinek oznámení: financování, akvizice a spuštění nový nástroj, který přináší některé z magie zpracování přirozeného jazyka a AI na medium tím, že lidé vytvářet zvukové jejich vlastní hlasy na základě textu, který typ.

Descript, nejnovější spuštění z Groupon zakladatel, Andrew Mason, vytvořen jako spin-off z jeho audio-průvodce business Oklikou (což jsem získala od Bose v loňském roce), dnes oznámil, $15 milionů financování, Series pro rozšíření podnikání (včetně najímání více lidí), že přichází z Andreessen Horowitz (to také financovala spouštěcí semen kolo v roce 2017) a Redpoint.

spolu s tím společnost získala malý Kanadský startup Lyrebird-který měl, stejně jako Descript, také vestavěné nástroje pro úpravu zvuku. Spolu, dva jsou vyvalit novou funkci pro zobrazení popisu tzv. Overdub: lidé budou nyní moci vytvořit „šablony“ jejich hlasy, které lze pak použít k vytvoření zvuku na základě slov, která jsou typ, část většího production suite, která bude také umožňují uživatelům upravovat více hlasy na více stop. Zvuk může být samostatný nebo zvuková stopa pro video.

(video přepis funguje trochu jinak: Když přidáte slova, nebo si je ven, to video dělá skoky na účet pro změny v načasování.)

Overdub je nejnovější přírůstek do produktu, který umožňuje uživatelům vytvářet okamžité přepisy audio text, který pak může být řez a případně rozšířené o hudbu z jiných audio pomocí drag-and-drop nástroje, které vzít, že je třeba pro podcasters se naučit, zvukové inženýrství a software pro úpravu. Non-technické důraz výrobku dal Descript následující mezi podcasters a další, které používají přepis software jako součást jejich audio produkce suite. Cena produktu je ve formátu freemium: bez poplatku za až čtyři hodiny hlasového obsahu a 10 $za měsíc poté.

isometricvymazataplikace screenshotzáznam

Ve věku na trhu-vymezení, volby-vítězství falešné zprávy, pomáhal a naváděl technologie, byste být odpuštěno pro mě zajímalo, jestli Overdub nemusí být dálnice do Hluboké Falešné Město, kde byste mohli využít technologie k vytvoření jakýmkoliv způsobem „prohlášení“ podle slavné hlasy.

Mason mi říká, že společnost vybudovala způsob, jak zabránit tomu, aby se to stalo.

demo na domovské stránky společnosti je vytvořen s speciální vlastní hlas jen pro ilustraci, ale ve skutečnosti aktivovat editaci a doplnění funkce pro kus své vlastní audio, uživatelé musí nejprve zaznamenat počet příkazů, které jsou opakovány zpět, na základě textu vytvořené za běhu a v reálném čase. Tyto zvukové klipy se pak používají k utváření vašeho digitálního hlasového profilu.

To znamená, že nemůžete, například, krmit audio Donald Trump do systému, vytvořit verzi prezident říká, že on je strašně líto, což naznačuje, že budování zdi mezi USA a Mexikem byl dobrý nápad, a že by to nebylo, ve skutečnosti, aby Amerika Zase Skvělá. (Zlý.)

Ale pokud jste se přihlásili k myšlence, že tech pokrok v NLP a AI celkově jsou něco jako Pandořina skříňka, kočka je již z pytle ven, a i když Descript nepovoluje pro to, někdo jiný bude pravděpodobně hack tento druh technologie pro více zločinný končí. Odpověď, Mason říká, je o tom stále mluvit a zajistit, aby lidé pochopili potenciál a úskalí.

„lidé již vytvořili schopnost dělat hluboké padělky,“ řekl Mason. „Měli bychom očekávat, že ne každý se bude řídit stejnými omezeními, která jsme dodržovali. Ale součástí naší role je vytvářet povědomí o možnostech. Váš hlas je vaše identita a musíte ten hlas vlastnit. Je to v podstatě otázka soukromí.“

vývoj podtrhuje novou příležitost, která se otevřela při využívání některých vývojů v oblasti umělé inteligence k řešení rostoucího trhu. Na jedné straně, je to velký trh: Založen jen na příjmy z reklamy sám, podcasting se očekává, že přinese v některých 679 dolarů milionů v letošním roce, a $1 miliarda do roku 2021, podle IAB — jeden z důvodů, proč společnosti jako Spotify a Apple sází na to jako doplněk k jejich streamování hudby podniky.

Na druhé straně, v oblasti výroby nástrojů pro podcasters je velmi přeplněném trhu, se počet začínajících a další uvedení spoustu nástrojů, které všechny práce docela dobře identifikovat, co lidé říkají a přepisování to přesně.

na přední straně transkripce a oblasti, kde Descript pracuje, soupeři patří jako Trint, Wreally a Vydra, mezi mnoha dalšími. Decript sám nemá ani vytvořit jeho základní NLP software; používá Google, jako základní NLP je nyní oblast, která se v podstatě stala „commoditized,“ řekl Mason v rozhovoru.

To umožňuje vytvářet nové funkce, klepnutím do AI a další pokroky, více důležité, jak se díváme, jestli jeden nástroj se ukáže jako jasná jednička v této konkrétní oblasti SaaS.

„V živé multiuser spolupráce, tam je ještě žádný jiný nástroj, tam, že udělal, co jsme udělali s velkým nekomprimované audio soubory. To není malý výkon, a trvalo to, než to bylo správné, “ řekl Mason. „Viděl jsem tento přechodový manifest od dokumentů k tabulkám k designu produktu. Nikdo by si myslel něco, jako je design výrobku být obrovský prostor, ale jen tím, že tyto nástroje pro spolupráci a úspěšně portování je do cloudu, společnosti jako Figma objevily. A tak jsme se sem zapojili.“

{{title}}

{{date}}{{author}}

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.