Andrew Mason’ s Descript snags $15m, acquires Lyrebird to let users type text to create audio in their own voices

@ingridlunden/3:19 am PDT • September 18, 2019

image credits: chaiyons021/

podcastingin suosion nousukausi on antanut uuden äänen spoken word-sisällön maailmalle, joka oli suurelta osin jäänyt kuolemaan broadcast-radion vähenemisen myötä. Nyt Ratsastus aalto, että kasvu, startup nimeltään Descript joka rakentaa työkaluja tehdä taidetta luoda podcasteja — tai muuta sisältöä, johon liittyy työskentely audio-hieman helpompaa audio transkriptio ja muokkaustyökalut, on trio uutisia ilmoitukset: rahoitus, hankinta ja käynnistää uuden työkalun, joka tuo joitakin taika luonnollisen kielen käsittely ja AI välineeseen antamalla ihmiset luoda äänen omia ääniä perustuu tekstiin, että he kirjoittavat.

Descript, Grouponin perustajan Andrew Masonin uusin startup, joka luotiin hänen audio-guide business Detour-yrityksensä spin-offiksi (jonka Bose osti viime vuonna), ilmoittaa tänään 15 miljoonan dollarin rahoituksesta, A-sarjan liiketoiminnan laajentamiseen (mukaan lukien uusien ihmisten palkkaaminen), joka tulee Andreessen Horowitzilta (se rahoitti myös startupin siemen kierroksen vuonna 2017) ja Redpointilta.

sen ohella yhtiö on hankkinut pienen kanadalaisen startupin Lyrebirdin, joka oli Descriptin tavoin rakentanut myös äänenmuokkaustyökaluja. Yhdessä, kaksi ovat käyttöön uusi ominaisuus Descript nimeltään Overdub: ihmiset voivat nyt luoda ”malleja” niiden ääniä, että he voivat puolestaan luoda äänen perustuu sanoja, jotka he kirjoittavat, osa suurempaa tuotanto-sarja, joka myös antaa käyttäjien muokata useita ääniä useita kappaleita. Ääni voi olla itsenäinen, tai ääniraita videon.

(videon transkriptio toimii hieman eri tavalla: kun lisäät sanoja tai otat ne pois, video tekee hyppyjä, jotka selittävät ajoituksen muutokset.)

Overdub on uusin lisäys tuotteeseen, jonka avulla käyttäjät voivat luoda välittömiä transkriptioita äänitekstistä, jota voidaan sitten leikata ja mahdollisesti täydentää muiden äänien musiikilla vetämällä ja pudottamalla työkaluja, jotka vievät podcastaajien tarpeen oppia äänitekniikka ja editointiohjelmisto. Ei-tekninen painotus tuote on antanut Descript seuraavat keskuudessa podcasters ja muut, jotka käyttävät transkriptio ohjelmisto osana niiden audio tuotanto suites. Tuote on hinnoiteltu freemium-muodossa: veloituksetta enintään neljä tuntia äänisisältöä, ja sen jälkeen 10 dollaria kuukaudessa.

isometrinenoverdubsovelluksen ruutukaappaustallennus

markkinoita määrittelevien, vaalit voittaneiden valeuutisten aikakaudella ja teknologian tukemana saat anteeksi, jos ihmettelet, jos overdub ei ehkä ole valtatie Deep Fake Cityyn, jossa voit käyttää teknologiaa luomaan mitä tahansa ”lausuntoja” kuuluisilta ääniltä.

Mason kertoo, että yhtiö on rakentanut keinon, jolla sitä ei voi tapahtua.

yrityksen kotisivun demo on luotu erityisellä omalla äänellä vain havainnollistamistarkoituksessa, mutta aktivoidakseen editointi-ja tehostusominaisuuden omalle äänikappaleelleen käyttäjien on ensin tallennettava useita lausumia, jotka toistetaan takaisin, perustuen lennossa luotuun tekstiin ja reaaliaikaisesti. Näitä äänileikkeitä käytetään sitten digitaalisen ääniprofiilin muokkaamiseen.

tämä tarkoittaa sitä, että esimerkiksi Donald Trumpin ääntä ei voi syöttää järjestelmään, jotta saataisiin aikaan versio presidentistä, joka sanoo olevansa hirveän pahoillaan väittäessään, että muurien rakentaminen USA: n ja Meksikon välille olisi hyvä idea, eikä tämä itse asiassa tekisi Amerikasta taas suurta. (Harmi.)

mutta jos allekirjoitat ajatuksen, että teknologian edistysaskeleet NLP: ssä ja tekoälyssä ylipäätään ovat jotain Pandoran lipasta, kissa on jo ulkona pussista, ja vaikka Descript ei salli sitä, joku muu todennäköisesti hakkeroi tällaista teknologiaa pahempia tarkoitusperiä varten. Masonin mukaan vastaus on jatkaa tästä puhumista ja varmistaa, että ihmiset ymmärtävät mahdollisuudet ja sudenkuopat.

”ihmiset ovat jo luoneet kyvyn tehdä syviä väärennöksiä”, Mason sanoi. ”Meidän pitäisi odottaa, että kaikki eivät aio noudattaa samoja rajoitteita, joita olemme noudattaneet. Mutta osa tehtäväämme on luoda tietoisuutta mahdollisuuksista. Äänesi on identiteettisi, ja sinun täytyy omistaa se ääni. Kyse on yksityisyydestä.”

kehitys alleviivaa uutta mahdollisuutta, joka on avautunut keinoälyn kehityksen hyödyntämiseksi kasvavilla markkinoilla. Toisaalta, se on iso markkina: perustuu vain mainostuloja yksin, podcasting odotetaan tuo noin $679 miljoonaa tänä vuonna, ja $1 miljardia 2021, mukaan IAB — yksi syy, miksi yritykset kuten Spotify ja Apple panostavat iso se täydentää niiden musiikin streaming liiketoimintaa.

toisaalta podcastaajien tuotantotyökalujen alue on hyvin ruuhkainen markkina, jossa useat startupit ja muut julkaisevat paljon työkaluja, jotka kaikki toimivat varsin hyvin ihmisten sanomisten tunnistamisessa ja niiden tarkassa litteroinnissa.

transkription rintamalla ja alueella, jolla Descript toimii, kilpailijoita ovat muun muassa Trint, Wreally ja Saukko. Decript itse ei edes luo sen perus NLP-ohjelmisto; se käyttää Googlen, koska basic NLP on nyt alue, joka on olennaisesti tullut ”commoditized”, sanoi Mason haastattelussa.

Tämä tekee uusien ominaisuuksien luomisesta, tekoälyn hyödyntämisestä ja muista edistysaskeleista entistäkin olennaisempia, kun katsomme, nouseeko yksi työkalu selkeäksi johtajaksi tällä SaaS: n erityisalueella.

”live multiuser collaborationissa ei edelleenkään ole olemassa mitään muuta työkalua, joka olisi tehnyt sen, mitä olemme tehneet suurilla pakkaamattomilla äänitiedostoilla. Se ei ole mikään pieni saavutus, ja sen korjaaminen on vienyt aikaa, Mason sanoi. ”Olen nähnyt tämän siirtymisen dokumenteista taulukkolaskentaan tuotesuunnitteluun. Kukaan ei olisi ajatellut, että jokin tuotesuunnittelun kaltainen tila olisi valtava, mutta vain ottamalla nämä yhteistyövälineet ja siirtämällä ne onnistuneesti pilveen, Figman kaltaiset yritykset ovat syntyneet. Ja niin me jouduimme tähän mukaan.”

{{title}}

{{date}}{{autor}}

Vastaa

Sähköpostiosoitettasi ei julkaista.