descrierea lui Andrew Mason blochează 15 milioane USD, achiziționează Lyrebird pentru a permite utilizatorilor să tasteze text pentru a crea audio în propriile voci

@ingridlunden/3:19 am PDT • 18 septembrie 2019

credite imagine: chaiyons021 /

boom-ul în popularitate pentru podcasting a dat o nouă voce în lumea de conținut cuvânt rostit, care a fost în mare parte lăsat pentru morți cu declinul de radio difuzat. Acum, mergând pe valul acestei creșteri, un startup numit Descript care construiește instrumente pentru a face arta de a crea podcast — uri — sau orice alt conținut care implică lucrul cu audio-un pic mai ușor cu instrumente de transcriere și editare audio, are un trio de anunțuri de știri: finanțare, o achiziție și lansarea unui nou instrument care aduce o parte din magia procesării limbajului natural și AI pe mediu, permițând oamenilor să creeze audio ale propriilor voci pe baza textului pe care îl introduc.Descript ,cel mai recent startup de la fondatorul Groupon, Andrew Mason, creat ca un spin-off al ocolului său de afaceri audio-ghid (care a fost achiziționat de Bose anul trecut), anunță astăzi finanțare de 15 milioane de dolari, o serie A pentru extinderea afacerii (inclusiv angajarea mai multor persoane) care vine de la Andreessen Horowitz (a finanțat și Runda de pornire în 2017) și Redpoint.

împreună cu aceasta, compania a achiziționat un mic startup Canadian, Lyrebird — care, la fel ca Descript, a construit și instrumente de editare audio. Împreună, cei doi lansează o nouă caracteristică pentru Descript numită Overdub: oamenii vor putea acum să creeze „șabloane” ale vocilor lor pe care le pot folosi la rândul lor pentru a crea audio pe baza cuvintelor pe care le introduc, parte dintr-o suită de producție mai mare, care va permite utilizatorilor să editeze mai multe voci pe mai multe piese. Sunetul poate fi independent sau pista audio pentru un videoclip.

(transcrierea video funcționează puțin diferit: atunci când adăugați cuvinte sau le scoateți, videoclipul face salturi pentru a ține cont de schimbările de sincronizare.)

Overdub este cea mai recentă adăugare la un produs care permite utilizatorilor să creeze transcrieri instantanee ale textului audio care pot fi apoi tăiate și potențial mărite cu muzică din alte materiale audio folosind instrumente drag-and-drop care elimină nevoia podcasterilor de a învăța ingineria sunetului și software-ul de editare. Accentul non-tehnic al produsului a dat Descript un text printre podcasteri și alții care utilizează software-ul de transcriere ca parte a suitelor lor de producție audio. Produsul are un preț în format freemium: fără taxă pentru până la patru ore de conținut vocal și 10 USD pe lună după aceea.

izometricoverdubcaptură de ecran a aplicațieiînregistrare

În epoca știrilor false care definesc piața, câștigătoare de alegeri instigat de tehnologie, v-ar fi iertat pentru întrebam dacă overdub ar putea să nu fie o autostradă deep fake City, în cazul în care ați putea folosi tehnologia pentru a crea orice fel de „declarații” de voci celebre.

Mason mi-a spus compania a construit o modalitate de a păstra că de la a fi în măsură să se întâmple.

demo-ul de pe pagina de pornire a companiei este creat cu o voce specială proprietară doar în scopuri ilustrative, dar pentru a activa efectiv funcția de editare și augmentare pentru o piesă audio proprie, utilizatorii trebuie să înregistreze mai întâi o serie de declarații care se repetă înapoi, pe baza textului creat din mers și în timp real. Aceste clipuri audio sunt apoi utilizate pentru a modela profilul dvs. de voce digitală.

asta înseamnă că nu poți, de exemplu, să introduci audio-ul lui Donald Trump în sistem pentru a crea o versiune a președintelui spunând că îi pare foarte rău că a sugerat că construirea zidurilor între SUA și Mexic a fost o idee bună și că acest lucru nu ar face, de fapt, America măreață din nou. (Păcat.)

dar dacă vă abonați la ideea că progresele tehnologice în NLP și AI în general sunt ceva de o cutie a Pandorei, pisica a ieșit deja din geantă și chiar dacă Descript nu o permite, altcineva va hack probabil acest tip de tehnologie pentru scopuri mai nefaste. Răspunsul, spune Mason, este să continuăm să vorbim despre acest lucru și să ne asigurăm că oamenii înțeleg potențialele și capcanele.”oamenii au creat deja abilitatea de a face falsuri profunde”, a spus Mason. „Ar trebui să ne așteptăm ca nu toată lumea să urmeze aceleași constrângeri pe care le-am urmat. Dar o parte din rolul nostru este de a crea conștientizarea posibilităților. Vocea ta este identitatea ta și trebuie să ai acea voce. Este o chestiune de intimitate, practic.”

evoluțiile subliniază noua oportunitate care s-a deschis în atingerea unora dintre evoluțiile inteligenței artificiale pentru a aborda ceea ce este o piață în creștere. Pe de o parte, este o piață mare: bazată doar pe veniturile din publicitate, podcasting — ul este de așteptat să aducă aproximativ 679 milioane de dolari în acest an și 1 miliard de dolari până în 2021, potrivit IAB-un motiv pentru care companii precum Spotify și Apple pariază pe ea ca o completare a afacerilor lor de streaming muzical.

pe de altă parte, zona instrumentelor de producție pentru podcasteri este o piață foarte aglomerată, cu un număr de startup-uri și altele care pun o mulțime de instrumente care funcționează destul de bine în identificarea a ceea ce spun oamenii și transcrierea cu exactitate.

pe partea din față a transcrierii și zona în care Descript este de lucru, rivalii includ place de Trint, Wreally și Vidra, printre multe altele. Decript în sine nici măcar nu își creează software-ul NLP de bază; folosește Google, deoarece NLP de bază este acum un domeniu care a devenit în esență „comercializat”, a spus Mason într-un interviu.

Acest lucru face ca crearea de noi caracteristici, atingerea AI și a altor progrese, să fie cu atât mai esențială, cu cât ne uităm să vedem dacă un instrument apare ca un lider clar în acest domeniu special al SaaS.

„în colaborare multiutilizator live, nu există încă nici un alt instrument acolo, care a făcut ceea ce am făcut cu fișiere audio necomprimate mari. Acesta nu este un lucru mic și a fost nevoie de timp pentru a-l face corect”, a spus Mason. „Am văzut această tranziție manifestată de la documente la foi de calcul la proiectarea produsului. Nimeni nu s-ar fi gândit la ceva de genul designului de produs ca fiind un spațiu imens, ci doar prin luarea acestor instrumente pentru colaborare și portarea cu succes a acestora în cloud, au apărut companii precum Figma. Și așa ne-am implicat aici.”

{{title}}

{{date}}{{autor}}

Lasă un răspuns

Adresa ta de email nu va fi publicată.