kép jóváírások: chaiyons021 /
a podcasting népszerűségének fellendülése új hangot adott a kimondott szó tartalmának világában, amelyet a sugárzott rádió hanyatlásával nagyrészt holtan hagytak. Most a növekedés hullámán lovagolva, a Descript nevű startup, amely olyan eszközöket épít, amelyek a podcastok — vagy bármely más, az audióval való munkát magában foglaló tartalom — létrehozásának művészetét egy kicsit könnyebbé teszik az audio átírási és szerkesztési eszközökkel, három hírbejelentéssel rendelkezik: finanszírozás, felvásárlás és egy új eszköz elindítása, amely a természetes nyelvfeldolgozás és az AI varázsát hozza a médiumba azáltal, hogy az emberek saját hangjuk hangját hozzák létre az általuk beírt szöveg alapján.
Descript, a Groupon alapítójának, Andrew Masonnak a legújabb startupja, amelyet az audio-guide üzleti Kitérőjének spin-offjaként hoztak létre (amelyet a Bose tavaly vásárolt meg), ma 15 millió dolláros finanszírozást jelent be, egy a sorozatot az üzlet bővítéséhez (beleértve több ember felvételét is), amely Andreessen Horowitzból származik (2017-ben finanszírozta a startup vetőmagkörét is) és a Redpoint.
ezzel együtt a vállalat felvásárolt egy kis kanadai startupot, a Lyrebird — t, amely a Descript-hez hasonlóan hangszerkesztő eszközöket is épített. Együtt, a kettő új funkciót vezet be az Overdub nevű Descript számára: az emberek mostantól képesek lesznek létrehozni a hangjuk “sablonjait”, amelyeket viszont felhasználhatnak hang létrehozására az általuk beírt szavak alapján, egy nagyobb produkciós csomag része, amely lehetővé teszi a felhasználók számára, hogy több hangot szerkesztsenek több sávon. A hang lehet önálló, vagy a videó hangsávja.
(a videó átírása kicsit másképp működik: amikor szavakat ad hozzá, vagy kiveszi őket, a videó ugrik, hogy figyelembe vegye az időzítés változásait.)
az Overdub a legújabb kiegészítés egy olyan termékhez, amely lehetővé teszi a felhasználók számára az audio szöveg azonnali átírását, amelyet aztán kivághatnak és potenciálisan kiegészíthetnek más hangokból származó zenével a drag-and-drop eszközök segítségével, amelyek elveszik a podcasterek szükségességét a hangmérnöki és szerkesztő szoftverek megtanulásához. A nem technikai hangsúlyt a termék adott Descript a következő között podcasters és mások, hogy a transzkripciós szoftver részeként audio termelés lakosztályok. A termék ára freemium formátumban van: legfeljebb négy órányi hangtartalomért nem számít fel díjat, ezt követően pedig havonta 10 dollárt.
a piacmeghatározó, választási győztes hamis hírek korában a technológia által felbujtva megbocsátják, hogy vajon az overdub nem lehet-e autópálya a deep fake city felé, ahol felhasználhatja a technológiát a híres hangok bármilyen “kijelentésének” létrehozására.
Mason azt mondja nekem, hogy a vállalat épített egy módot arra, hogy ez ne történjen meg.
a demo a cég honlapján jön létre egy speciális tulajdonosi hang csak szemléltető célokra, de hogy valóban aktiválja a szerkesztési és bővítő funkció egy darab saját audio, a felhasználók először rögzíteni számos nyilatkozatok, amelyek ismétlődnek vissza, alapján létrehozott szöveg menet közben, és valós időben. Ezeket a hangklipeket ezután a digitális hangprofil alakítására használják.
Ez azt jelenti, hogy például nem lehet betáplálni Donald Trump hangját a rendszerbe, hogy létrehozzon egy verziót az elnökről, aki azt mondja, hogy szörnyen sajnálja, hogy azt sugallta, hogy az Egyesült Államok és Mexikó közötti falak építése jó ötlet volt, és hogy ez valójában nem tenné Amerikát újra naggyá. (Kár.)
de ha feliratkozol arra az ötletre, hogy az NLP és az AI technikai fejlődése összességében Pandora szelencéje, a macska már ki van a zsákból, és még ha a Descript nem is teszi lehetővé, valaki más valószínűleg még aljasabb célokra fogja feltörni ezt a fajta technológiát. Mason szerint a válasz az, hogy folyamatosan beszéljünk erről, és biztosítsuk, hogy az emberek megértsék a lehetőségeket és a buktatókat.
“az emberek már létrehozták a mély hamisítványok készítésének képességét” – mondta Mason. “Arra kell számítanunk, hogy nem mindenki fogja követni azokat a korlátozásokat, amelyeket mi követtünk. De a szerepünk része az, hogy tudatosítsuk a lehetőségeket. A hangod az identitásod, és ezt a hangot kell birtokolnod. Ez alapvetően a magánélet kérdése.”
a fejlesztések hangsúlyozzák azt az új lehetőséget, amely megnyílt a mesterséges intelligencia egyes fejlesztéseinek kiaknázásában, hogy foglalkozzon a növekvő piaccal. Egyrészt ez egy nagy piac: csak a hirdetési bevételek alapján a podcasting várhatóan 679 millió dollárt fog hozni ebben az évben, és 1 milliárd dollárt 2021 — re, az IAB szerint-ez az egyik oka annak, hogy a Spotify és az Apple olyan vállalatok, mint a Spotify, nagyban fogadnak rá, hogy kiegészítsék zenei streaming üzletüket.
másrészt a podcasterek termelési eszközeinek területe nagyon zsúfolt piac, számos induló vállalkozás és mások sok eszközt bocsátanak ki, amelyek mindegyike elég jól működik az emberek mondásainak azonosításában és pontos átírásában.
a transzkripció elején és azon a területen, ahol a Descript működik, a riválisok közé tartozik a trint, a Wreally és az Otter, többek között. Maga a Decript nem is hozza létre alapvető NLP szoftverét; a Google-t használja, mivel az alapvető NLP most egy olyan terület, amely lényegében “árucikké vált” – mondta Mason egy interjúban.
Ez teszi az új funkciók létrehozását, az AI és más előrelépések kiaknázását, annál is inkább, mivel megnézzük, hogy egy eszköz egyértelmű vezetőként jelenik-e meg a SaaS ezen területén.
“az élő többfelhasználós együttműködésben még mindig nincs olyan eszköz, amely megtette volna azt, amit nagy tömörítetlen audiofájlokkal tettünk. Ez nem kis teljesítmény, és időbe telt, hogy jól sikerüljön ” – mondta Mason. “Láttam ezt az átmenetet a dokumentumoktól a táblázatokig a terméktervezésig. Senki sem gondolta volna, hogy valami hasonló terméktervezés hatalmas hely, de csak azáltal, hogy ezeket az eszközöket az együttműködéshez és a felhőbe való sikeres átvitelhez használják, olyan cégek jelentek meg, mint a Figma. Így keveredtünk bele.”
{{title}}
{{date}}{{author}}