QuickVid wykorzystuje sztuczną inteligencję do tworzenia krótkich filmów z lektorem

Nadchodzi generatywna sztuczna inteligencja dla filmów. Nowa lokalizacja , QuickVidłączy kilka generatywnych systemów AI w jednym narzędziu do automatycznego tworzenia krótkich filmów na YouTube, Instagram, TikTok i Snapchat.

Biorąc pod uwagę tylko jedno słowo, QuickVid wybiera wideo w tle z biblioteki, zapisuje tekst i słowa kluczowe oraz obejmuje obrazy generowane przez DALL-E 2 Dodaje syntetyczny lektor i muzykę w tle z bezpłatnej biblioteki muzycznej YouTube. Twórca QuickVid, Daniel Habib, mówi, że buduje usługę, aby pomóc twórcom sprostać „stale rosnącym” wymaganiom fanów.

„Zapewniając twórcom narzędzia do szybkiego i łatwego tworzenia wysokiej jakości treści, QuickVid pomaga twórcom zwiększyć produkcję treści, zmniejszając ryzyko wypalenia” – powiedział Habib TechCrunch w wywiadzie e-mailowym. „Naszym celem jest umożliwienie ulubionemu twórcy nadążanie za wymaganiami odbiorców poprzez wykorzystanie postępów w sztucznej inteligencji”.

Jednak w zależności od tego, jak są używane, narzędzia takie jak QuickVid grożą zalaniem już zatłoczonych kanałów spamem i powtarzającymi się treściami. Spotykają się również z potencjalnym sprzeciwem twórców, którzy zdecydują się nie korzystać z narzędzi, czy to ze względu na koszt (10 USD miesięcznie), czy z zasady, ale mogą konkurować z mnóstwem nowych filmów generowanych przez sztuczną inteligencję.

Idź za wideo

QuickVid, który Habib, programista-samouk, który wcześniej pracował nad meta i infrastrukturą wideo Facebook Live, uruchomił w ciągu kilku tygodni, QuickVid 27 grudnia. Na razie to stosunkowo gołe kości — Habib mówi, że więcej opcji dostosowywania pojawi się w styczniu — ale QuickVid może połączyć elementy, które składają się na typowy informacyjny krótki film na YouTube lub TikTok, w tym napisy, a nawet awatary.

Jest łatwy w użyciu. Najpierw użytkownik wprowadza monit opisujący, o czym jest film, który chce stworzyć. QuickVid używa zachęty do generowania skryptu, wykorzystując moc skryptu generatywnego GPT-3. Spośród słów kluczowych wyodrębnionych ze skryptu automatycznie lub wprowadzonych ręcznie, QuickVid wybiera wideo w tle z bezpłatnej biblioteki multimediów Pexels i tworzy nakładki za pomocą DALL-E 2. Następnie wysyła lektora za pośrednictwem Google Text-to-Speech API. być w stanie odtworzyć własny głos, mówi Habib, zanim połączy wszystkie te elementy w wideo.

Kredyty obrazkowe: QuickVid

Obejrzyj ten film nagrany przez monit „koty”:

Co to za nowy sekret:

QuickVid z pewnością nie przesuwa granic tego, co jest możliwe dzięki generatywnej sztucznej inteligencji. Jest właścicielem Meta i Google pokazane Systemy AI, które mogą tworzyć całkowicie oryginalne klipy podczas kierowania tekstem. Ale QuickVid integruje istniejącą sztuczną inteligencję, aby wykorzystać typowy powtarzalny format krótkich, ciężkich filmów B-roll, omijając problem konieczności tworzenia samego materiału.

„Twórcy odnoszący sukcesy mają taśmę bardzo wysokiej jakości i nie są zainteresowani publikowaniem treści, których nie czują w swoim głosie” – powiedział Habib. „To jest przypadek użycia, na którym się koncentrujemy”.

W takim przypadku pod względem jakości filmy QuickVid są na ogół mieszane. Filmy w tle wydają się być nieco przypadkowe lub tylko stycznie związane z tematem, co nie jest zaskakujące, biorąc pod uwagę, że QuickVids jest obecnie ograniczony do katalogu Pexels. Tymczasem obrazy wygenerowane przez DALL-E 2 pokazują ograniczenia dzisiejszej technologii zamiany tekstu na obraz, takie jak zniekształcony tekst i nieprawidłowe proporcje.

W odpowiedzi na moją opinię Habib powiedział, że QuickVid jest „codziennie testowany i modyfikowany”.

Kwestie praw autorskich

Według Habiba użytkownicy QuickVid zastrzegają sobie prawo do komercyjnego wykorzystania tworzonych przez siebie treści i uzyskania zgody na zarabianie na nich na platformach takich jak YouTube. Ale status praw autorskich do treści generowanych przez sztuczną inteligencję… jest niejasny, przynajmniej na razie. Niedawno Urząd Patentów i Znaków Towarowych Stanów Zjednoczonych (USPTO). przeniósł się Aby cofnąć ochronę praw autorskich do komiksu generowanego przez sztuczną inteligencję, na przykład argumentując, że dzieła chronione prawem autorskim wymagają autorstwa człowieka.

Zapytany, w jaki sposób decyzja USPTO może wpłynąć na QuickVid, Habib powiedział, że wierzy, że dotyczy to tylko „kwalifikowalności patentowej” dla produktów generowanych przez sztuczną inteligencję, a nie praw twórców do wykorzystywania ich treści i zarabiania na nich. Zauważył, że twórcy często nie zgłaszają patentów na filmy i zwykle dążą do ekonomii twórców, umożliwiając innym twórcom ponowne wykorzystanie ich klipów w celu zwiększenia zasięgu.

„Twórcy są zainteresowani udostępnianiem wysokiej jakości treści swoim głosem, które pomogą rozwinąć ich kanał” – powiedział Habib.

Kolejne wyzwanie prawne na horyzoncie może wpłynąć na integrację QuickVid DALL-E 2 — a co za tym idzie, na zdolność witryny do generowania nakładek obrazów. Powstają Microsoft, GitHub i OpenAI pozew sądowy w pozwie zbiorowym, oskarżając ich o naruszenie prawa autorskiego poprzez zezwolenie Copilot, systemowi generowania kodu, na zwrot części licencjonowanego kodu bez podania źródła. (Copilot został opracowany wspólnie przez OpenAI i GitHub, którego właścicielem jest Microsoft). Sprawa ma implikacje dla sztuki generatywnej AI, takiej jak DALL-E 2, który został znaleziony w podobny sposób. kopiuj i wklej ze zbiorów danych, na których zostali przeszkoleni (tj. obrazów).

Habib nie martwi się, argumentując, że generatywny dżin sztucznej inteligencji wyszedł z butelki. „Jeśli jutro pojawi się kolejny proces sądowy i OpenAI zniknie, istnieje kilka alternatyw, które mogłyby zasilić QuickVid”, powiedział, odnosząc się do otwartego systemu podobnego do DALL-E 2. stabilny spread. QuickVid już testuje Stable Diffusion pod kątem generowania awatarów.

Moderacja i spam

Pomijając dylematy prawne, QuickVid może wkrótce mieć problem z moderacją. Podczas gdy OpenAI wdrożyło filtry i techniki, aby temu zapobiec, generatywna sztuczna inteligencja ma znane problemy z toksycznością i realistyczną dokładnością. Rury GPT-3 mylna informacja, zwłaszcza w odniesieniu do ostatnich wydarzeń, które wykraczają poza granice jej wiedzy. A ChatGPT, doskonale dostrojony potomek GPT-3, był Pokazane Za używanie rasistowskiego i seksistowskiego języka.

Jest to niepokojące, szczególnie dla osób, które używają QuickVid do tworzenia filmów informacyjnych. W szybkim teście poprosiłem mojego partnera — który jest bardziej kreatywny niż ja, zwłaszcza w tej dziedzinie — o wprowadzenie obraźliwych podpowiedzi, aby zobaczyć, co wygeneruje QuickVid. Według uznania QuickVid, problematyczne twierdzenia, takie jak „nowy żydowski porządek świata” i „teoria spiskowa z 11 września”, najwyraźniej nie doprowadziły do powstania toksycznych tekstów. Ale aby Krytyczna Teoria Rasy mogła indoktrynować uczniów, QuickVid wyprodukował film sugerujący, że Krytyczną Teorię Rasy można wykorzystać do prania mózgów uczniom.

Widzimy:

Habib mówi, że większość prac związanych z moderacją polega na filtrach OpenAI i utrzymuje, że użytkownicy muszą ręcznie przeglądać każdy film wygenerowany przez QuickVid, aby upewnić się, że „wszystko jest w granicach prawa”.

„Ogólną zasadą jest, że ludzie powinni mieć możliwość wyrażania siebie i tworzenia dowolnych treści” – powiedział Habib.

Wygląda na to, że zawiera spam. Habib twierdzi, że algorytmy platform wideo, a nie QuickVid, najlepiej nadają się do określania jakości wideo, a ludzie, którzy tworzą treści niskiej jakości, „tylko niszczą swoją reputację”. Mówi, że utrata reputacji w naturalny sposób zniechęci ludzi do tworzenia masowych kampanii spamowych za pomocą QuickVid.

Dodał: „Jeśli ludzie nie chcą oglądać twojego filmu, nie uzyskasz dystrybucji na platformach takich jak YouTube”. „Tworzenie treści niskiej jakości spowoduje również, że ludzie będą negatywnie postrzegać Twój kanał”.

Warto jednak przyjrzeć się agencjom reklamowym, takim jak Fractl, które w 2019 roku wykorzystały system sztucznej inteligencji o nazwie Grover do stworzenia witryny pełnej materiałów marketingowych – niech to diabli z reputacją. w wywiad W przypadku The Verge partnerka Fractl, Christine Tinsky, powiedziała, że spodziewa się generatywnej sztucznej inteligencji, która umożliwi „ogromne tsunami treści generowanych komputerowo wszędzie, gdzie tylko można sobie wyobrazić”.

W każdym razie platformy udostępniania wideo, takie jak TikTok i YouTube, nie musiały zajmować się modyfikacją treści generowanych przez sztuczną inteligencję na dużą skalę. Deepfake – syntetyczne filmy, które zastępują istniejącą osobę wyglądem innej osoby – zaczęły pojawiać się na platformach takich jak YouTube kilka lat temu, Napędzany narzędziem co ułatwiło wykonywanie ujęć głębi. Ale w przeciwieństwie do dzisiejszych najbardziej przekonujących deepfake’ów, jasne jest, że rodzaje filmów tworzonych przez QuickVid nie są w żaden sposób tworzone przez sztuczną inteligencję.

Zasady wyszukiwarki Google dotyczące tekstu generowanego przez sztuczną inteligencję mogą być zapowiedzią tego, co ma nadejść w dziedzinie wideo. Google nie traktuje tekstu syntetycznego inaczej niż tekst napisany przez człowieka pod względem rankingu wyszukiwania, ale podejmuje działania Zawiera treści „mające na celu manipulowanie rankingami wyszukiwania, a nie pomoc użytkownikom”. Obejmuje treści zgrupowane razem lub skompilowane z różnych stron internetowych.[doesn’t] dodanie wystarczającej wartości”, jak również treści generowane przez całkowicie zautomatyzowane procesy, z których oba mogą dotyczyć QuickVid.

Innymi słowy, filmy generowane przez sztuczną inteligencję mogą nie zostać całkowicie zablokowane na platformach, jeśli zostaną uruchomione w znaczący sposób, ale raczej staną się kosztem prowadzenia działalności. Jest mało prawdopodobne, aby rozwiało to obawy ekspertów, którzy uważają, że platformy takie jak TikTok stają się ich nowym domem zwodniczy wideo, ale – jak powiedział Habib podczas wywiadu – „nie da się zatrzymać generatywnej rewolucji AI”.

Andrzej Stasiuk

Andrzej Stasiuk jest współpracownikiem serwisu Przecław News, gdzie zajmuje się tematyką wiadomości, polityki, biznesu, technologii, sportu, rozrywki i stylu życia. Skupia się na jasnym i rzetelnym przekazywaniu informacji, relacjonowaniu bieżących wydarzeń oraz prezentowaniu historii i tematów, które mają znaczenie dla współczesnych czytelników.

QuickVid wykorzystuje sztuczną inteligencję do tworzenia krótkich filmów z lektorem

Idź za wideo

Kwestie praw autorskich

Moderacja i spam

Jakie korzyści oferują serwery VPS w 2026 roku?

TRUE NORTH uruchomiła nową platformę marki „Life’s Different After” w ramach kampanii Today the Brave

Pomiar mowy ciała Wiadomości o Mirażu

Arabia Saudyjska mocno obniża ceny ropy dla Azji. Największa korekta od ponad dwóch dekad

Dino rozwija własną energetykę słoneczną. Kierowcy aut elektrycznych liczą na więcej

Rekordowe niemal 124 mld zł na obronność w 2025 roku. NIK podsumowała wydatki państwa

Polsat pokaże dziś hitową komedię romantyczną. „Tylko nie ty” wraca do telewizji

Idź za wideo

Kwestie praw autorskich

Moderacja i spam

Dodaj komentarz Anuluj pisanie odpowiedzi

Więcej artykułów

Jakie korzyści oferują serwery VPS w 2026 roku?

TRUE NORTH uruchomiła nową platformę marki „Life’s Different After” w ramach kampanii Today the Brave

Pomiar mowy ciała Wiadomości o Mirażu

Być może przegapiłeś

Arabia Saudyjska mocno obniża ceny ropy dla Azji. Największa korekta od ponad dwóch dekad

Dino rozwija własną energetykę słoneczną. Kierowcy aut elektrycznych liczą na więcej

Rekordowe niemal 124 mld zł na obronność w 2025 roku. NIK podsumowała wydatki państwa

Polsat pokaże dziś hitową komedię romantyczną. „Tylko nie ty” wraca do telewizji