Według OpenAI i Google wytrenowano swoje modele sztucznej inteligencji na transkrypcji tekstu z filmów YouTube, co potencjalnie naruszało prawa autorskie twórców treści. New York Times. W raporcie opisującym wysiłki, jakie poczyniły OpenAI, Google i Meta, aby zmaksymalizować ilość danych, jakie mogą wprowadzić do swoich systemów AI, przytacza kilka osób posiadających wiedzę na temat praktyk stosowanych przez firmy. Stało się to zaledwie kilka dni po tym, jak dyrektor generalny YouTube Neil Mohan powiedział w wywiadzie dla… Początki Bloomberga Rzekome wykorzystanie przez OpenAI filmów z YouTube do szkolenia nowego generatora zamiany tekstu na wideo, Sora, Będzie to sprzeczne z polityką platformy.
Według New York TimesaOpenAI wykorzystało narzędzie do rozpoznawania mowy Whisper do transkrypcji ponad miliona godzin filmów z YouTube, które następnie wykorzystano do szkolenia GPT-4. Informacja Wcześniej informowałem, że OpenAI wykorzystywało filmy i podcasty z YouTube do szkolenia swoich systemów AI. Według doniesień szef OpenAI, Greg Brockman, był jednym z członków tego zespołu. Matt Bryant, rzecznik Google, powiedział, że zgodnie z zasadami Google „nieautoryzowane wycinanie lub pobieranie treści z YouTube” jest zabronione. New York TimesaMówi także, że firma nie była świadoma takiego wykorzystania przez OpenAI.
Z raportu wynika jednak, że w Google byli ludzie, którzy wiedzieli, ale nie podjęli żadnych działań przeciwko OpenAI, ponieważ Google korzystał z filmów z YouTube do szkolenia swoich modeli sztucznej inteligencji. Google powiedział New York Timesa Dzieje się tak tylko w przypadku filmów od twórców treści, którzy wyrazili na to zgodę. Engadget zwrócił się do Google i OpenAI z prośbą o komentarz.
the New York Timesa W raporcie wskazano również, że w czerwcu 2023 r. Google poprosił zespół o zmianę swojej polityki prywatności, aby uwzględnić wykorzystanie szerszej publicznie dostępnej treści, w tym Dokumentów Google i Arkuszy Google, w celu szkolenia modeli i produktów AI. Zmiany, które według Google zostały wprowadzone dla przejrzystości, zostały opublikowane w lipcu. – powiedział Bryant New York Timesa Tego typu dane są wykorzystywane wyłącznie za zgodą użytkowników, którzy zarejestrowali się w testach beta funkcji Google, a firma „nie rozpoczęła szkoleń w zakresie dodatkowych typów danych w oparciu o tę zmianę języka”. Zmień dodanego Barda jako przykład tego, do czego można wykorzystać te dane.
Korekta, 6 kwietnia 2024 r., 15:45 ET: W tej historii pierwotnie podano, że Google zaktualizowało swoją politykę prywatności w czerwcu 2022 r. W rzeczywistości aktualizacja zasad miała miejsce w 2023 r. Przepraszamy za błąd.
„Chcę być miłośnikiem telewizji. Certyfikowany entuzjasta popkultury. Stypendysta Twittera. Student amator.”
More Stories
TRUE NORTH uruchomiła nową platformę marki „Life's Different After” w ramach kampanii Today the Brave
Pomiar mowy ciała Wiadomości o Mirażu
W trakcie testu | Rower Giant Revolt 2025 ma dodatkowe schowki w dolnej rurze i twierdzi, że zapewnia większy komfort