Apple wypuszcza model sztucznej inteligencji, który może edytować zdjęcia na podstawie poleceń tekstowych

jabłko Nie jest to dziś jeden z czołowych graczy w grze AI, ale nowy model AI o otwartym kodzie źródłowym do edycji zdjęć pokazuje, co może wnieść do przestrzeni. Model ten nosi nazwę MLLM Guided Image Editing (MGIE) i wykorzystuje multimodalne modele dużego języka (MLLM) do interpretowania poleceń tekstowych podczas przetwarzania obrazów. Innymi słowy, narzędzie ma możliwość edycji obrazów na podstawie tekstu wpisywanego przez użytkownika. Chociaż nie jest to pierwsze narzędzie, które może to zrobić, „instrukcje ludzkie są czasami zbyt krótkie, aby istniejące metody mogły je uchwycić i zastosować”. Arkusz projektu (PDF) Przeczytaj.

Firma opracowała MGIE we współpracy z naukowcami z Uniwersytetu Kalifornijskiego w Santa Barbara. MLLM mają możliwość przekształcania prostych lub niejednoznacznych podpowiedzi tekstowych w bardziej szczegółowe i jasne instrukcje, które może wykonać sam edytor obrazów. Na przykład, jeśli użytkownik chciał edytować zdjęcie pizzy pepperoni, aby „uczynić ją zdrowszą”, MLLM mogą zinterpretować to jako „dodaj dodatki wegetariańskie” i jako takie edytować obraz.

Zdjęcia pizzy, gepardów, komputerów i ludzi. (jabłko)

Oprócz wprowadzania znaczących zmian w obrazach, MGIE może także przycinać, zmieniać rozmiar i obracać obrazy, a także poprawiać jasność, kontrast i balans kolorów, a wszystko to za pomocą podpowiedzi tekstowych. Może także modyfikować określone obszary obrazu i może na przykład modyfikować włosy, oczy i ubranie znajdującej się na nim osoby lub usuwać obiekty w tle.

tak jak przedsięwzięcie Uwagi, Apple wypuściło model przez githubieale zainteresowani mogą też spróbować eksperymentalny Który jest obecnie hostowany w Hugging Face Spaces. Apple nie wyjaśniło jeszcze, czy planuje wykorzystać wiedzę zdobytą w ramach tego projektu w narzędziu lub funkcji, którą mógłby zintegrować z dowolnym swoim produktem.

Phil Lee

„Chcę być miłośnikiem telewizji. Certyfikowany entuzjasta popkultury. Stypendysta Twittera. Student amator.”

READ Twórca Minecrafta odrzuca NFT, powołując się na brak inkluzywności

Apple wypuszcza model sztucznej inteligencji, który może edytować zdjęcia na podstawie poleceń tekstowych

Królik R1 został wysłany w stanie na wpół upieczonym, ale o to właśnie chodzi

Oto jak otworzyć Skrzynię Aarona w Stellar Blade

10 niesamowitych narzędzi dla architektów i projektantów

Królik R1 został wysłany w stanie na wpół upieczonym, ale o to właśnie chodzi

Kierowca zginął, gdy jego samochód zderzył się z bramą Białego Domu

Phil Richmond z Cedar Rapids goni za marzeniami o zawodowym baseballu w Polsce

Zaskakujący powód do rezygnacji z australijskiej firmy Deloitte

Dodaj komentarz Anuluj pisanie odpowiedzi

More Stories

Królik R1 został wysłany w stanie na wpół upieczonym, ale o to właśnie chodzi

Oto jak otworzyć Skrzynię Aarona w Stellar Blade

10 niesamowitych narzędzi dla architektów i projektantów

You may have missed

Królik R1 został wysłany w stanie na wpół upieczonym, ale o to właśnie chodzi

Kierowca zginął, gdy jego samochód zderzył się z bramą Białego Domu

Phil Richmond z Cedar Rapids goni za marzeniami o zawodowym baseballu w Polsce

Zaskakujący powód do rezygnacji z australijskiej firmy Deloitte