Zanurzanie się w generowaniu obrazów AI
Sztuczna inteligencja jawi się jako niezwykle intrygująca dziedzina badań, szczególnie w obszarze generatorów obrazu. Jednak opanowanie takiej technologii nie zawsze może oznaczać sukces. Badanie tych systemów jako zjawiska, wraz z ich wpływem i implikacjami w rzeczywistym świecie, może wzbudzić porównywalne zainteresowanie. Niedawno uzyskano przełomowy dostęp do wysoce zaawansowanych obrazów AI- algorytmy generowania, a mianowicie „Dally” z OpenAI i „Stable Diffusion” ze Stability AI. Możliwość głębszego zagłębienia się w świat generowania obrazów opartym na sztucznej inteligencji, jaki zapewniają te algorytmy, zapoczątkowała znaczące rewelacje.
Eksperymenty i obserwacje
Do wstępnych eksperymentów wykorzystano identyczne podpowiedzi tekstowe użyte wcześniej w innym filmie, prosząc algorytmy o wygenerowanie obrazu psa wykonanego z cegieł.
Kluczowe obserwacje obejmowały:
- Wymagana specyfika w przypadku tych zaawansowanych algorytmów.
- Dally i Stable Diffusion skupiają się na generowaniu jak najdokładniejszej wizualnej repliki dostarczonego monitu tekstowego.
- Artystyczne lub niejasne podpowiedzi zwykle dawały konwencjonalne obrazy.
Postrzeganie wizji, wiedzy i obrazów AI
Co dokładnie dzieje się za kulisami? Algorytmy te, obciążone znaczną ilością danych szkoleniowych, zostały dostosowane do postrzegania i wizualnego renderowania obiektu lub sceny. Zrozumienie, widzenie i wyobrażanie sobie w przypadku sztucznej inteligencji nie oznacza świadomości ani samoświadomości. Zamiast tego te terminy ilustrują zdolność sztucznej inteligencji do wykonania zadania w oparciu o wyszkolone umiejętności NA.
Praktyczne zastosowania sztucznej inteligencji
Propozycję przetestowano, poinstruując sztuczną inteligencję, aby wygenerowała realistyczne obrazy, takie jak oświetlony słońcem kieliszek kwiatów na sosnowym stole. Sztuczna inteligencja z powodzeniem wygenerowała obrazy, które wyglądały wiarygodnie realistycznie, z załamaniami światła, skoncentrowanym światłem i precyzyjnymi cieniami. Wykazano wyłaniającą się właściwość procesu uczenia się, ponieważ obejmował on załamanie światła oraz sposób, w jaki światło słoneczne jest załamywane i skupiane przez szklane przedmioty.
Ograniczenia i błędne interpretacje AI
Algorytmy nie są jednak pozbawione wad. Ograniczenia obejmują:
- Wiele cech w jednym monicie często powoduje zamieszanie i nieprawidłowe generowanie obrazu.
- Złożona prośba, np. „wiewiórka trzymająca pudełko wielobarwnych metalowych kulek na czerwonym stole”, może spowodować powstanie obrazu przedstawiającego czerwoną ścianę, a nie czerwony stół.
Pomimo tych rozbieżności wyniki pozostają imponująco zbliżone do żądanych, co odzwierciedla ludzką tendencję do błędnego interpretowania złożonych zdania.
Rozszerzenie o generowanie tekstu
Eksploracja granic doprowadziła do ambitnego posunięcia polegającego na poproszeniu algorytmów o wygenerowanie wyników tekstowych, czyli w dziedzinie, w której nie byli przeszkoleni. Chociaż wyniki okazały się zabawnie nonsensowne, algorytmom udało się wyczarować wyniki przypominające tekst dzięki wcześniejszym kontaktom z atrybutami tekstowymi, takimi jak znaki, plakaty i etykiety, w danych szkoleniowych.
Elementy językowe i wizje ekspertów
Współpraca z Simonem Roperem, YouTuberem znanym ze swojej wiedzy na temat języków starożytnych, zaowocowała wyjątkową analizą. Dla niego nieobecne były archetypowe elementy, które były oczywiste dla innych. Zgodził się jednak przeczytać i zinterpretować wyniki w stylu staroangielskim, oferując odmienny punkt widzenia na temat wyników.
Potencjał generowania obrazu AI
Podsumowując, odkrywanie możliwości i funkcji sztucznej inteligencji jest ekscytującym przedsięwzięciem. Pomimo sporadycznych problemów algorytm generowania obrazów AI wykazał się zaskakującą kompetencją i ciągłą ewolucją. Prawdziwa radość czerpie jednak z testowania nieoczekiwanego, wychodzenia poza strefy komfortu i odkrywania ograniczeń modeli sztucznej inteligencji, czasami przeciwstawiając się przy tym wytycznym. W końcu innowacja spoczywa na marginesie pewności i zachęca do eksploracji nieznanego.