Naukowcy z IBM w San Jose w Kalifornii opracowali chip komputerowy inspirowany mózgiem, który może ulepszyć sztuczną inteligencję (AI), działając szybciej i przy znacznie mniejszym zużyciu energii. Masywny układ procesora NorthPole eliminuje potrzebę częstego dostępu do pamięci zewnętrznej, umożliwiając w ten sposób wykonywanie zadań takich jak rozpoznawanie obrazów szybciej niż w przypadku obecnej infrastruktury – zużywając przy tym znacznie mniej energii.
„Ich efektywność energetyczna jest absolutnie niesamowita” – mówi Damien Kerlioz, badacz nanoelektroniki na Uniwersytecie Paris-Saclay w Palisau. Praca opublikowana w Nauki1Mówi, że przetwarzanie danych i pamięć można łączyć na dużą skalę. „Czuję, że ten artykuł wstrząśnie powszechnym sposobem myślenia w architekturze komputerów”.
NorthPole obsługuje sieci neuronowe: wielowarstwowe tablice prostych jednostek obliczeniowych zaprogramowanych do rozpoznawania wzorców w danych. Dolna warstwa pobiera dane, takie jak piksele obrazu; Każda kolejna warstwa wykrywa coraz bardziej złożone wzorce i przekazuje informację do następnej warstwy. Górna warstwa generuje dane wyjściowe, które mogą na przykład wyrazić prawdopodobieństwo, że obraz zawiera kota, samochód lub inne obiekty.
Wąskie gardło zwolniło
Niektóre układy komputerowe radzą sobie wydajnie z takimi obliczeniami, ale przy każdym obliczaniu warstwy nadal muszą używać pamięci zewnętrznej zwanej pamięcią o dostępie swobodnym (RAM). Przesyłanie danych między chipami w ten sposób spowalnia działanie, jest to zjawisko znane jako wąskie gardło von Neumanna, nazwane na cześć matematyka Johna von Neumanna, który jako pierwszy przewidział standardową architekturę komputerów opartą na oddzielnej jednostce przetwarzającej i jednostce pamięci.
Wąskie gardło Von Neumanna to jeden z najważniejszych czynników spowalniających aplikacje komputerowe, w tym sztuczną inteligencję. Prowadzi to również do nieefektywności energetycznej. Współautor badania, Dharmendra Modha, inżynier komputerowy w IBM, twierdzi, że kiedyś oszacował, że symulowanie ludzkiego mózgu w tego typu architekturze wymagałoby produkcji odpowiadającej 12 reaktorom jądrowym.
NorthPole składa się z 256 jednostek obliczeniowych, czyli rdzeni, z których każdy zawiera własną pamięć. „Odciążasz wąskie gardło Von Neumanna wewnątrz jądra” – mówi Moda, główny naukowiec IBM ds. obliczeń inspirowanych mózgiem w firmowym Centrum Badawczym Almaden w San Jose.
Jądra są połączone ze sobą siecią inspirowaną połączeniami istoty białej między częściami ludzkiej kory mózgowej, mówi Moda. Te i inne zasady projektowe – z których większość istniała już wcześniej, ale nigdy nie została połączona w jednym chipie – umożliwiają NorthPole pokonanie istniejących urządzeń AI z dużą przewagą w standardowych testach porównawczych rozpoznawania obrazu. Wykorzystuje także jedną piątą mocy nowoczesnych chipów AI, mimo że nie wykorzystuje najnowszych, najbardziej zminiaturyzowanych procesów produkcyjnych. Autorzy szacują, że gdyby projekt NorthPole został wdrożony przy użyciu najnowocześniejszych procesów produkcyjnych, jego wydajność byłaby 25 razy lepsza niż obecne projekty.
na właściwym torze
Ale nawet 224 MB pamięci RAM NorthPole nie wystarczy dla dużych modeli językowych, takich jak te używane przez Chatbota, które nawet w najprostszych wersjach zużywają kilka tysięcy megabajtów danych. Chip może obsługiwać jedynie wstępnie zaprogramowane sieci neuronowe, które należy wcześniej „przeszkolić” na osobnym urządzeniu. Autorzy artykułu twierdzą jednak, że architektura NorthPole może być użyteczna w zastosowaniach, w których prędkość ma kluczowe znaczenie, takich jak samochody autonomiczne.
Technologia NorthPole przenosi moduły pamięci fizycznie jak najbliżej elementów obliczeniowych rdzenia. W innych miejscach badacze opracowują bardziej radykalne innowacje, wykorzystując nowe materiały i procesy produkcyjne. Umożliwia to samym modułom pamięci wykonywanie obliczeń, co w zasadzie może jeszcze bardziej zwiększyć szybkość i wydajność.
Kolejny slajd, opisany w zeszłym miesiącu2Wykonuje obliczenia w pamięci przy użyciu memrystorów, czyli elementów obwodu zdolnych do przełączania się między byciem rezystorem a przewodnikiem. „Zarówno podejście IBM, jak i nasze, obiecują zmniejszyć opóźnienia i koszty energii związane z przesyłaniem danych” – mówi Bin Zhao z Uniwersytetu Tsinghua w Pekinie, który jest współautorem badania nad memrystorami.
Istnieje inne podejście, opracowane przez kilka zespołów, w tym zespół w oddzielnym laboratorium IBM w Zurychu w Szwajcarii3 — Przechowuje informacje poprzez zmianę struktury krystalicznej elementu obwodu. Czas pokaże, czy możliwe będzie ekonomiczne wykorzystanie tych nowszych metod na większą skalę.
„Chcę być miłośnikiem telewizji. Certyfikowany entuzjasta popkultury. Stypendysta Twittera. Student amator.”
More Stories
TRUE NORTH uruchomiła nową platformę marki „Life's Different After” w ramach kampanii Today the Brave
Pomiar mowy ciała Wiadomości o Mirażu
W trakcie testu | Rower Giant Revolt 2025 ma dodatkowe schowki w dolnej rurze i twierdzi, że zapewnia większy komfort