Falcon 2 – Instytut Innowacji Technologicznych ze ZEA przedstawia nową serię modeli AI, która prześcignęła nowy model Llama 3 firmy Meta

  • Seria Falcon 2 nowej generacji wprowadza otwarty, wielojęzyczny i multimodalny model AI, który jako jedyny obejmuje funkcje VLM
  • Nowy model Falcon 2 11B osiąga lepsze wyniki niż zaprezentowany przez firmę Meta model Llama 3 8B, a także osiąga wyniki porównywalne z wiodącym modelem Google Gemma 7B zgodnie z niezależną weryfikacją w ramach klasyfikacji Hugging Face
  • W najbliższej przyszłości planowane są prace w zakresie „mieszaniny ekspertów” w celu doskonalenia funkcji uczenia maszynowego

Falcon Image Caption Generator (Photo: AETOSWire)

ABU ZABI, Zjednoczone Emiraty Arabskie--()--Instytut Innowacji Technologicznych (TII), wiodące globalne centrum badań naukowych i filar badań stosowanych Rady ds. Badań nad Zaawansowanymi Technologiami (ATRC) z Abu Zabi, zaprezentował dziś po raz pierwszy drugą odsłonę swojego słynnego dużego modelu językowego (LLM) – Falcon 2. W ramach tej serii Instytut przedstawił dwie nowatorskie wersje: Falcon 2 11B – bardziej wydajny i dostępny LLM szkolony przy użyciu 5,5 bilionów tokenów z 11 miliardami parametrów, a także Falcon 2 11B VLM – wyróżniający się ze względu na funkcje języka wizyjnego (VLM), umożliwiające płynną konwersję obrazu na tekst. Oba modele są wielojęzyczne, lecz Falcon 2 11B VLM wyróżnia się przede wszystkim jako pierwszy model multimodalny opracowany przez TII, a zarazem jedyny na aktualnym rynku modeli najwyższego szczebla oferujący funkcję konwersji obrazu na tekst, która stanowi istotny postęp innowacji w dziedzinie sztucznej inteligencji.

Przetestowany w porównaniu z kilkoma innymi liczącymi się modelami AI w klasie modeli wstępnie wyszkolonych, Falcon 2 11B osiąga wydajność wyższą od nowego modelu Llama 3 firmy Meta z 8 mld parametrów (8B) i sprawdza się na równi z modelem Gemma 7B od Google, plasując się na pierwszym miejscu (Falcon 2 11B: 64.28; Gemma 7B: 64.29) w niezależnej weryfikacji Hugging Face, amerykańskiej platformy oferującej obiektywne narzędzie oceny oraz globalną klasyfikację otwartych LLM. Co więcej, Falcon 2 11B i 11B VLM to modele otwarte, zapewniające nieograniczony dostęp programistom z całego świata. W najbliższej przyszłości modele nowej generacji Falcon 2 mają zostać rozszerzone o szereg rozmiarów. Modele te zostaną udoskonalone o zaawansowane funkcje uczenia maszynowego, takie jak technika „mieszaniny ekspertów” (MoE), aby jeszcze bardziej zwiększyć ich wydajność.

Wszystkie modele AI zaprezentowane dotychczas przez TII konsekwentnie zajmują wysokie miejsca w klasyfikacjach na całym świecie jako najpotężniejsze otwarte LLM. Nowe zredukowane i wszechstronne modele Falcon 2 11B mają zapewnić TII większy udział w rynku stale ewoluującej branży generatywnej sztucznej inteligencji.

Modele Falcon 2 11B, które są wyposażone w funkcje wielojęzyczne, doskonale radzą sobie z zadaniami w języku angielskim, francuskim, hiszpańskim, niemieckim, portugalskim oraz w wielu innych językach, zwiększając wszechstronność i efektywność w różnych scenariuszach. Falcon 2 11B VLM, model języka wizyjnego, umożliwia identyfikowanie i interpretowanie obrazów i elementów wizualnych z otoczenia, umożliwiając wszechstronne zastosowanie w wielu sektorach, takich jak opieka zdrowotna, finanse, handel elektroniczny, edukacja oraz sektory prawnicze. Zastosowania te obejmują zarządzanie dokumentami, cyfrową archiwizację oraz indeksowanie kontekstowe w celu wsparcia osób niedowidzących. Ponadto modele te wymagają tylko jednego procesora graficznego do efektywnej pracy, dzięki czemu są wysoce skalowalne i łatwe do wdrożenia i integracji w mniej rozbudowanej infrastrukturze laptopów i innych urządzeń.

– Jako pierwszy z serii Falcon 2 debiutuje model Falcon 2 11B. Nie tylko wybitnie sprawdza się pod względem wydajności, ale również ponownie podkreśliliśmy w nim nasze zobowiązanie na rzecz otwartego dostępu do modeli językowych, a także zaangażowanie na rzecz Fundacji Falcon. Wkrótce na rynek trafią kolejne modele multimodalne różnych rozmiarów, ponieważ pragniemy zagwarantować dostęp do najlepszych modeli AI programistom i podmiotom ceniącym sobie prywatność, aby umożliwić im dalsze prace w dziedzinie sztucznej inteligencji – powiedział Jego Ekscelencja Faisal Al Bannai, sekretarz generalny ATRC oraz doradca prezydenta Zjednoczonych Emiratów Arabskich ds. badań strategicznych i zaawansowanych technologii.

– Sztuczna inteligencja nieustannie ewoluuje, a programiści dostrzegają liczne zalety mniejszych i wydajniejszych modeli. Oprócz ograniczenia wymogów dotyczących mocy obliczeniowych i spełnienia kryteriów zrównoważonego rozwoju, modele te zapewniają większą elastyczność, ponieważ płynnie integrują się z infrastrukturą brzegową AI, czyli kolejnym nowym megatrendem. Ponadto funkcje VLM oferowane w ramach modelu Falcon 2 otwierają nowe horyzonty pod względem dostępności AI, wspierając użytkowników transformacyjnymi interakcjami pomiędzy obrazem a tekstem – powiedział dr Hakim Hacid, dyrektor wykonawczy i p.o. głównego badacza AI Cross-Center Unit w TII, odnosząc się do debiutującego modelu.

Wszechstronność modelu Falcon 2 11B skłoniła również TII do rozważenia prac nad kolejnymi fascynującymi innowacjami w dziedzinie generatywnej sztucznej inteligencji. Przewidziano między innymi wdrożenie nowego typu funkcji uczenia maszynowego znanej jako „mieszanina ekspertów”. Technika ta obejmuje połączenie mniejszych sieci o konkretnej specjalizacji, aby zapewnić współpracę najbardziej kompetentnych dziedzin w celu opracowania wysoce wyspecjalizowanych i spersonalizowanych odpowiedzi – niczym zespół sprytnych pomocników, z których każdy wnosi inne pokłady wiedzy, a wszyscy pracują razem w celu przewidywania lub podejmowania decyzji, gdy jest to konieczne. Podejście to nie tylko zapewnia większą dokładność, ale również przyspiesza proces decyzyjny, torując drogę ku bardziej inteligentnym i wydajnym systemom AI.

Falcon 2 11B jest udostępniany na mocy licencji TII Falcon 2.0, liberalnej licencji oprogramowania na bazie Apache 2.0 zakładającej akceptowalne zasady użytkowania, które propagują odpowiedzialne korzystanie ze sztucznej inteligencji. Więcej informacji na temat nowego modelu można znaleźć na stronie FalconLLM.TII.ae.

Źródło: AETOSWire

Oficjalną, obowiązującą wersję niniejszego zawiadomienia stanowi tekst oryginalny sporządzony w języku źródłowym. Tekst tłumaczenia służy wyłącznie celom orientacyjnym, został sporządzony wyłącznie dla celów ułatwienia zrozumienia zawiadomienia i należy interpretować go w odniesieniu do tekstu źródłowego, który jest jedyną wersją mającą skutki prawne.

Contacts

Jennifer Dewan, starsza dyrektor ds. komunikacji
Jennifer.dewan@tii.ae

Contacts

Jennifer Dewan, starsza dyrektor ds. komunikacji
Jennifer.dewan@tii.ae