Narodila se Llama 4 – dlouhý život Llamě 3 v EU

Meta blokuje multimodální Llamu 4 v EU. Inovace v AI přichází, ale ne pro nás – unijní subjekty mají smůlu.

Anglická verze (English version of this post is here).

wikisources – Lama glama Laguna Colorada – CC BY-SA 4.0, Eduardo Avaroa, Bolivia.

Jsme rok od vydání modelu Llama 3 od americké společnosti Meta, jež především zastřešuje službu Facebook, ale i Instagram. Zjednodušeně ale přesto: z pohledu kvality byla Llama 3 v ‚open source‘ loni na jaře zhruba takovým zjevem, jako byl komerční ChatGPT 4 rok předtím.

Jde o model s otevřenými vahami, který si téměř kdokoli může nahrát do svého výpočetního prostředí a v něm provozovat. To má význam jednak pro subjekty, které svá data nepřepustí vůbec žádné třetí společnosti, ale má též značný dopad na trhy a jejich konkurenci.

Llama 3 je totiž též servírována poskytovateli služeb, aniž by oni museli výrobci hradit licenční poplatky či jiné náklady vývoje. To zpětně tlačí i na cenu komerčních modelů. Navíc Llama 3 dávala příležitost i českým startupům nebo akademické sféře, pokud nějaký poměrně schopný jazykový model včetně velmi slušné češtiny chtěli plněji využívat, mít jej zcela k dispozici po technické i právní stránce (právní omezení platila i loni, ale byla únosná).

S Llamou 3 se též snadno prováděl následný akademický výzkum, např. Allenův institut ji post-traingem přeměnil na model zvaný Tülu3, schopný být s komerčními modely na par či lepší.

V lednu 2025 se objevil čínský model DeepSeek R1, který měl být výkonnější. Zda tomu tak je, bude částečně sporné, neboť třída „myslících“ modelů, do níž spadá, je specifická. Na mnoho otázek jsou uvažující modely příliš velký kanon na vrabce, za formálně přesnější úvahy se platí pomalostí výstupu. Autoři Tülu3 pak tvrdí, že jej v benchmarcích i pak poráží. Všechny tři uvedené modely ale svou povahou skutečně jsou open source.

Komerční modely pak většinou nabízí varianty na výběr, přičemž přemýšlecí verze jsou spíše jako bonus navíc než pro hlavní užití.

Llama 4

Do tohoto stavu minulou sobotu Meta vpadla s uvedením nové Llamy 4.

                                        Žebříček LMarena

V nejprestižnějším žebříčku chatbotové arény (výše) nastaly značné změny, Meta se tím posunula na druhé místo*. Vévodí Google, očekává se brzké vydání nové verze ChatGPT, čímž se poměry asi opět změní.

Ještě před rokem bych Vám k žebříčku LMarena sdělil, že je zcela spolehlivý a objektivní. V současnosti si uvedeným nejsem již tolik jist. Každému bych spíše doporučil, aby si funkce vyzkoušel a použil tu službu, se kterou pro svůj obor bude spokojený.

Důvodem je především rozmělnění činností. Základní znalostní testy jsou v zásadě již vyčerpány. Testování se tak přenáší do nik, které sice mohou být individuálně cenné, ale pro většinu běžných uživatelů jsou nadbytečné. Dtto se týká myslících modelů.

Llama 4 má mnohé technické novinky. Souhrnný model Behemoth (2TB) je skoro o řád mohutnější než byla největší předchozí verze Mety. Délka kontextu se z loňských 8K (Llama 3) zvýšila až na 10M (Llama 4 Scout), byť panují pochyby o prakticky použitelné délce. Používá se vnitřní architektura směsi expertů (MoE). Modely v nové rodině jsou ‚nativně multi-modální‘.

Poslední uvedené znamená, že jim na vstup můžete podat text nebo obrázek, nebo jejich kombinaci.

Licence Llama 4 charakterově zůstala open sourcová. V čl. 1(a) smlouvy [2] se uděluje licence „k užívání, rozmnožování, šíření, kopírování, vytváření odvozených děl a provádění úprav.“

S výjimkou subjektů z Evropské unie!

Nedílnou součástí licenční smlouvy jsou ‚Zásady přijatelného použití Llamy 4' [3], dle nichž: „Ve vztahu ke kterýmkoli multimodálním modelům obsaženým v Llama 4 se na vás nevztahují práva udělená podle oddílu 1(a) Licenční smlouvy Llama 4 Community License Agreement, pokud jste fyzickou osobou s bydlištěm v Evropské unii, nebo společností s hlavní působností v Evropské unii. Toto omezení se nevztahuje na koncové uživatele produktu nebo služby, která takové multimodální modely obsahuje.“ (přeloženo, zvýraznil autor)

Celá rodina modelů Llama 4 ze soboty byla ovšem uvedena jako nativně multimodální. A všech deset zatím zveřejněných verzí Scout i Maverick má jako vstupy uvedeny „Multilingual text and image“, tedy dvě různé principiální modality, jsou tedy multimodální, uplatní se na ně výše citovaná výluka.

Hypoteticky není vyloučeno pozdější vydání zvláštní verze modelů pro EU, které by byly mono-modální, například vyloučením některých vnitřních expertů. Vzhledem k okolnostem níže uvedeným to ale nepovažuji ani za příliš pravděpodobné, ani atraktivní.

Proč?

Internetová komunita zejména evropská pochopitelně reaguje nářkem o zmařených příležitostech startupů, výzkumníků, akademické sféry. Obecně se soudí, že důvodem je obava z nedávného nařízení EU o umělé inteligenci [6].

Dle mého právního názoru tomu tak spíše není.

Meta signalizovala rozpory s regulatorním prostředím EU již loni v létě [5], tedy před účinností zmiňovaného aktu.

Důvodem měly být postoje regulatorních orgánů na ochranu soukromí, tedy zřejmě různých národních úřadů provádějících ochranu osobních údajů, nejspíš zejména na základě nařízení GDPR.

Spor měl být veden o využitelnost dat charakteru příspěvků uživatelů Facebooku a Instagramu jako trénovacích dat budoucích modelů. Meta proto loni v květnu oslovila všechny své klienty [4] Facebooku s možností námitek proti zpracováních jejich veřejných příspěvků a fotografií pro účely AI.

Evropským úřadům buď přišla nepoužitelná uvedená forma (explicitní opt-out namísto explicitního souhlasu), anebo mohly tvrdit nevzdatelnost právního nároku na ochranu soukromí vůbec.

Meta každopádně již loni, a to při vydání modelů Llama 3.2 a Llama 3.3, omezila udělení licence pro multimodální modely klauzulemi prakticky shodnými se zde výše uvedenou.

Štěstí v neštěstí tak ještě má třeba model Llama-3.3-70B-Instruct z prosince 2024. Jelikož se jedná o výlučně textový model, klauzule se u něj nepoužije. Oproti tomu model Llama-3.2-90B-Vision-Instruct zpracovává „Text + Image“, je tedy multimodální, klauzule na něj dopadá.

Klauzule se též vůbec nevyskytovala u modelů ještě Llama 3.1 a Llama 3, ty tedy zůstávají použitelné bez těchto potíží.

Výjimky

  1. Koncový uživatel produktu s Llama.
  2. Místní zaměstnanec společnosti působící mimo EU.

Možnost první je vyjádřena bezprostředně za vylučující klauzulí, viz výše. Je přitom lhostejné, zda koncový uživatel službu využívá soukromě nebo pracovně (podle FAQ [7]). Služba ale musí být složitější, nelze jen využít služeb hostingu modelu a model tak jen nepřímo využívat na dálku.

Druhou možnost uvádí Meta na svých stránkách FAQ [7]. Dle jejich výkladu potřebnou licencí disponuje právě mimo-EU působící společnost, která ji prostředkuje svému zaměstnanci pro účel své činnosti, jež ovšem se má nacházet mimo EU. Podle FAQ toto výslovně zahrnuje i programátory aj. vývojáře.

Žádné další výjimky uváděny nejsou. Neplatí žádná výjimka užití pro výzkumné, neziskové, školní atp. prostředí.

Další vývoj?

Připomínám, že pro Facebook každý uživatel měl a nadále má možnost podat námitku proti zpracování textů a fotografii pro účely umělé inteligence ze sebou zveřejněných příspěvků, a to na adrese:
https://www.facebook.com/help/contact/6359191084165019

Narozdíl od různých řetězových hoaxů patetického „vyslovení zákazu využívání“ by na toto vyjádření byl brán zřetel. Jinak řečeno, stále se bude zjišťovat, jaký je postoj uživatelů k využití dat od nich pro trénink.

Není zcela vyloučené, že se časem změní právní názory zainteresovaných stran. Budou k dispozici zkušenosti s novými modely, vč. hodnocení toho, jakou újmu pro soukromí skutečně představují. Takové změny ale nebudou rychlé.

––

Své názory k tématu můžete vyjádřit v diskusi.

Kontaktovat emailem mne můžete přes spojení na ILAW

––

[0] Stádo Llama 4: Počátek nové éry nativně multimodálních inovací v AI, Meta, Apr 5th 2025 Odkaz

[1] Tülu3, Ai2. Odkaz

[2] LLAMA 4 COMMUNITY LICENSE AGREEMENT, Odkaz

[3] Llama 4 Acceptable Use Policy, Odkaz

[4] Bringing Generative AI Experiences to People in Europe, May 22, 2024. Odkaz

[5] Meta Withholds Models From Europe, Jul 24, 2024. Odkaz

[6] NAŘÍZENÍ EVROPSKÉHO PARLAMENTU A RADY (EU) 2024/1689 ze dne 13. června 2024 (akt o umělé inteligenci) Odkaz

[7] Troubleshooting & FAQ - Restriction on Llama Multimodal Models in the EU Odkaz

* Doplněno 9.4.: V mezidobí od vydání vyšlo najevo, že Meta pro hodnocení na LMarena zcela přesně použila model `Llama-4-Maverick-03-26-Experimental`, tedy odlišný od těch, které byly skutečně zatím vydány. Shodně ovšem postupují mnozí další výrobci, když též do žebříčku poskytují různé experimentální verze, které u nich má k dispozici jen malá část uživatelů.

Z jednoho úhlu pohledu právě experimentální verze razí různé druhy pokroku a srovnávat je smysl má. Experimenty přitom mohou trpět nechtěnými mouchami nevhodnými pro reálný provoz, pročež je legitimní si jimi nekazit produkci a jejich vlastnosti driftovat postupně. Z druhého úhlu uživatele nejvíce zajímají vlastnosti přesně té verze, kterou skutečně užívají a uvedené mají jen za fintu na sebe.

Rovněž se zveřejňování modelů rozpadlo na dvě fáze. Nejprve se existence modelu oznamuje, včetně tvrzených vlastností, a až o několik měsíců později skutečně nasazuje do použití. Nejspíš slouží pro stabilizaci uživatelské báze, aby příliš nepřelétala.

I proto jsem již výše doporučil brát žebříček nově s trochou vnitřní rezervy a soustředit se každý na své skutečné potřeby a řešení právě pro ně.

Autor: Vojtěch Kment | úterý 8.4.2025 23:57 | karma článku: 4,39 | přečteno: 124x

Další články autora

Vojtěch Kment

Gemini AI solves CERMAT Tests with 43 points out of 50

Semi-automatic system vs. Mathematics entrance exams: How did Gemini AI fare on the CERMAT tests (Czech flavor of the S.A.T.) and where did it stumble? Take a look behind the scenes. What is the future of education and learning?

23.4.2025 v 17:14 | Karma: 3,68 | Přečteno: 127x | Diskuse | Věda

Vojtěch Kment

Gemini AI řeší CERMAT testy na 43 bodů z 50

Poloautomatický systém vs. přijímací zkoušky z matematiky: Jak si AI Gemini poradila s CERMAT testy a kde narazila? Nahlédněte do zákulisí automatického řešení úloh. Jaká je budoucnost edukace a učení se?

23.4.2025 v 2:43 | Karma: 5,51 | Přečteno: 308x | Diskuse | Věda

Vojtěch Kment

Llama 4 is born – Long live Llama 3 in the EU

Meta is blocking the multimodal Llama 4 in the EU. Innovation in AI is arriving – but not for us. Entities within the EU are out of luck.

9.4.2025 v 15:06 | Karma: 3,85 | Přečteno: 108x | Diskuse | Ekonomika

Vojtěch Kment

50 minut Trump-Zelenský: Plný transkript

Úplný záznam dramatického rozhovoru mezi Trumpem a Zelenským v Oválné pracovně. Napětí, neshody i tvrdá vyjádření – celý přepis bez úprav.

1.3.2025 v 16:30 | Karma: 23,14 | Přečteno: 1205x | Diskuse | Politika

Vojtěch Kment

Projev viceprezidenta USA Vance na pařížském Summitu AI

Strategie USA pro AI: Nespočet revolučních ekonomických inovací. Pozor na hladovění po spolehlivé energii. Lomení rukami nad bezpečností nemá budoucnost. Regulační režimy volným trhem...

14.2.2025 v 16:14 | Karma: 16,69 | Přečteno: 625x | Diskuse | Politika

Nejčtenější

Poslední týden na daňové přiznání za rok 2024 online. Jak na to?

25. dubna 2025  9:05

Nejen podnikatelé, drobní živnostníci a osoby samostatně výdělečně činné musí podat daňové...

„Ty jsi bezva chlap, já ti dám zadarmo.“ Fotograf vzpomíná na hříšné devadesátky

27. dubna 2025  16:27

Fotil sametovou revoluci i dusno pozdní normalizace. Teď Jaroslav Kučera vydává knihu Sex po...

Po rychlé jízdě zemřel řidič v hořícím autě. Turek spekuluje o krvi na rukou médií

21. dubna 2025  18:19

Hasiči v Brně v pondělí našli v hořícím voze mrtvého muže. Podle prvotních informací jel vůz po...

Papež František zemřel. Bojoval s nemocemi, bylo mu 88 let

21. dubna 2025,  aktualizováno  12:07

Papež František v pondělí ráno zemřel. „Drazí bratři a sestry, s hlubokým smutkem musím oznámit...

Američané zadrželi na letišti mladé německé turistky. Musely se svléknout

22. dubna 2025  14:52

Americká pohraniční stráž zadržela na Havaji dvě mladé německé turistky, protože neměly vybrané...

Jak se lobbuje za nového papeže? Pěšáci favoritů konspirují u vína i na zmrzlině

28. dubna 2025

Premium Začátek konkláve, kde kardinálové zvolí nového papeže, je otázkou několika málo dnů. Boj o nejvyšší...

ČT před mým nástupem vyplatila několik milionových odstupných, tvrdí Souček

28. dubna 2025  19:10

Česká televize vyplatila těsně před nástupem současného generálního ředitele Jana Součka několika...

Za výbuch v Íránu zřejmě mohly chemikálie k výrobě raketového paliva, mrtvých je už 40

27. dubna 2025  9:36,  aktualizováno  28.4 18:35

Počet mrtvých po sobotní explozi v největším íránském obchodním přístavu u města Bandar-Abbás...

Jak se připravit na blackout? Nezapomeňte přenosné rádio a přepravku pro mazlíčka

28. dubna 2025  18:17

Španělsko a Portugalsko v pondělních odpoledních hodinách paralyzoval masivní výpadek elektřiny....

  • Počet článků 19
  • Celková karma 9,15
  • Průměrná čtenost 846x
Právník a počítačový inženýr.
Smysl jednotlivci i celku.

Lawyer and computer engineer in one .
Advancing person and society alike.

Seznam rubrik

Nastavte si velikost písma, podle vašich preferencí.