Chcete poznat CSMPT-7B — otevřený český AI model? Níže najdete přehled k červnu 2026. Smysl není „porazit velké americké modely”, ale česká jazyková síla a možnost ponechat data v EU.

Co je CSMPT-7B?

první čistě český velký jazykový model (7 mld. parametrů, na základu MPT-7B s českým slovníkem, trénován na českých textech od roku 1850), vydaný v rámci projektu semANT. Akademický/výzkumný projekt, ne „lepší než GPT“ Vznikl na VUT Brno (BUT-FIT), vychází z anglického MPT-7B s nahrazeným českým slovníkem a byl trénován na českých textech (z internetu, Internet Archive a historických textů od roku 1850). Váhy jsou otevřené na Hugging Face, takže model lze self-hostovat.

Klady a zápory

Klady

  • Zaměření na češtinu a otevřené váhy (Hugging Face), takže ho lze self-hostovat
  • Data lze self-hostingem ponechat v EU/Česku (volba umístění dat)
  • První čistě český velký jazykový model — přínos pro český ekosystém

Zápory

  • Jde o akademický/výzkumný projekt, ne „lepší než GPT”
  • Na obecné anglické úkoly bývají velké americké modely silnější
  • Licenci ověřte přímo na kartě modelu na Hugging Face

Pro koho se hodí?

Jasná volba, pokud si ceníte české jazykové síly nebo chcete ponechat data v EU self-hostingem otevřeného modelu. České a evropské AI modely — CSMPT-7B (VUT Brno, první čistě český jazykový model, 7 mld. parametrů), OpenEuroLLM (konsorcium 20 evropských institucí koordinované z Univerzity Karlovy / ÚFAL, start únor 2025), benchmark BenCzechMark a EU-suverénní Mistral (Francie) — jsou cenné hlavně jako BYO-model vrstva, česká jazyková síla a možnost ponechat data v EU. Neznamená to, že porážejí velké americké modely ve výkonu. Benchmarky od vývojářů jsou tvrzení, ne nezávisle ověřený fakt.

Kde se ukládají moje data? Poskytovatel s americkou mateřskou firmou může spadat pod americký CLOUD Act, takže americké úřady mohou žádat o přístup k datům, i když leží v EU. Data mohou zůstat v EU — v Česku ale žádný nativní region velkých poskytovatelů není; nejbližší jsou Frankfurt (AWS eu-central-1), Varšava (Poland Central) a Vídeň [ověřit], všechny v EU. Pokud chcete víc kontroly: zvolte EU region, self-host ve vlastním účtu, provoz lokálně nebo evropský/otevřený model.

Pokud vám záleží na kontrole nad daty, může být cestou platforma s BYO-modelem a self-hostingem jako osFoundry, protože vaše data mohou zůstat ve vašem vlastním účtu nebo lokálně

Čtěte také

Tento článek je obecná informace, ne právní ani daňové poradenství.