Chcete poznat CSMPT-7B — otevřený český AI model? Níže najdete přehled k červnu 2026. Smysl není „porazit velké americké modely”, ale česká jazyková síla a možnost ponechat data v EU.
Co je CSMPT-7B?
první čistě český velký jazykový model (7 mld. parametrů, na základu MPT-7B s českým slovníkem, trénován na českých textech od roku 1850), vydaný v rámci projektu semANT. Akademický/výzkumný projekt, ne „lepší než GPT“ Vznikl na VUT Brno (BUT-FIT), vychází z anglického MPT-7B s nahrazeným českým slovníkem a byl trénován na českých textech (z internetu, Internet Archive a historických textů od roku 1850). Váhy jsou otevřené na Hugging Face, takže model lze self-hostovat.
Klady a zápory
Klady
- Zaměření na češtinu a otevřené váhy (Hugging Face), takže ho lze self-hostovat
- Data lze self-hostingem ponechat v EU/Česku (volba umístění dat)
- První čistě český velký jazykový model — přínos pro český ekosystém
Zápory
- Jde o akademický/výzkumný projekt, ne „lepší než GPT”
- Na obecné anglické úkoly bývají velké americké modely silnější
- Licenci ověřte přímo na kartě modelu na Hugging Face
Pro koho se hodí?
Jasná volba, pokud si ceníte české jazykové síly nebo chcete ponechat data v EU self-hostingem otevřeného modelu. České a evropské AI modely — CSMPT-7B (VUT Brno, první čistě český jazykový model, 7 mld. parametrů), OpenEuroLLM (konsorcium 20 evropských institucí koordinované z Univerzity Karlovy / ÚFAL, start únor 2025), benchmark BenCzechMark a EU-suverénní Mistral (Francie) — jsou cenné hlavně jako BYO-model vrstva, česká jazyková síla a možnost ponechat data v EU. Neznamená to, že porážejí velké americké modely ve výkonu. Benchmarky od vývojářů jsou tvrzení, ne nezávisle ověřený fakt.
Kde se ukládají moje data? Poskytovatel s americkou mateřskou firmou může spadat pod americký CLOUD Act, takže americké úřady mohou žádat o přístup k datům, i když leží v EU. Data mohou zůstat v EU — v Česku ale žádný nativní region velkých poskytovatelů není; nejbližší jsou Frankfurt (AWS eu-central-1), Varšava (Poland Central) a Vídeň [ověřit], všechny v EU. Pokud chcete víc kontroly: zvolte EU region, self-host ve vlastním účtu, provoz lokálně nebo evropský/otevřený model.
Pokud vám záleží na kontrole nad daty, může být cestou platforma s BYO-modelem a self-hostingem jako osFoundry, protože vaše data mohou zůstat ve vašem vlastním účtu nebo lokálně
Čtěte také
Tento článek je obecná informace, ne právní ani daňové poradenství.