Einstein zeigt einem Alpaka-Jungtier vor einer Tafel mit „E=mc²“ die Relativitätstheorie.

Benchmarks für Sprachmodelle

Eigene Sprachmodelle selbst hosten? Klingt gut – besonders auf grünen Servern und datenschutzkonform. Doch wie leistungsfähig sind kleinere Modelle wirklich? Mit Benchmarks wie AlpacaEval lässt sich das testen – effizient, vergleichbar und praxisnah.