Benchmarks für Sprachmodelle
Eigene Sprachmodelle selbst hosten? Klingt gut – besonders auf grünen Servern und datenschutzkonform. Doch wie leistungsfähig sind kleinere Modelle wirklich? Mit Benchmarks wie AlpacaEval lässt sich das testen – effizient, vergleichbar und praxisnah.