<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Benchmark on ZoliBen Csupra(Kabra)</title><link>https://zoliben.com/de/tags/benchmark/</link><description>Recent content in Benchmark on ZoliBen Csupra(Kabra)</description><generator>Hugo</generator><language>de</language><lastBuildDate>Thu, 23 Apr 2026 12:00:00 +0000</lastBuildDate><atom:link href="https://zoliben.com/de/tags/benchmark/index.xml" rel="self" type="application/rss+xml"/><item><title>Qwen 3.6: 35B vs 27B Vergleich - Benchmark-Ergebnisse</title><link>https://zoliben.com/de/posts/2026-04-23-qwen-36-35b-vs-27b-benchmark-ergebnisse/</link><pubDate>Thu, 23 Apr 2026 12:00:00 +0000</pubDate><guid>https://zoliben.com/de/posts/2026-04-23-qwen-36-35b-vs-27b-benchmark-ergebnisse/</guid><description>&lt;p>Endlich habe ich alle Qwen 3.6 Modell-Testergebnisse zusammengefasst, die ich in den letzten Tagen gesammelt habe. Ich habe zwei Modelle im Detail verglichen: das &lt;strong>Qwen3.6-35B-A3B&lt;/strong> (MoE, hybrid attention/delta) und das &lt;strong>Qwen3.6-27B&lt;/strong> (dense, hybrid attention/delta). Beide habe ich mit turbo3 KV Cache-Kompression auf einer RTX 4090 als llama.cpp Server betrieben.&lt;/p>
&lt;p>Wenn ich kurz zusammenfassen müsste: das 35B-A3B ist &lt;strong>3-4x schneller&lt;/strong> in allem, aber das 27B liefert &lt;strong>bessere Qualität&lt;/strong>. Dies ist der klassische MoE vs. Dense Tradeoff, nur mit Zahlen untermauert.&lt;/p></description></item></channel></rss>