<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Turboquant on ZoliBen Csupra(Kabra)</title><link>https://zoliben.com/hu/tags/turboquant/</link><description>Recent content in Turboquant on ZoliBen Csupra(Kabra)</description><generator>Hugo</generator><language>hu</language><lastBuildDate>Thu, 23 Apr 2026 12:00:00 +0000</lastBuildDate><atom:link href="https://zoliben.com/hu/tags/turboquant/index.xml" rel="self" type="application/rss+xml"/><item><title>Qwen 3.6: 35B vs 27B összehasonlítás - teszteredmények</title><link>https://zoliben.com/hu/posts/2026-04-23-qwen-36-35b-vs-27b-osszehasonlitas-teszteredmenyek/</link><pubDate>Thu, 23 Apr 2026 12:00:00 +0000</pubDate><guid>https://zoliben.com/hu/posts/2026-04-23-qwen-36-35b-vs-27b-osszehasonlitas-teszteredmenyek/</guid><description>&lt;p>A minap végre összegeztem az összes Qwen 3.6-os modellteszt eredményemet, amit az elmúlt napokban gyűjtöttem össze. Két modellt hasonlítottam össze részletesen: a &lt;strong>Qwen3.6-35B-A3B&lt;/strong>-t (MoE, hybrid attention/delta) és a &lt;strong>Qwen3.6-27B&lt;/strong>-t (dense, hybrid attention/delta). Mindkettőt turbo3 KV cache kompresszióval futtattam RTX 4090-en, llama.cpp szerverként.&lt;/p>
&lt;p>Ha röviden akarnám összefoglalni: a 35B-A3B &lt;strong>3-4× gyorsabb&lt;/strong> mindenben, de a 27B &lt;strong>jobb minőséget&lt;/strong> ad. Ez a klasszikus MoE vs. dense tradeoff, csak éppen számokkal alátámasztva.&lt;/p>
&lt;h2 id="architektúra---mi-a-különbség">Architektúra - mi a különbség?&lt;/h2>
&lt;p>A két modell ugyanabból a Qwen3.6 családból való, mindkettő hybrid Mamba/attention architektúrát használ, de a megközelítésük teljesen más:&lt;/p></description></item></channel></rss>