<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Benchmark on ZoliBen Csupra(Kabra)</title><link>https://zoliben.com/pt-br/tags/benchmark/</link><description>Recent content in Benchmark on ZoliBen Csupra(Kabra)</description><generator>Hugo</generator><language>pt-br</language><lastBuildDate>Thu, 23 Apr 2026 12:00:00 +0000</lastBuildDate><atom:link href="https://zoliben.com/pt-br/tags/benchmark/index.xml" rel="self" type="application/rss+xml"/><item><title>Qwen 3.6: Comparação 35B vs 27B - resultados de benchmark</title><link>https://zoliben.com/pt-br/posts/2026-04-23-qwen-36-35b-vs-27b-resultados-de-benchmark/</link><pubDate>Thu, 23 Apr 2026 12:00:00 +0000</pubDate><guid>https://zoliben.com/pt-br/posts/2026-04-23-qwen-36-35b-vs-27b-resultados-de-benchmark/</guid><description>&lt;p>Finalmente resumi todos os resultados dos testes dos modelos Qwen 3.6 que coletei nos últimos dias. Comparei dois modelos em detalhes: o &lt;strong>Qwen3.6-35B-A3B&lt;/strong> (MoE, hybrid attention/delta) e o &lt;strong>Qwen3.6-27B&lt;/strong> (dense, hybrid attention/delta). Executei ambos com compressão de cache KV turbo3 em uma RTX 4090 como servidor llama.cpp.&lt;/p>
&lt;p>Se eu tivesse que resumir brevemente: o 35B-A3B é &lt;strong>3-4x mais rápido&lt;/strong> em tudo, mas o 27B entrega &lt;strong>melhor qualidade&lt;/strong>. Este é o tradeoff clássico MoE vs. dense, apenas apoiado por números.&lt;/p></description></item></channel></rss>