<rss xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title>Batching - 标签 - 华华的小站</title><link>http://blog.zyhector.com/tags/batching/</link><description>Batching - 标签 - 华华的小站</description><generator>Hugo -- gohugo.io</generator><language>zh-CN</language><lastBuildDate>Tue, 24 Mar 2026 15:05:00 -0700</lastBuildDate><atom:link href="http://blog.zyhector.com/tags/batching/" rel="self" type="application/rss+xml"/><item><title>「从零开始学大模型」Continuous Batching</title><link>http://blog.zyhector.com/2026/03/06-continuousbatching/</link><pubDate>Tue, 24 Mar 2026 15:05:00 -0700</pubDate><author>Hector</author><guid>http://blog.zyhector.com/2026/03/06-continuousbatching/</guid><description><![CDATA[<p>简单来说就是 Batch 的方式不只有平凡地把 <code>[T, D]</code> 的 Token 向量 “叠起来” 拼，形成 <code>[B, T, D]</code> 的矩阵。在最底层矩阵计算的时候，它被 pytorch 给展平成 <code>[B * T, D]</code> 这样一个大矩阵，去做矩阵乘法。</p>]]></description></item></channel></rss>