Course Learning  (3)

DeepSeek Related  (4)

Engineering Development Skills🔧  (7)

Leetcode  (10)

SJTU-xflops2024  (6)

Articles

LM Evaluation Harness

Source code reading of lm-evaluation-harness.

Nov-25-2025 · 20 min · 9901 words · WITHER

Self Verification Length Policy

Paper Reading of SVIP.

Nov-12-2025 · 4 min · 1689 words · WITHER

UnderstandingMetricsForLLMs

传统上,语言模型的性能是通过困惑度 (Perplexity)、交叉熵 (Cross Entropy) 和每字符比特数(Bit Per Character)来衡量的。随着语言模型越来越多地被用作其他NLP任务的预训练模型,它们也经常根据它们在下游任务中的表现进行评估。GLUE基准分数是对语言模型进行更广泛的多任务评估的一个例子。 ...

Oct-23-2025 · 7 min · 3303 words · WITHER

AwesomeQuantizationMethod

Quantization 量化是指在推理性能损失最小的情况下,减少模型参数中的比特数 (即精度) 的过程。对模型进行量化的好处有 减小模型体积。 提升推理速度。 在模型推理时,需要不断地从内存中读取模型权重和中间激活值。量化后就能在相同时间内读取更多数据。 处理器执行整数运算的速度远快于浮点运算,如果硬件有专门的低精度计算单元可以显著增加运算速度。 Uniform Quantization Comparison between uniform quantization (left) and non-uniform quantization (right). ...

Oct-13-2025 · 52 min · 25827 words · WITHER

HASTILY

Paper reading of HASTILY.

Oct-07-2025 · 8 min · 3516 words · WITHER

MixQ

Paper reading of MixQ.

Oct-07-2025 · 7 min · 3332 words · WITHER

SpecInfer

Paper reading of SpecInfer.

Oct-06-2025 · 10 min · 4779 words · WITHER

APTMOE

Paper reading of APTMOE.

Oct-06-2025 · 9 min · 4428 words · WITHER

StreamingGS

Paper reading of StreamingGS.

Oct-05-2025 · 9 min · 4282 words · WITHER

HybridMoE

Paper reading of HybridMoE.

Oct-04-2025 · 7 min · 3071 words · WITHER