Archive

「目之所及, 心之所向」
2025

大模型 Perplexity 详解


交叉熵损失函数详解

Cross Entropy Loss 原理、推导与实现


激活函数之 Sigmoid 函数

十分钟深入理解 Sigmoid 函数的设计原理


古文赏析

古之立大事者,不惟有超世之才,亦必有坚忍不拔之志


激活函数之 Softmax 函数

十分钟深入理解 softmax 函数的设计原理


最小二乘法详解

Least Square Method 从原理到实现


理解 RMSNorm

Root Mean Square Layer Normalization 原理与实现


大模型 InternLM2 详解


解决光标消失问题


理解 LayerNorm

Layer Normalization 原理与实现


理解 Self-Attention

十分钟掌握 self-attention 的设计原理


Transformer 中 Encoder-Decoder 的区别

From Attention Is All You Need


理解 Jacobian 矩阵

从数学定义到深度学习中的反向传播


理解 Batch Normalization

深度学习中的 Batch Normalization 原理与实践


初等函数的导数公式速记


How to compute the log-Mel spectrogram?


WhisperV3 模型介绍


编程小白也能制作自己的微信小程序?!


大模型 Embedding 详解


如何 自定义 个人博客

Jekyll 博客进阶定制指南


Jekyll Know-How


如何 零成本 打造个人博客

基于 Jekyll & GitHub Pages 搭建个人博客


LivePortrait 模型详解


Stable Diffusion 模型详解


InternVL2.5 视觉模型详解


2024

Phi-3 模型架构详解


HuggingFace 之 Tokenizer


解密 HuggingFace 模型命名规则


2021

函数求导法则

常见求导公式与复合函数求导