YoQ Blog

「反者道之动, 弱者道之用」

如何 自定义 个人博客

Jekyll 博客进阶定制指南

Fork 现有的博客模板 关于如何 「零成本」打造个人博客, 可以参阅博主之前的分享(点击图像自动跳转): 自定义博客内容 (Build From Source) 基本概念 在动手修改之前, 先要对 Web 前端有一些浅显的认识, 比如: HTML: 文档结构标记语言(.html), 构建页面...

如何 零成本 打造个人博客

基于 Jekyll & GitHub Pages 搭建个人博客

选择 GitHub Pages + Jekyll 的理由 🆓 零成本托管: GitHub 提供免费域名 (username.github.io) 及服务器资源 ⚡ 自动部署: 提交 Markdown 文件自动生成静态网页 🔄 版本控制: 原生集成 Git 实现内容版本管理 📱 移动友好: Jekyll 默认支持...

LivePortrait 模型详解

huggingface: https://huggingface.co/KwaiVGI/LivePortrait github: https://github.com/KwaiVGI/LivePortrait 该模型是在 Face Vid2vid 的基础上进行了一系列的改进 模型输入: source driving source others 模型结构: appearance_fe...

Stable Diffusion 模型详解

模型流程如下: 用户输入 prompt, latent 可以是 noise 也可以是输入图像经过 vae-encoder 后的得到的 latent, 中间经过 unet, 最后经过 vae-decoder 获取图像输出 code: https://github.com/skylake5200/sd1.5-lcm.axera expected {‘tokenizer’, ‘text_e...

InternVL2.5 视觉模型详解

huggingface: https://huggingface.co/OpenGVLab/InternVL2_5-1B 关于 ViT 的介绍参考: https://blog.csdn.net/lsb2002/article/details/135320751 将图像分为多个 patch 之后, 还需要将其编码为 token, 在代码实现上, 就是通过一个 Conv 来实现.   模...

Phi-3 模型架构详解

模型基本信息 词汇总量: 32064 词汇表大小为 32064 意味着这个模型可以处理 32064 个不同的 tokens embedding_length: 3072 padding_idx: 32000 Transformer 架构 Embedding 层 主要是用 nn.Embedding 将输入的整数序列转换为密集的向量表示.  RMSNorm 归一化层 减少...

HuggingFace 之 Tokenizer

HuggingFace 简介 HuggingFace 是一个领先的人工智能和自然语言处理(NLP)平台, 它的 transformers 库成为了大规模预训练语言模型的事实标准. transformers 提供了强大的 API, 支持 BERT、GPT、T5 等流行模型, 并且可以无缝对接 PyTorch 和 TensorFlow. 在 transformers 库中, Toke...

解密 HuggingFace 模型命名规则

本文系统解析 HuggingFace 模型库的命名规范, 帮助开发者快速理解模型特性. 命名组件解析 典型模型名称示例: Qwen2-0.5B-Instruct-FP16 可拆解为以下几个核心组件: 组件 说明 可选值示例 模型系列 基础架构名称 ...

函数求导法则

常见求导公式与复合函数求导

导数的定义 导数 (Derivative) 描述的是函数在某一点处的瞬时变化率. 设函数 $y = f(x)$ 在点 $x$ 的某个邻域内有定义, 当自变量 $x$ 在 $x$ 处取得增量 $h$ (即 $\Delta x = h$) 时, 如果极限 \[f'(x) = \lim_{h \to 0} \frac{f(x+h) - f(x)}{h}\] 存在, 则称函数 $f(x)$ 在...