CRC算法及其数论原理详解

以前的文章提到过CRC32C算法，实在没什么可写的了就干脆拿CRC算法水一篇文章（

模二运算

CRC 算法基于二进制域 GF(2) 上的多项式除法，其核心算法是模二运算

模二加、模二减

在任何特征为 p 的域中，加法是系数模 p 相加（减法同理）

所以 GF(2) 上的多项式加法就是模二加，等价于异或（XOR），可看作是不进位的加法（减法同理）

// 不进位（异或）
0b1101 + 0b0001 = 0b1100
// 不借位（异或）
0b1100 - 0b0001 = 0b1101

模二除

模二除类似长除法，但是减法用模二减代替

例如 0b101001 / 0b1101 = 0b110 余 0b111

至于模二乘，类似长乘法，但是加法用模二加代替（CRC用不到模二乘，这里就不写了）

CRC算法基本步骤

收发双方约定生成多项式 G(x)，其次数为 r

将载荷多项式 D(x) 左移 r 位
$$ x^{r} , D(x) $$

然后模二除 G(x)，得到余数 R(x)（商不重要，省略就行）
$$ R(x) = x^{r}D(x) mod G(x) $$

将余数附加到载荷后，最终发送的数据为：
$$ T(x) = x^{r} , D(x) + R(x) $$

接收方用相同 G(x) 做模二除法，若余数为 0，则认为无错
$$ T(x) mod G(x) = 0 $$

408真题解析

【2023统考真题】甲向乙发送数据，使用CRC算法，生成多项式为 $$ G(x) = x^{4} + x + 1 $$ 则乙方接收到比特串( D )时，可以断定无错误

A. 101110000
B. 101110100
C. 101111000
D. 101111100

解析：

首先要判断出所给数据哪一部分是载荷位，哪一部分是校验位

王道书解析：ABCD选项所给数据的前5位都是10111，所以可断定载荷部分为10111

更好的方法：多项式的次数为4，所以冗余码占4位，那么载荷就有5位，为10111

根据所给多项式，可知除数为10011，算出冗余码1100，故选D

查表法优化原理

标准 CRC 算法按位处理输入数据，判断是否需要异或生成多项式

查表法的原理是以字节为单位处理，利用线性性质实现预计算

CRC 在 GF(2) 上是线性的，也就是有
$$ CRC(A \oplus B) = CRC(A) \oplus CRC(B) $$

也就是说，可构建一张256项的预计算表，每项对应一个字节值（0x00 ~ 0xff）对应的 CRC 更新值

反射式和非反射式

反射的意思就是比特顺序反转

早期串行通信常先传 LSB（先接收二进制最低位），而 CRC 的数学模型基于 MSB

为了在 LSB 硬件中实现流式处理（在 LSB 硬件上使用 MSB 需要缓存整个字节），就采用反射方式让输入和输出反转，LSB 方式处理，等价于 MSB 直接处理原始未反转的数据

1	`输入反转 + LSB + 输出反转 -> MSB`

检错能力分析

已知余数 R(x) 的计算步骤为
$$ R(x) = x^{r}D(x) mod G(x) $$

在本分析中，我们不省略商，将商定义为 Q(x)

所以有
$$ x^{r}D(x) = Q(x)G(x) + R(x) $$

在 GF(2) 中有 a+a=0，将上式带入 T(x)，可得
$$ T(x) = x^{r} , D(x) + R(x) = Q(x)G(x) + R(x) + R(x) = Q(x)G(x) $$

所以
$$ T(x) = Q(x)G(x) \Rightarrow G(x) \mid T(x) $$

定义 E(x) 为错误图样多项式，其非零系数位置表示出错的比特位

则接收方实际收到的数据多项式是 T’(x)
$$ T’(x) = T(x) + E(x) $$

所以有
$$ T(x) \equiv 0 mod G(x) \Rightarrow T’(x) \equiv E(x) mod G(x) $$

也就是说，接收端计算的余数其实就是
$$ E(x) \bmod G(x) $$

若
$$ G(x) \nmid E(x) $$
则接收端计算的余数非零，检测到错误

若
$$ G(x)
\mid E(x)
$$
则接收端计算的余数为零，漏检

通俗地说，错误发生后，如果错误图样恰好是 G(x) 的倍式，那么接收端无法区分“这是原始数据”还是“这是出错后的数据”，这就导致了漏检

因此，CRC算法的检错能力完全由 G(x) 的代数性质决定

此处不会深入讨论代数编码理论，这对软件开发和408考研来说过于超纲，仅涉及结论

检测项目	100% 检出条件
单比特错误	G(0) = 1（常数项为1）
双比特错误	G(x) 的阶 > 最大帧长
奇数个比特错误	G(1) = 0（含因子 x + 1）
偶数个比特错误	无法保证 100% 检出
突发错误（长度 ≤ L）	L ≤ G(x) 的次数

SSE4.2实现CRC32

SSE4.2指令集提供了四个指令用于计算CRC32，生成多项式为0x1EDC6F41（也就是 CRC-32C）

首先使用detect_sse42检测处理器是否支持SSE4.2指令集，如果不支持则降级到查表实现

C++20实现代码：

module;

#include <intrin.h>

export module crc32c;

import <span>;
import <cstdint>;

constexpr uint32_t crc32c_table[256] = {
	0x00000000, 0xF26B8303, 0xE13B70F7, 0x1350F3F4, 0xC79A971F, 0x35F1141C, 0x26A1E7E8, 0xD4CA64EB,
	0x8AD958CF, 0x78B2DBCC, 0x6BE22838, 0x9989AB3B, 0x4D43CFD0, 0xBF284CD3, 0xAC78BF27, 0x5E133C24,
	0x105EC76F, 0xE235446C, 0xF165B798, 0x030E349B, 0xD7C45070, 0x25AFD373, 0x36FF2087, 0xC494A384,
	0x9A879FA0, 0x68EC1CA3, 0x7BBCEF57, 0x89D76C54, 0x5D1D08BF, 0xAF768BBC, 0xBC267848, 0x4E4DFB4B,
	0x20BD8EDE, 0xD2D60DDD, 0xC186FE29, 0x33ED7D2A, 0xE72719C1, 0x154C9AC2, 0x061C6936, 0xF477EA35,
	0xAA64D611, 0x580F5512, 0x4B5FA6E6, 0xB93425E5, 0x6DFE410E, 0x9F95C20D, 0x8CC531F9, 0x7EAEB2FA,
	0x30E349B1, 0xC288CAB2, 0xD1D83946, 0x23B3BA45, 0xF779DEAE, 0x05125DAD, 0x1642AE59, 0xE4292D5A,
	0xBA3A117E, 0x4851927D, 0x5B016189, 0xA96AE28A, 0x7DA08661, 0x8FCB0562, 0x9C9BF696, 0x6EF07595,
	0x417B1DBC, 0xB3109EBF, 0xA0406D4B, 0x522BEE48, 0x86E18AA3, 0x748A09A0, 0x67DAFA54, 0x95B17957,
	0xCBA24573, 0x39C9C670, 0x2A993584, 0xD8F2B687, 0x0C38D26C, 0xFE53516F, 0xED03A29B, 0x1F682198,
	0x5125DAD3, 0xA34E59D0, 0xB01EAA24, 0x42752927, 0x96BF4DCC, 0x64D4CECF, 0x77843D3B, 0x85EFBE38,
	0xDBFC821C, 0x2997011F, 0x3AC7F2EB, 0xC8AC71E8, 0x1C661503, 0xEE0D9600, 0xFD5D65F4, 0x0F36E6F7,
	0x61C69362, 0x93AD1061, 0x80FDE395, 0x72966096, 0xA65C047D, 0x5437877E, 0x4767748A, 0xB50CF789,
	0xEB1FCBAD, 0x197448AE, 0x0A24BB5A, 0xF84F3859, 0x2C855CB2, 0xDEEEDFB1, 0xCDBE2C45, 0x3FD5AF46,
	0x7198540D, 0x83F3D70E, 0x90A324FA, 0x62C8A7F9, 0xB602C312, 0x44694011, 0x5739B3E5, 0xA55230E6,
	0xFB410CC2, 0x092A8FC1, 0x1A7A7C35, 0xE811FF36, 0x3CDB9BDD, 0xCEB018DE, 0xDDE0EB2A, 0x2F8B6829,
	0x82F63B78, 0x709DB87B, 0x63CD4B8F, 0x91A6C88C, 0x456CAC67, 0xB7072F64, 0xA457DC90, 0x563C5F93,
	0x082F63B7, 0xFA44E0B4, 0xE9141340, 0x1B7F9043, 0xCFB5F4A8, 0x3DDE77AB, 0x2E8E845F, 0xDCE5075C,
	0x92A8FC17, 0x60C37F14, 0x73938CE0, 0x81F80FE3, 0x55326B08, 0xA759E80B, 0xB4091BFF, 0x466298FC,
	0x1871A4D8, 0xEA1A27DB, 0xF94AD42F, 0x0B21572C, 0xDFEB33C7, 0x2D80B0C4, 0x3ED04330, 0xCCBBC033,
	0xA24BB5A6, 0x502036A5, 0x4370C551, 0xB11B4652, 0x65D122B9, 0x97BAA1BA, 0x84EA524E, 0x7681D14D,
	0x2892ED69, 0xDAF96E6A, 0xC9A99D9E, 0x3BC21E9D, 0xEF087A76, 0x1D63F975, 0x0E330A81, 0xFC588982,
	0xB21572C9, 0x407EF1CA, 0x532E023E, 0xA145813D, 0x758FE5D6, 0x87E466D5, 0x94B49521, 0x66DF1622,
	0x38CC2A06, 0xCAA7A905, 0xD9F75AF1, 0x2B9CD9F2, 0xFF56BD19, 0x0D3D3E1A, 0x1E6DCDEE, 0xEC064EED,
	0xC38D26C4, 0x31E6A5C7, 0x22B65633, 0xD0DDD530, 0x0417B1DB, 0xF67C32D8, 0xE52CC12C, 0x1747422F,
	0x49547E0B, 0xBB3FFD08, 0xA86F0EFC, 0x5A048DFF, 0x8ECEE914, 0x7CA56A17, 0x6FF599E3, 0x9D9E1AE0,
	0xD3D3E1AB, 0x21B862A8, 0x32E8915C, 0xC083125F, 0x144976B4, 0xE622F5B7, 0xF5720643, 0x07198540,
	0x590AB964, 0xAB613A67, 0xB831C993, 0x4A5A4A90, 0x9E902E7B, 0x6CFBAD78, 0x7FAB5E8C, 0x8DC0DD8F,
	0xE330A81A, 0x115B2B19, 0x020BD8ED, 0xF0605BEE, 0x24AA3F05, 0xD6C1BC06, 0xC5914FF2, 0x37FACCF1,
	0x69E9F0D5, 0x9B8273D6, 0x88D28022, 0x7AB90321, 0xAE7367CA, 0x5C18E4C9, 0x4F48173D, 0xBD23943E,
	0xF36E6F75, 0x0105EC76, 0x12551F82, 0xE03E9C81, 0x34F4F86A, 0xC69F7B69, 0xD5CF889D, 0x27A40B9E,
	0x79B737BA, 0x8BDCB4B9, 0x988C474D, 0x6AE7C44E, 0xBE2DA0A5, 0x4C4623A6, 0x5F16D052, 0xAD7D5351
};

export class CRC32C {
public:
	void reset() noexcept {
		crc32_ = 0xffffffff;
	}

	static bool detect_sse42() noexcept {
		int cpu_info[4];
		__cpuid(cpu_info, 1);
		return (cpu_info[2] & (1 << 20)) != 0;
	}

	void update(std::span<const uint8_t> buffer) noexcept {
		static const bool has_sse42 = detect_sse42();

		if (has_sse42) [[likely]] {
			const uint8_t* start = buffer.data();
			const uint8_t* end = start + buffer.size();

			while (start + 8 <= end) {
				crc32_ = static_cast<uint32_t>(_mm_crc32_u64(crc32_, *reinterpret_cast<const uint64_t*>(start)));
				start += 8;
			}

			if (start + 4 <= end) {
				crc32_ = _mm_crc32_u32(crc32_, *reinterpret_cast<const uint32_t*>(start));
				start += 4;
			}
			if (start + 2 <= end) {
				crc32_ = _mm_crc32_u16(crc32_, *reinterpret_cast<const uint16_t*>(start));
				start += 2;
			}
			if (start < end) {
				crc32_ = _mm_crc32_u8(crc32_, *start);
			}
		}
		else {
			for (size_t i = 0; i < buffer.size(); ++i) {
				crc32_ = crc32c_table[(crc32_ ^ buffer[i]) & 0xff] ^ (crc32_ >> 8);
			}
		}
	}

	uint32_t final() noexcept {
		uint32_t result = crc32_ ^ 0xffffffff;
		reset();
		return result;
	}

	static uint32_t process(std::span<const uint8_t> buffer) noexcept {
		CRC32C c;
		c.update(buffer);
		return c.final();
	}

private:
	uint32_t crc32_ = 0xffffffff;
};

#网络安全 #C/C++ #考研408

CRC算法及其数论原理详解

https://crackme.net/articles/simdcrc/

作者

Brassinolide

发布于

2025年12月22日

许可协议

【赤石C++】不使用宏，实现一个“逆序”的成员访问运算符上一篇

详解MagicDot漏洞及其利用手段下一篇