导航菜单
首页 >  硕士论文怎么表示  > 科研中论文常见数学符号及其含义(科研必备,建议收藏)

科研中论文常见数学符号及其含义(科研必备,建议收藏)

论文常见数学符号及其含义(科研必备)

返回论文和资料目录

数学符号在数学领域是非常重要的。在论文中,使用数学符号可以使得论文更加简洁明了,同时也能够准确地描述各种概念和理论。在本篇博客中,我将介绍一些常见的数学符号及其含义(省去特别简单的符号),希望能够帮助读者更好地理解数学论文。

高等数学

∑i = 1n x i \sum_{i=1}^n x_i∑i=1n​xi​ (求和符号):表示将x 1 ,x 2 ,…,x n x_1,x_2,\dots,x_nx1​,x2​,…,xn​ 中的所有数相加,例如∑i = 1n x i \sum_{i=1}^n x_i∑i=1n​xi​ 表示将x 1 ,x 2 ,…,x n x_1,x_2,\dots,x_nx1​,x2​,…,xn​ 中的所有数相加。

∏i = 1n x i \prod_{i=1}^n x_i∏i=1n​xi​ (乘积符号):表示将x 1 ,x 2 ,…,x n x_1,x_2,\dots,x_nx1​,x2​,…,xn​ 中的所有数相乘,例如∏i = 1n x i \prod_{i=1}^n x_i∏i=1n​xi​ 表示将x 1 ,x 2 ,…,x n x_1,x_2,\dots,x_nx1​,x2​,…,xn​ 中的所有数相乘。

lim ⁡ x → a\lim_{x\rightarrow a}limx→a​ (极限符号):表示函数在xxx 趋近于aaa 时的极限值,例如 lim ⁡ x → af(x)\lim_{x\rightarrow a} f(x)limx→a​f(x) 表示当xxx 趋近于aaa 时,函数f(x)f(x)f(x) 的极限值。

inf⁡\infinf (下确界):表示一组数的下确界。例如inf{1,2,3}=1inf\{1,2,3\}=1inf{1,2,3}=1。

sup⁡\supsup (上确界):表示一组数的上确界。

±\pm± (加减号):表示一个数可以是正数或负数,例如x=±5x=\pm 5x=±5 表示xxx 可以是555 或−5-5−5。

≡\equiv≡ (恒等于):表示两个数或表达式相等,例如x≡yx\equiv yx≡y 表示xxx 和yyy 相等。

≠\neq= (不等于):表示两个数或表达式不相等,例如x≠yx\neq yx=y 表示xxx 不等于yyy。

\sqrt{}​ 这个符号表示平方根。例如,4 =2\sqrt{4}=24​=2,表示4的平方根为2。

∞\infty∞ 这个符号表示无穷大,表示一个数或值趋近于无穷大。例如, lim ⁡ x → ∞1 x =0\lim_{x\to\infty}\frac{1}{x}=0limx→∞​x1​=0 表示当xxx 趋近于无穷大时,1 x \frac{1}{x}x1​ 的极限值为0。

∇\nabla∇ (梯度):表示多元函数在某一点处的梯度,是一个向量。

∂\partial∂ (偏导数):表示多元函数的偏导数。

∫\int∫ (积分):表示求函数在某个区间上的积分值。

∮\oint∮ (环积分):表示在一个封闭曲线上的积分值。

∬\iint∬ (二重积分符号):表示对二元函数进行积分运算,例如∬ D f(x,y)dxdy\iint_{D} f(x,y) dxdy∬D​f(x,y)dxdy 表示对函数f(x,y)f(x,y)f(x,y) 在平面区域DDD 上进行积分运算。

∭\iiint∭ (三重积分符号):表示对三元函数进行积分运算,例如∭ E f(x,y,z)dxdydz\iiint_{E} f(x,y,z) dxdydz∭E​f(x,y,z)dxdydz 表示对函数f(x,y,z)f(x,y,z)f(x,y,z) 在空间区域EEE 上进行积分运算。

∮\oint∮ (曲线积分符号):表示对曲线上的函数进行积分运算,例如∮ C f(x,y)ds\oint_{C} f(x,y) ds∮C​f(x,y)ds 表示对函数f(x,y)f(x,y)f(x,y) 沿曲线CCC 进行积分运算。

∭ Ω \iiint_{\Omega}∭Ω​ (三重积分符号带限制):表示对三元函数在特定区域Ω\OmegaΩ 上进行积分运算,例如∭ x2 +y2 +z2 ≤R2f(x,y,z)dxdydz\iiint_{x^2+y^2+z^2 \leq R^2} f(x,y,z) dxdydz∭x2+y2+z2≤R2​f(x,y,z)dxdydz 表示对函数f(x,y,z)f(x,y,z)f(x,y,z) 在球体x 2 +y 2 +z 2 ≤R 2 x^2+y^2+z^2 \leq R^2x2+y2+z2≤R2 上进行积分运算。

排列组合

n!n!n! (阶乘符号):表示自然数nnn 的阶乘,即n!=n×(n−1)×⋯×1n!=n\times(n-1)\times\cdots\times1n!=n×(n−1)×⋯×1。

(n k )\binom{n}{k}(kn​) (组合数符号):表示从nnn 个元素中选出kkk 个元素的组合数,即(n k) = n ! k ! ( n − k ) !\binom{n}{k}=\frac{n!}{k!(n-k)!}(kn​)=k!(n−k)!n!​。例如(5 2 )\binom{5}{2}(25​) 表示从555 个元素中选取222 个元素的组合数,即C(5,2)C(5,2)C(5,2)。

P n k P_n^kPnk​ (排列数符号):表示从nnn 个元素中选出kkk 个元素的排列数,即P n k =n(n−1)⋯(n−k+1)P_n^k=n(n-1)\cdots(n-k+1)Pnk​=n(n−1)⋯(n−k+1)。

C n k C_n^kCnk​ (二项式系数符号):表示二项式(a+b) n (a+b)^n(a+b)n 的展开式中第kkk 项的系数,即C n k =(n k) C_n^k=\binom{n}{k}Cnk​=(kn​)。

∑k = 0n \sum_{k=0}^n∑k=0n​ (求和符号):表示对序列a kk = 0n {a_k}{k=0}^nak​k=0n 中的元素进行求和运算,即∑ k = 0n a k =a 0 +a 1 +⋯+a n \sum{k=0}^n a_k=a_0+a_1+\cdots+a_n∑k=0nak​=a0​+a1​+⋯+an​。

∏k = 1n \prod_{k=1}^n∏k=1n​ (乘积符号):表示对序列a kk = 1n {a_k}{k=1}^nak​k=1n 中的元素进行乘积运算,即∏ k = 1n a k =a 1 ×a 2 ×⋯×a n \prod{k=1}^n a_k=a_1\times a_2\times\cdots\times a_n∏k=1nak​=a1​×a2​×⋯×an​。

(nk )q \binom{n}{k}_q(kn​)q​ (qqq-组合数符号):表示在qqq-分之一意义下从nnn 个元素中选出kkk 个元素的组合数,即 (nk )q = ( 1 −qn ) ( 1 −qn−1 ) ⋯ ( 1 −qn−k+1 ) ( 1 −qk ) ( 1 −qk−1 ) ⋯ ( 1 − q )\binom{n}{k}_q=\frac{(1-q^n)(1-q^{n-1})\cdots(1-q^{n-k+1})}{(1-q^k)(1-q^{k-1})\cdots(1-q)}(kn​)q​=(1−qk)(1−qk−1)⋯(1−q)(1−qn)(1−qn−1)⋯(1−qn−k+1)​。

概率论

P(A)P(A)P(A) (概率符号):表示事件AAA 发生的概率,取值范围在[0,1][0,1][0,1] 之间。

E[X]E[X]E[X] (期望):表示一个随机变量XXX 的期望值,也可以写作E[X]\mathbb{E}[X]E[X],例如E[X]E[X]E[X] 表示随机变量XXX 的期望值。

V a r (X)\mathrm{Var}(X)Var(X) (方差):表示一个随机变量XXX 的方差,例如V a r (X)\mathrm{Var}(X)Var(X) 表示随机变量XXX 的方差。

C o v (X,Y)\mathrm{Cov}(X,Y)Cov(X,Y) (协方差):表示两个随机变量XXX 和YYY 的协方差,例如C o v (X,Y)\mathrm{Cov}(X,Y)Cov(X,Y) 表示随机变量XXX 和YYY 的协方差。

σ X \sigma_XσX​ (标准差符号):表示随机变量XXX 的标准差,是方差的算术平方根。

ρX , Y\rho_{X,Y}ρX,Y​ (相关系数符号):表示随机变量XXX 和YYY 之间的相关系数,是协方差除以两个随机变量的标准差的积。

∼\sim∼ (服从符号):表示一个随机变量服从某个概率分布,如X∼N(μ,σ 2 )X\sim N(\mu,\sigma^2)X∼N(μ,σ2) 表示XXX 服从正态分布,其均值为μ\muμ,方差为σ 2 \sigma^2σ2。

∪\cup∪ (并符号):表示事件的并集,如A∪BA\cup BA∪B 表示事件AAA 和事件BBB 的并集。

∩\cap∩ (交符号):表示事件的交集,如A∩BA\cap BA∩B 表示事件AAA 和事件BBB 的交集。

P(A∣B)P(A|B)P(A∣B):这是条件概率的最基本表述,表示在事件B发生的前提下,事件AAA发生的概率。其中,符号“∣|∣”表示“给定”的意思,P(A∣B)P(A|B)P(A∣B)就是给定B的情况下,AAA发生的概率。

P(A∩B)P(A∩B)P(A∩B):这个符号表示事件AAA和事件BBB同时发生的概率,其中符号“∩∩∩”表示交集,也就是AAA和BBB的共同部分。因此,P(A∩B)P(A∩B)P(A∩B)就是AAA和BBB都发生的概率。

P(A∪B)P(A∪B)P(A∪B):这个符号表示事件AAA和事件BBB至少有一个发生的概率,其中符号“∪∪∪”表示并集,也就是AAA和BBB的全部部分。因此,P(A∪B)P(A∪B)P(A∪B)就是AAA或者BBB至少一个发生的概率。

P(A ′ )P(A')P(A′):这个符号表示事件AAA不发生的概率,也可以写成P(notA)P(not A)P(notA)。其中符号“ ′ '′”表示补集,也就是AAA的相反情况。

P(A∣B)=P(A∩B)/P(B)P(A|B) = P(A∩B) / P(B)P(A∣B)=P(A∩B)/P(B):这个符号表示条件概率的公式,也是条件概率的定义式。其中,P(A∩B)P(A∩B)P(A∩B)表示AAA和BBB同时发生的概率,P(B)P(B)P(B)表示BBB发生的概率,P(A∣B)P(A|B)P(A∣B)表示在BBB发生的情况下,AAA发生的概率。

P(A∩B)=P(A∣B)×P(B)P(A∩B) = P(A|B) × P(B)P(A∩B)=P(A∣B)×P(B):这个符号表示条件概率的乘法公式,也称为贝叶斯公式。其中,P(A∣B)P(A|B)P(A∣B)表示在BBB发生的情况下,AAA发生的概率,P(B)表示B发生的概率,P(A∩B)表示A和B同时发生的概率。

P(A∪B)=P(A)+P(B)−P(A∩B)P(A∪B) = P(A) + P(B) - P(A∩B)P(A∪B)=P(A)+P(B)−P(A∩B):这个符号表示条件概率的加法公式,也称为容斥原理。其中,P(A)表示A发生的概率,P(B)表示B发生的概率,P(A∩B)表示A和B同时发生的概率,P(A∪B)表示A或者B发生的概率。

P(A1∩A2∩...∩An)=P(A1)×P(A2∣A1)×P(A3∣A1∩A2)×...×P(An∣A1∩A2∩...∩An−1)P(A1∩A2∩...∩An) = P(A1) × P(A2|A1) × P(A3|A1∩A2) × ... × P(An|A1∩A2∩...∩An-1)P(A1∩A2∩...∩An)=P(A1)×P(A2∣A1)×P(A3∣A1∩A2)×...×P(An∣A1∩A2∩...∩An−1):这个符号表示条件概率的乘法公式的扩展,也称为全概率公式。其中,A1,A2,...,AnA1,A2,...,AnA1,A2,...,An是一个完备事件组,也就是它们是互斥且构成了整个样本空间,P(A1)表示A1发生的概率,P(A2∣A1)P(A2|A1)P(A2∣A1)表示在A1A1A1发生的情况下,A2A2A2发生的概率,P(A3∣A1∩A2)P(A3|A1∩A2)P(A3∣A1∩A2)表示在A1和A2同时发生的情况下,A3A3A3发生的概率,以此类推。

常见概率分布介绍

矩阵运算

det⁡(A)\det(A)det(A) (行列式):表示矩阵AAA 的行列式,例如det⁡(A)\det(A)det(A) 表示矩阵AAA 的行列式。矩阵行列式(Matrix Determinant) 矩阵行列式是一个标量,可以用于判断矩阵是否可逆,通常也可以用符号“∣A∣|A|∣A∣”表示矩阵AAA的行列式。对于一个nnn阶矩阵AAA,它的行列式可以通过以下公式计算得出:

∣ A ∣ =∑i=1 n( − 1)i+j ai,j∣Ai,j∣ |A| = \sum_{i=1}^{n}(-1)^{i+j}a_{i,j}|A_{i,j}|∣A∣=i=1∑n​(−1)i+jai,j​∣Ai,j​∣

A T A^TAT (转置矩阵):表示矩阵AAA 的转置矩阵,例如A T A^TAT 表示矩阵AAA 的转置矩阵。

A− 1A^{-1}A−1 (逆矩阵):表示矩阵AAA 的逆矩阵,例如A− 1A^{-1}A−1 表示矩阵AAA 的逆矩阵。

A⋅BA\cdot BA⋅B (矩阵乘积):表示矩阵AAA 和矩阵BBB 的乘积,例如A⋅BA\cdot BA⋅B 表示矩阵AAA 和矩阵BBB 的乘积。有时也用A×BA\times BA×B表示,不过不够标准。

t r (A)\mathrm{tr}(A)tr(A):是指矩阵对角线上所有元素的和,通常用符号“t r (A)\mathrm{tr}(A)tr(A)”表示矩阵AAA的迹。对于一个nnn阶方阵AAA,它的迹可以用以下公式计算得出:

t r( A ) =∑i=1 n ai,i\mathrm{tr}(A) = \sum_{i=1}^{n}a_{i,i}tr(A)=i=1∑n​ai,i​

∥A∥\Vert A \Vert∥A∥:表示矩阵AAA的范数。常见的矩阵范数有以下几种:

第一范数(L 1 L_1L1​范数):∥A∥ 1 = max ⁡j ∑i = 1n ∣ai , j∣\Vert A \Vert_1 = \max_{j}\sum_{i=1}^{n}|a_{i,j}|∥A∥1​=maxj​∑i=1n​∣ai,j​∣ 第二范数(L 2 L_2L2​范数):∥A∥ 2 =λmax⁡ (AT A )\Vert A \Vert_2 = \sqrt{\lambda_{\max}(A^{\mathrm{T}}A)}∥A∥2​=λmax​(ATA)​ 无穷范数(L ∞ L_{\infty}L∞​范数):∥A∥ ∞ = max ⁡i ∑j = 1n ∣ai , j∣\Vert A \Vert_{\infty} = \max_{i}\sum_{j=1}^{n}|a_{i,j}|∥A∥∞​=maxi​∑j=1n​∣ai,j​∣ 其中,λ max ⁡ (A T A)\lambda_{\max}(A^{\mathrm{T}}A)λmax​(ATA)表示矩阵A T AA^{\mathrm{T}}AATA的最大特征值。

“r a n k (A)\mathrm{rank}(A)rank(A):矩阵秩(Matrix Rank)是指矩阵中所有线性无关的行向量或列向量的个数,通常用符号“r a n k (A)\mathrm{rank}(A)rank(A)”表示矩阵AAA的秩。矩阵的秩可以通过高斯消元法或奇异值分解等方法计算得出。

逻辑符号

∀\forall∀ (全称量词):表示“对于所有的”。

∃\exists∃ (存在量词):表示“存在”。

∈\in∈ (属于):表示某个元素属于某个集合,例如x∈Sx\in Sx∈S 表示xxx 属于集合SSS。

⊆\subseteq⊆ (子集或相等):表示一个集合包含在另一个集合中或两个集合相等,例如S 1 ⊆S 2 S_1\subseteq S_2S1​⊆S2​ 表示集合S 1 S_1S1​ 包含在集合S 2 S_2S2​ 中。

∪\cup∪ (并集):表示两个集合的并集,例如S 1 ∪S 2 S_1\cup S_2S1​∪S2​ 表示由S 1 S_1S1​ 和S 2 S_2S2​ 中所有元素构成的集合。

∩\cap∩ (交集):表示两个集合的交集,例如S 1 ∩S 2 S_1\cap S_2S1​∩S2​ 表示同时属于S 1 S_1S1​ 和S 2 S_2S2​ 的元素构成的集合。

⇒\Rightarrow⇒ (蕴含):表示逻辑上的蕴含关系,例如A⇒BA\Rightarrow BA⇒B 表示如果AAA 成立,则BBB 也一定成立。

⇔\Leftrightarrow⇔ (等价):表示逻辑上的等价关系,例如A⇔BA\Leftrightarrow BA⇔B 表示AAA 和BBB 是等价的。

∼\sim∼ (取反):表示逻辑上的否定,例如∼A\sim A∼A 表示AAA 不成立。

⊕\oplus⊕ (异或):表示逻辑上的异或关系,例如A⊕BA\oplus BA⊕B 表示AAA 和BBB 中恰有一个成立。

→\rightarrow→ (箭头):表示一个数、向量、函数等的趋势或者变化方向,例如f(x)→∞f(x)\rightarrow \inftyf(x)→∞ 表示xxx 趋向于无穷大时,f(x)f(x)f(x) 趋向于正无穷。

∀i = 1n \forall_{i=1}^n∀i=1n​ (全称量词带下标):表示对于一个有限个数的序列或集合中的所有元素,例如∀i = 1n x i >0\forall_{i=1}^n x_i > 0∀i=1n​xi​>0 表示对于nnn 个数x 1 ,x 2 ,…,x n x_1,x_2,\dots,x_nx1​,x2​,…,xn​,每个数都大于000。

→\rightarrow→ (蕴含符号):在逻辑学和数学中,表示一个命题中的“如果…那么”。

∴\therefore∴ (因此):表示推理的结论。

□\Box□ (证毕符号):表示证明结束,证明得证。

论文实战 1. X ∈Rn1×n2X \in \mathbb{R}^{n_1 \times n_2}X∈Rn1​×n2​

表示XXX 是一个n 1 n_1n1​ 行n 2 n_2n2​ 列的矩阵,其中R\mathbb{R}R 表示实数集合,即XXX 的元素都属于实数集合。矩阵的元素可以是实数,也可以是复数,具体取决于具体的上下文。

2. vec ⁡ ( X ) \operatorname{vec}(X)vec(X)

表示将矩阵XXX 按列展开成一个向量。具体来说,如果矩阵XXX 是一个n 1 ×n 2 n_1 \times n_2n1​×n2​ 的矩阵,那么vec⁡(X)\operatorname{vec}(X)vec(X) 是一个n 1 n 2 ×1n_1n_2 \times 1n1​n2​×1 的列向量,其元素按列排列,即vec⁡(X)=[x1 , 1,x2 , 1,…,x n1 , 1,x1 , 2,…,x n1 ,n2] ⊤ \operatorname{vec}(X) = [x_{1,1}, x_{2,1}, \dots, x_{n_1,1}, x_{1,2}, \dots, x_{n_1,n_2}]^\topvec(X)=[x1,1​,x2,1​,…,xn1​,1​,x1,2​,…,xn1​,n2​​]⊤,其中⊤\top⊤ 表示向量的转置操作。 v e c ( X ) =[x11x21⋮xn1x12x22⋮xn2⋮xn 1 n 2]vec(\mathbf{X}) = \begin{bmatrix} x_{11} \\ x_{21} \\ \vdots \\ x_{n1} \\ x_{12} \\ x_{22} \\ \vdots \\ x_{n2} \\ \vdots \\ x_{n_1n_2} \end{bmatrix}vec(X)=​x11​x21​⋮xn1​x12​x22​⋮xn2​⋮xn1​n2​​​​

3. K ∈Rn1n2×n1n2K \in \mathbb{R}^{n_1n_2 \times n_1n_2}K∈Rn1​n2​×n1​n2​

表示一个n 1 n 2 n_1n_2n1​n2​ 行n 1 n 2 n_1n_2n1​n2​ 列的实数矩阵。这种表示法通常在涉及到向量化操作时出现,它可以将一个二维的矩阵映射到一个一维的向量,方便我们进行一些数学运算和处理。例如,如果我们对一个n 1 ×n 2 n_1 \times n_2n1​×n2​ 的矩阵进行向量化操作,得到的向量的长度为n 1 n 2 n_1n_2n1​n2​,我们可以用一个n 1 n 2 ×n 1 n 2 n_1n_2 \times n_1n_2n1​n2​×n1​n2​ 的矩阵KKK 来表示这个向量。具体来说,KKK 的每一行可以看作是一个原始矩阵中的一个元素,而每一列可以看作是一个向量化后的矩阵中的一个元素。例如,如果原始矩阵XXX 中的第(i,j)(i,j)(i,j) 个元素为xi , jx_{i,j}xi,j​,那么对应的向量化后的矩阵中的第kkk 个元素为xi , jx_{i,j}xi,j​,其中k=(j−1)n 1 +ik = (j-1)n_1 + ik=(j−1)n1​+i。因此,KKK 的第kkk 行第lll 列的元素可以表示为Kk , l=δi , lδj , kK_{k,l} = \delta_{i,l}\delta_{j,k}Kk,l​=δi,l​δj,k​,其中δ\deltaδ 表示克罗内克(Kronecker)δ符号,满足当i=li = li=l 且j=kj = kj=k 时取值为 1,否则取值为 0。

4.⊗

通常表示 Kronecker积(Kronecker product)运算。Kronecker积是一种基于矩阵的张量积(tensor product)扩展的一种运算,它将两个矩阵A∈Rm × nA \in \mathbb{R}^{m \times n}A∈Rm×n 和B∈Rp × qB \in \mathbb{R}^{p \times q}B∈Rp×q 分别按元素逐一相乘,并按照矩阵的形式进行组合,得到一个新的矩阵C∈Rm p × n qC \in \mathbb{R}^{mp \times nq}C∈Rmp×nq,具体地:

C = A ⊗ B =[a11B ⋯a1 n B⋮ ⋱⋮am 1 B ⋯am n B ]C = A \otimes B = \begin{bmatrix} a_{11}B & \cdots & a_{1n}B \\ \vdots & \ddots & \vdots \\ a_{m1}B & \cdots & a_{mn}B \\ \end{bmatrix}C=A⊗B=​a11​B⋮am1​B​⋯⋱⋯​a1n​B⋮amn​B​​

其中,ai ja_{ij}aij​ 表示矩阵AAA 中的第iii 行第jjj 列的元素,BBB 表示一个p×qp \times qp×q 的矩阵,ai jBa_{ij}Baij​B 表示将矩阵BBB 的每个元素都乘以ai ja_{ij}aij​,得到一个p×qp \times qp×q 的矩阵。Kronecker积的一个重要应用是在线性代数和信号处理领域中。它可以用来表示矩阵的重复和扩展,从而简化一些复杂的运算和计算。例如,当我们需要对两个向量进行外积运算时,可以使用 Kronecker积来简化计算;在卷积神经网络中,可以使用 Kronecker积来表示卷积操作和池化操作;在信号处理中,可以使用 Kronecker积来表示多维信号的卷积和相关操作等。

5.πRL( y ∣ x ) \pi^{RL}(y|x)πRL(y∣x)

在强化学习中,通常表示在一个给定的状态xxx 下,智能体在执行强化学习任务时采取动作yyy 的概率。具体来说,πR L(y∣x)\pi^{RL}(y|x)πRL(y∣x) 是一个策略函数(policy function),它描述了智能体如何根据环境的状态来选择动作。在强化学习中,一个智能体通常通过与环境的交互来学习策略函数,即根据当前状态选择一个最优的动作,从而最大化累积奖励(cumulative reward)。因此,策略函数的设计和优化是强化学习中的一个核心问题。需要注意的是,πR L(y∣x)\pi^{RL}(y|x)πRL(y∣x) 的具体形式和实现方式因任务和算法而异。在某些情况下,策略函数可以直接通过映射状态到动作的函数来表示,例如πR L(y∣x)=f(x)\pi^{RL}(y|x)=f(x)πRL(y∣x)=f(x);在其他情况下,策略函数可能需要根据一些参数或价值函数来决定动作,例如πR L(y∣x)=softmax(f θ (x))\pi^{RL}(y|x)=\text{softmax}(f_\theta(x))πRL(y∣x)=softmax(fθ​(x)),其中f θ (x)f_\theta(x)fθ​(x) 表示带有参数θ\thetaθ 的函数。

6. d i a g ( x ) diag(\mathbf{x})diag(x)

在论文中,diag(x)diag(\mathbf{x})diag(x) 表示将向量x\mathbf{x}x 的每个元素放在一个对角线上,其余位置为零的对角矩阵,即:

d i a g ( x ) =[x1 0 ⋯ 0 0x2 ⋯ 0⋮⋮ ⋱⋮ 0 0 ⋯xn ]diag(\mathbf{x}) = \begin{bmatrix} x_1 & 0 & \cdots & 0 \\ 0 & x_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & x_n \end{bmatrix}diag(x)=​x1​0⋮0​0x2​⋮0​⋯⋯⋱⋯​00⋮xn​​​

而vec(X)vec(\mathbf{X})vec(X) 表示将矩阵X\mathbf{X}X 按列展开成一个列向量,即:

v e c ( X ) =[x11x21⋮xn1x12x22⋮xn2⋮xn 1 n 2]vec(\mathbf{X}) = \begin{bmatrix} x_{11} \\ x_{21} \\ \vdots \\ x_{n1} \\ x_{12} \\ x_{22} \\ \vdots \\ x_{n2} \\ \vdots \\ x_{n_1n_2} \end{bmatrix}vec(X)=​x11​x21​⋮xn1​x12​x22​⋮xn2​⋮xn1​n2​​​​

因此,diag(vec(K p ))diag(vec(\mathbf{K}_p))diag(vec(Kp​)) 表示将矩阵K p \mathbf{K}_pKp​ 按列展开成一个列向量后,将其放在一个对角线上,其余位置为零的对角矩阵,即:

d i a g ( v e c (K p) ) =[Kp,11 Kp,21 ⋱ Kp,n 1 n 2 ,n 1 n 2]diag(vec(\mathbf{K}_p)) = \begin{bmatrix} \mathbf{K}_{p,11} \\ & \mathbf{K}_{p,21} \\ & & \ddots \\ & & & \mathbf{K}_{p,n_1n_2,n_1n_2} \end{bmatrix}diag(vec(Kp​))=​Kp,11​​Kp,21​​⋱​Kp,n1​n2​,n1​n2​​​​

其中Kp , i j\mathbf{K}_{p,ij}Kp,ij​ 表示矩阵K p \mathbf{K}_pKp​ 中第iii 行、第jjj 列的元素。

7. π : [ 1 , d ] → [ 1 , d ] \pi : [1, d] \rightarrow [1, d]π:[1,d]→[1,d]

表示一个从区间[1,d][1, d][1,d] 到自身的映射,也就是一个自同态。其中[1,d][1, d][1,d] 表示包含从111 到ddd 所有整数的闭区间。

这个映射通常用来表示一种数据的排列方式,例如排列矩阵的行或列。具体而言,对于一个ddd 维向量x=(x 1 ,x 2 ,⋯  ,x d )\mathbf{x} = (x_1, x_2, \cdots, x_d)x=(x1​,x2​,⋯,xd​),π(x)\pi(\mathbf{x})π(x) 表示对x\mathbf{x}x 进行排列后的结果。在实际应用中,这种排列方式通常与某种特定的数据结构或算法相关。

需要注意的是,虽然符号π\piπ 在一些特定的上下文中可能有不同的含义,但是在不同的文献中可能存在差异,需要具体根据文献背景来理解。

8.π 1∘π 2\pi_1 \circ \pi_2π1​∘π2​

表示函数合成,也就是将函数π 2 \pi_2π2​ 的输出作为函数π 1 \pi_1π1​ 的输入,然后输出π 1 \pi_1π1​ 的结果。具体来说,对于两个从区间[1,d][1,d][1,d] 到自身的映射π 1 \pi_1π1​ 和π 2 \pi_2π2​,符号π 1 ∘π 2 \pi_1 \circ \pi_2π1​∘π2​ 定义如下:

(π 1∘π 2) ( i ) =π 1(π 2( i ) ) ,i = 1 , 2 , ⋯  , d . (\pi_1 \circ \pi_2)(i) = \pi_1(\pi_2(i)), \qquad i = 1, 2, \cdots, d.(π1​∘π2​)(i)=π1​(π2​(i)),i=1,2,⋯,d.

这个符号在某些场景下可以用来表示对一个多维数组进行多次排列的结果。比如,对于一个形状为n×dn \times dn×d 的矩阵X\mathbf{X}X,可以使用π 1 ∘π 2 \pi_1 \circ \pi_2π1​∘π2​ 来表示先对矩阵的行进行排列,再对排列后的结果的列进行排列得到的新矩阵。具体来说,假设Xi , j\mathbf{X}_{i,j}Xi,j​ 表示矩阵X\mathbf{X}X 中第iii 行第jjj 列的元素,π 1 \pi_1π1​ 表示行的排列方式,π 2 \pi_2π2​ 表示列的排列方式,则排列后的矩阵可以表示为:

(π 1∘π 2) ( X )i , j= X π1 (π2 ( i ) ) ,π2 ( j ). (\pi_1 \circ \pi_2)(\mathbf{X}){i,j} = \mathbf{X}{\pi_1(\pi_2(i)), \pi_2(j)}.(π1​∘π2​)(X)i,j=Xπ1​(π2​(i)),π2​(j).

需要注意的是,符号π 1 ∘π 2 \pi_1 \circ \pi_2π1​∘π2​ 通常要满足结合律,即(π 1 ∘π 2 )∘π 3 =π 1 ∘(π 2 ∘π 3 )(\pi_1 \circ \pi_2) \circ \pi_3 = \pi_1 \circ (\pi_2 \circ \pi_3)(π1​∘π2​)∘π3​=π1​∘(π2​∘π3​),但是在某些特定的场景下,这个条件可能不满足,需要具体根据上下文来理解。

9. f :S d→ R f : S_d \to Rf:Sd​→R

表示定义在置换群S d S_dSd​上,取值为实数RRR中的函数fff,即fff完成了S d S_dSd​到RRR空间的映射。其中S d S_dSd​是由ddd个元素的置换组成的群(d个元素的排列组合),通常也称为对称群。在机器学习中,置换群通常用于处理具有对称性质的问题,例如图像识别、图像处理等。函数fff可以是任意函数,例如特征函数、损失函数等。

如果读者在论文中有遇到不懂的符号,欢迎留言评论或私聊。

相关推荐: