重学凝聚态拓扑(Class 1)

 

最近正好有些空闲的时间,发现自己对拓扑中的一些理解并不深刻,正好借这个机会重新学习一下,加深自己对其中内容的理解,也能让自己之后的研究走的更远。

最近正好有些空闲的时间,发现自己对拓扑中的一些理解并不深刻,正好借这个机会重新学习一下,加深自己对其中内容的理解,也能让自己之后的研究走的更远。

能带结构

在量子力学描述电子运动的时候,电子波函数满足薛定谔方程

\[i\hbar\partial_t \Psi = H\Psi,\]

这里的$\Psi$就是电子在某一位置上的波函数,$H$则是系统的哈密顿量,如果可以严格的求解这个方程,那么就可以预测电子在运动。不过对于一般的系统,这个方程很难有解析解,但是可以通过数值的方式对其进行求解。比如将波函数$\Psi$通过一组完备的本征基矢展开

\[\Psi=\sum_i\phi_i\]

此时方程的求解就变成了求解一个矩阵的本征值问题。但是这个完备基矢的维度可能会很大,有可能是无限维的,这个时候通过矩阵对角化同样不能对薛定谔方程进行求解。

在求解薛定谔方程的时候,可以将其和经典运动的波动方程进行类比,比如最常见的弦振动方程为

\[\partial_t^2 h-c^2\partial_x^2 h=0,\]

这里的$h(x,t)$就是弦在空间中某一时刻某一位置偏离其平衡态的位移,可以看到方程中存在对其的二阶导数,但是在薛定谔方程中包含的则是对时间的一阶导数,这个时候可以通过变量代换的方式,令方程在形式上看起来是一个一阶方程,定义

\[h_1(x,t)=c^{-1} \partial_t h(x,t)\qquad h_2(x,t)=\partial_x h(x,t)\]

利用新定义的$h_1(x,t),h_2(x,t)$之后,就可以将上面的二阶波动方程,变成两个一阶的方程。这个操作在学习数值计算的时候遇到过,将高阶方程变成低阶的时候,方程的数量是会翻倍的,此时低阶方程可以通过数值或者解析的方式得到精确解,再回带到定义式中,就可以得到高阶方程的解。 为了将波动方程在形式上和薛定谔方程类似,此时可以定义

\[\Psi(x,t)=\left(\begin{array}{c}h_1(x,t)\\h_2(x,t)\end{array}\right)\quad H=c\left(\begin{array}{cc}0& 1\\1 & 0\end{array}\right)(i\partial_x).\]

可以看到,通过将高阶方程进行降阶,在形式上看起来就得到了薛定谔方程。

薛定谔方程

在薛定谔方程中,描述电子的波函数$\Psi$一般都是复数,此时的哈密顿量是有动能项和势能项组成,暂时还不是一个矩阵

\[H=-\frac{\hbar^2}{2m}\partial_x^2 + V(x),\]

这里$m$是电子的质量,$V(x)$就是电子的运动的时候感受到外部的势能。关于电子的波动方程,有几点需要强调

  • 波函数$\Psi$是复数
  • 哈密顿量$H$是厄米矩阵或者厄米算符
  • 波函数的模方$\rvert \Psi(x,t)\rvert ^2$为电子密度
  • 如果电子的数目是$N$,那么必然存在$N$个正交的电子波函数(Pauli 不相容原理)

目前我们关注的都是电子的静态性质,此时可以对电子的波函数取ansatz:$\Psi=e^{-i E t/\hbar}\psi$,此时就可以将薛定谔方程变成不依赖于时间的静态薛定谔方程

\[H\psi=E\psi,\]

此时方程就回归到了线性代数的本征值问题。

在晶体材料中处理问题的时候,通常都会采用紧束缚近似来简化问题,该近似假设电子占据在一些离散的轨道位置上,而且波函数是很局域的,可以取$\psi_a$是在轨道$a$上面电子的波函数,可以利用这些不同的$\psi_a$组合得到$\psi=\sum_a\psi_a$,那么就类似的得到了矢量。相应的,哈密顿量同样也就变成了矩阵形式,其分量为$H_{ab}$。通过这样的定义之后可以发现,已经将薛定谔方程的变成了一个矩阵方程,求解系统的本征值和本征态其实也就是线性代数的问题了。通过紧束缚尽速,如果可以明确的得到$H_{ab}$,那么通过矩阵对角化就可以得到本征态$\psi_a$以及其本征能量$E_a$。矩阵形式的薛定谔方程$H\psi^{(n)}=E^{(n)}\psi^{(n)}$有几个重要的性质

  • 如果哈密顿量$H$此时是一个$N\times N$的矩阵,那么它的本征值也一定有$N$个
  • 物理可观测量对应的本征值都是实数,所以就要求哈密顿量$H$是厄米矩阵$H_{ab}=H_{ba}^{*}$
  • 属于不同本征值的本征态之间相互正交$\psi^{(n)\dagger} \psi^{(m)}=0$,这里$m\neq n$。

不过通常在书写的时候,物理里面喜欢使用Dirac符号来表示,比如会将波函数表示为$\psi\rightarrow \rvert \psi\rangle$ ,将$\rvert \psi\rangle$用紧束缚的波函数进行叠加可以表示为

\[\rvert \psi\rangle=\sum_a \psi_a \rvert a\rangle.\]

同样可以将哈密顿量转换成算符的形式

\[H=\sum_{ab}H_{ab}\rvert a\rangle \langle b\rvert ,\]

这里的$H_{ab}$就是哈密顿量在确定basis下面的矩阵元(其实就是在$\rvert a\rangle$下面的矩阵元)。 ## Example: Atomic triangle 这里考虑一个正三角形,每个顶点上有一个原子,电子可以在这些原子上运动,每个原子都贡献一个轨道,标记为$\rvert 0\rangle,\rvert 1\rangle,\rvert 2\rangle$。利用这个标记之后,那么电子在不同原子之间hopping 的振幅大小$t$表示在哈密顿量中为

\[H=-t(\rvert 0\rangle \langle 1\rvert +\rvert 1\rangle \langle 2\rvert +\rvert 2\rangle \langle 0\rvert )+h.c,\]

这里的$h.c$表示厄米共轭,其实理解上来说就是电子能从$0\rightarrow 1$,那么自然也能从$1\rightarrow 0$,而且这两个逆过程的振幅互为复共轭。将哈密顿量$H$在三个原子轨道$\psi={\rvert 0\rangle,\rvert 1\rangle,\rvert 2\rangle}$上表示出来,就可以得到其矩阵表示

\[H_{ab}=-\left(\begin{array}{ccc}0&t&t^*\\t^*&0&t\\t&t^*&0\end{array}\right).\]

将这个矩阵对角化就可以得到对应的本征值和本征矢量

\[E^{(n)}=-2 \rvert t\rvert \cos{\theta},\rvert t\rvert \cos{\theta}\pm \rvert t\rvert \sqrt{3}\sin{\theta}\] \[\psi^{(n)}_a=3^{-1/2}(1,1,1),3^{-1/2}(1,\omega,\omega^2),3^{-1/2}(1,\omega^2,\omega)\]

这里将hopping取为$t=\rvert t\rvert e^{i\theta}$,$\omega$是1的三次方根($\omega^3=1$)。

Bloch’s theorem for bulk electrons

在上面的例子中,我们考虑了实空间中的三个原子,发现只需要对角化一个$3\times 3$的矩阵就可以了。但是在晶体材料中,原子数目是$10^{23}$量级,很显然不可能对角化一个维度为$10^{23}\times 10^{23}$大小的矩阵求解得到本征值和本征矢量。但是在处理晶体材料的时候,晶体结构是有规则的整齐排列,虽然同样存在着界面,近似的来看,界面其实对体系内部的性质是没有影响的,那么我们可以假设体系其实是周期的,先忽略这个边界,那么此时就可以利用Bloch定理来处理问题,它也是理解电子在晶体中运动的重要定理。

晶体是一些列具有相同结构的单元,通过平移重复组成的,所以只要搞清楚了这个最小的重复结构单元,那么就可以理解整个晶体的性质了,固体物理中将这个最小的结构单元称为原胞。这里可以先给每一个原胞都给一个编号$n$,不同的原胞之间可以通过平移操作相互联系,所以原胞的编号对应的数量级同样是$10^{23}$,原胞中的每一个轨道也赋予一个编号$l$,不过此时原胞中轨道的数量是有限的。将原胞和晶格矢量组合起来,此时就可以对晶体中的每一个轨道都赋予一个编号$a=(l,n)$。比如对于一个由单原子组成的原子环,其中有$N$个单原子,那么此时$l=1$,该原子环中共有$N$个原子,那么$n=1,2,\cdots, N$。如果是对于一个三维的体系,那么此时$n=(n_x,n_y,n_z)$就是一个矢量。因为此时系统具有平移对称性,那么对于一个晶体,它的哈密顿量矩阵元就会满足$H_{(l,n),(l’,m)}=H_{(l,n-m),(l’,0)}$,也就是说不同原胞之间的轨道其实是等价的。

Bloch定理为:对晶体中哈密顿量满足的薛定谔方程,其波函数满足ansata:

\[\psi_{(l,n)}=e^{i k n}u_l,\]

这里$u_l$是Bloch函数的周期部分,对于每一个原胞它都是相同的,对于每一个原胞不同就是$u_l$前面的平面波调幅因子。

这里的参数$k$是晶体动量,因为晶体具有周期性,所以它一般是被限制在第一布里渊区中$k\in[-\pi,\pi]$。将上面的ansatz代入到薛定谔方程

\[\sum_{l'm}H_{(l,n),(l',m)}u_{l'}e^{i k m}=E(k) e^{i k n}u_{l}(k)\]

此时就可以得到关于$u(k)$的本征方程

\[H(k)u(k)=E(k)u(k),\]

这里$H(k)$和本来的哈密顿量满足的变换关系为

\[H(k)_{ll'}=\sum_{m}H_{(l,-m),(l',0)}e^{-i k m}.\]

Example: Su-Schrieffer-Heeger model

这里考虑Su-Schrieffer-Heeger(SSH)模型,如下图所示,它的hopping强度在$t_1,t_2$之间来回交替。通常情况下,可以假设每个原子贡献一个轨道(这里就是碳原子),那么每个原胞中就存在一个原子这样就意味着所有的碳原子都是相同的。但是在SSH模型中可以看到,在短键的左右两侧,$C-H$的连接方式有些许的不同,那么就可以将其视为不同的轨道,所有就可以认为这里有两种不同的原子,分别用$R,L$来区别,所以每原胞中的两个轨道标记为$\rvert L,n\rangle$ 和 $\rvert R,n\rangle$,这里的$n$是原胞的指标。

Trans-_CH_n.svg

此时就可以得到SSH模型的哈密顿量为

\[H=\sum_n \{t_1(\rvert L,n\rangle\langle R,n\rvert +\rvert R,n\rangle\langle L,n\rvert )+t_2(\rvert L,n\rangle\langle R,n-1\rvert +\rvert R,n-1\rangle\langle L,n\rvert )\}.\]

哈密顿量是周期的,将其平移$n$个位置之后,非零的矩阵元为$H_{(L,0),(R,0)}=H_{(R,0),(L,0)}=t_1$ 和 $H_{(L,1),(R,0)}=H_{(R,-1),(L,0)}=t_2$。在动量空间中可以将哈密顿量表示为

\[H(k)_{ll'=1,2}=\left(\begin{array}{cc}0& t_1+t_2 e^{i k}\\t_1+t_2 e^{-ik}&0\end{array}\right).\]

可以直接对角化哈密顿量来得到本征值

\[E^{(\pm)}(k)=\pm \sqrt{t_1^2+t_2^2+2 t_1 t_2\cos{k}}.\]

通过SSH模型的构型可以看到,相邻交替的hopping强度必然是不同的,这里就取$t_1>t_2$。随着参数$k$的变化,本征值会从$t_1-t_2\rightarrow t_1+t_2$,能量为负的本征值与能量为正本征值之间的关系为$E^{(-)}(k)=-E^{(+)}(k)$。

随着$k$变化的过程中,本征值不会落在$-\rvert t_1-t_2\rvert $ 到 $\rvert t_1-t_2\rvert $这个区间内,这也就是所说的能隙,因此通过Bloch理论的预测,也就成功的解释了绝缘体。

这里再来理解一下绝缘体,因为对于后面关心的拓扑的内容,都是在绝缘体的基础上进行讨论的。假设现在有一个周期的圆环有$2N$个原子,此时每个原胞中有2个原子,那么相对应的原胞的指标$n=1,\cdots,N$。因为波函数$\psi_{(l,n)}$是单值的,所以绕着整个圆环一周之后有$e^{i k N}=1$。这也就意味着动量$k$可以取$[-\pi,\pi]$中一系列离散的值,相互之间的间隔为$2\pi/N$。在凝聚态的研究中,有时候只需要关注低能激发即可,所以此时在系统中填充$N$个电子,那么就只需要关注占据态$E^{(-)}(k)$即可。此时系统的能隙为$2(t_1-t_2)$,想要从占据态激发一个电子到空态,那么需要跨过的能量尺度就是能隙。而在绝缘体中,这个能隙通常情况下是很大的,不可能通过施加电场产生激发。

$k\cdot p$ perturbation theory

接下来考虑一件事情,我们可以通过$H(k=0)$的本征博函数来得到动量为$k$处哈密顿量。首先将Bloch哈密顿量作Taylor展开

\[H(k)\approx H(k=0)+k H^{'}(k=0)+(k^2/2)H^{''}(k=0)\]

通过微扰论可以得到,在$k\sim 0$附近,非简并能带的电子速度和质量可以表示为

\[v_n =\partial_k E^{(n)}(k)= u^{(n)\dagger} H^{'}(k=0) u^{(n)}\] \[m_n^{-1}=\partial^2_k E^{(n)}(k)=u^{(n)\dagger} H^{''}(k=0) u^{(n)}+\sum_{m\neq n}\frac{\rvert u^{(n)\dagger} H^{'}(k=0) u^{(m)}\rvert ^2}{E^{(n)}(k=0)-E^{(m)}(k=0)},\]

这里$E^{(n)}(k=0)$ 和 $u^{(n)}(k=0)$分别是$H(k=0)$的本征能量和本征态。通过有效质量的表达式可以看到,当$E^{(n)}(k=0)-E^{(m)}(k=0)$很小的时候,它就是趋向于零。通过将本征能量展开到二阶可以进行验证

\[E^{(-)}(k)\simeq -(t_1-t_2)-\frac{t_2^2}{(t_1-t_2)}k^2\]

上面讨论到的级数展开通常是对晶体系统的一个连续描述,而且得到的结果也只是在级数展开点的附近是有效的,通常这个有效的范围也只是布里渊区很小的一部分。连续模型通常会在展开中将$k\rightarrow \hbar^{-1}p$,这里$p=-i\hbar\partial_x$是动量算符。

虽然连续模型在解析处理的问题的时候比较方便,但是通常在进行数值计算的时候,我们需要将连续哈密顿量变成离散的形式,方便计算机模拟。其实这里还是用了数值计算中的差分形式,将动量$k$替换成离散的差分算符

\[k=-i\partial_x\approx -i(2\Lambda)^{-1}\sum_n (\rvert n+1\rangle\langle n\rvert -\rvert n\rangle\langle n+1\rvert ).\]

这里的$n$就是原胞的指标,其对应的大小为$\Lambda$。为了验证这是微分的一个表示,将$ik=\partial_x$作用到$\rvert \psi\rangle$上可以得到

\(i k\rvert \psi\rangle\approx \sum_n \frac{\psi_{n+1}-\psi_{n-1}}{2\Lambda}\rvert n\rangle\) 在这样的离散表示下面,此时对于$H(k=0)$就需要构建一个$N\times N$的矩阵,此时矩阵基矢表示为$\rvert a,n\rangle$。将上面的这些离散化过程应用到连续哈密顿量上可以得到

\[H(k)\approx \sum_{n,a,b} H(k=0)_{ab}\rvert a,n\rangle \langle b,n\rvert +i H^{'}(k=0)_{ab}(\rvert a,n+1\rangle\langle b,n\rvert -\rvert a,n\rangle\langle b,n+1\rvert ),\]

在上面推导中忽略了$k^2$项,如果考虑$k^2$,那么在离散表示下为

\[k^2=-\sum_n (\rvert n\rangle \langle n+2\rvert +\rvert n+2\rangle\langle n\rvert -2\rvert n\rangle \langle n\rvert )\]

这里看起来是兜了圈子,最开始通过原子轨道构建了格点模型,然后在低能点附近将其展开,最后通过$k\cdot p$哈密顿量再进行离散化来得到现在新的格点模型。其实最初的格点模型和最后的格点模型并不是相同的。最初利用原子轨道得到的格点模型,其hopping距离可以认为是原子间距$a$,然而通过$k\cdot p$进行离散化之后得到的格点模型,前面也提到了,其距离其实是$\Lambda$,这就是二者的不同,通常情况下会使用从$k\cdot p$离散化来得到来得到格点模型。因为在真实材料中,首先可以通过对称性约束得到低能附近的$k\cdot p$模型,此时哈密顿量是具有体系真实对称性的,进一步通过离散化之后得到的哈密顿量同样可以很好的保持体系的对称性。如果是通过第一种方法来构建,这个过程就会变的非常的繁琐。

公众号

相关内容均会在公众号进行同步,若对该Blog感兴趣,欢迎关注微信公众号。

png