2011.12. 08 - mit mathematicsmath.mit.edu/~aosun/hesi08.pdf · 2018. 4. 27. · "¼ ã q ,x/½...

Post on 18-Jan-2021

7 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

2011.12.108Ï

目录

纪念大师

Grassmann流形上的上同调环——纪念陈省身先生诞辰一百周年 . . . . . . . . . . . . . . . . .周坚 1

研究探讨

胞腔边缘公式的证明和计算实例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .刘诗南 5指数映射定义等价性的两种证明 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .张铭 17Rn中凸集是Lebesgue可测集 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .潘锦钊 王若凡 朱艺航 25

教师来稿

从1 + 2 + · · · + 100 = 5050谈起: 第三部分 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .周坚 36

数学名题

Banach-Tarski悖论 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Karl Stromberg 45

数学史话

代数几何简史 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .宗正宇 60

清华数学人

孙念增、李欧奖学金介绍 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .叶俊 66孙念增数学分析奖学金发言稿 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .余成龙 69李欧高等代数奖学金发言稿 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .孙宗汉 71

Grassmann流形上的上同调环

——纪念陈省身先生诞辰一百周年

周坚∗

在陈省身先生Wolf奖颁奖词中提到陈先生的数学工作的影响遍及数学的所有领域。

这里试从Grassmann流形上的上同调环的角度做一个相当片面的介绍,内容来自已有的文

献,包括数学文献与弦论文献的工作,旨在反映不同数学分支之间有密切关系,且在理论

物理中有深刻的应用。由于无法尝试限制在一个相对初等的范围内,我们不可避免不做解

释地使用一些术语。

1 Grassmann流形及其上同调环

记Grr(Ck)为Ck中r维线性子空间的集合。它有一个自然的r(k − r)维的紧致复流形

的结构。它上面有一个自然的rank r全纯向量丛π : ξ → Grr(Ck), 在Grr(Ck)中一个

点,即Ck的一个r维子空间V处, ξ的纤维即是V . 这个丛是平凡丛Ck := Grr(Ck) × Ck的全

纯子丛, 记其商丛为Q := Ck/ξ. 故有如下的全纯向量丛的正合列:

0 → ξ → Ck → Q → 0. (1)

记Xi := ci(ξ∗), i = 1, . . . , r, 及Yj := cj(Q

∗), j = 1, . . . , k. 由陈类的性质及正合列(1)我们

知道:

1 + Y1t + · · · + Yktk =

1

1 + X1t + · · · + Xrtr. (2)

将等式右边展开, 并注意到Xi, Yi ∈ H2i(Grr(Ck))我们得到:

Y1 = −X1,

Y2 = X21 − X2,

Y3 = −X3 + 2X1X2 − X31 ,

· · · · · · · · ·∗清华大学数学系基础数学研究所教授

1

注意到Q的秩为k − r, 故自动有

Yk−r+1 = · · · = Yk = 0. (3)

一个有趣的结果是上同调环H∗(Grr(Ck)) 由X1, . . . , Xr生成, 它们满足关系(3), 即

有[1, p. 293], [3, Ex. 14.6.6]

H∗(Grr(Ck); C) ∼= C[X1, . . . , Xr]/(Yk−r+1, . . . , Yk). (4)

例1. 当r = 1, k = n + 1时, Gr1(Cn+1) = CPn, (2)变成

1 + Y1t + · · · + Yn+1tn+1 =

1

1 + X1t= 1 − X1t + X2

1 t2 − X31 t3 + · · · ,

故Yj = (−1)jXj1 . 所以有

H∗(CPn; C) ∼= C[X]/(Xn+1). (5)

例2. 当r = 2, k = n + 2时, (2)变成:

1 + Y1t + · · · + Yn+1tn+1 + Yn+2t

n+2 =1

1 + X1t + X2t2

= 1 − (X1t + X2t2) + (X1t + X2t

2)2 − (X1t + X2t2)3 + · · · ,

因而

Yn+1 =

[(n+1)/2]∑

j=0

(−1)n+1−j

(n + 1 − j

n + 1 − 2j

)Xn+1−2j

1 Xj2 , (6)

Yn+2 =

[n/2]+1∑

j=0

(−1)n+2−j

(n + 2 − j

n + 2 − 2j

)Xn+2−2j

1 Xj2 . (7)

2 Grassmann流形的上同调环与奇点理论

公式(4)将上同调环H∗(Grr(Ck))表达为有r个生成元满足r个关系的环, 物理学家注意

到这r个关系可以由一个“势函数”W给出, 也就是说,如果令deg Xi = i, 则有一个分次齐次

多项式W (X1, . . . , Xr), 使得deg W = k + 1且

Yk+1−i(X1, . . . , Xr) =∂W

∂Xi(X1, . . . , Xr), i = 1, . . . , r (8)

因而有

H∗(Grr(Ck); C) ∼= C[X1, . . . , Xr]/(∂W

∂X1, . . . ,

∂W

∂Xr), (9)

2

也就是说关于上同调环H∗(Grr(Ck); C)的全部信息原则上都包含在一个函数W中。这

由Lerche-Vafa-Warner[6]在Landau-Ginzburg模型的框架内猜想,由Gepner[4]证明,所以

势函数有时称作Gepner势。事实上,记

log(1 + X1t + · · · + Xrtr) =

j≥0

Wj(X1, . . . , Xr)tj , (10)

则有

j≥0

∂Wj

∂Xi(X1, . . . , Xr)t

j = ∂Xi log(1 + X1t + · · · + Xrtr)

= ti · (1 + X1t + · · · + Xrtr)−1 = ti

k∑

j=0

Yjtj .

比较tk+1的系数有:∂Wk+1

∂Xi= Yk+1−i. (11)

故可取

W = Wk+1. (12)

这个多项式定义的映射W : Cr → C以原点为其孤立奇点,而(9)式右边说明H∗(Grr(Ck); C)是

这个奇点的Milnor环或称Jacobian环。

例1续. 当r = 1, k = n + 1时,

W =Xn+2

1

n + 2.

对应的奇点是所谓A型奇点,对应于A型Lie代数。

例2续. 当r = 2, k = n + 2时,

W = (−1)n+2 Xn+31

n + 3+

[(n+1)/2]∑

j=0

(−1)n+1−j

(n + 1 − j

n + 1 − 2j

)Xn+1−2j

1

Xj+12

j + 1. (13)

3 Grassmann流形的量子上同调环、奇点理论和可积系统

Grassmann流形的Gromov-Witten理论是很有趣的。Witten[8] 指出Grassmann流形

的量子上同调由Gepner势的形变得到,因而将上同调环的形变与奇点的形变联系起

来(也可参见[7, 5])。另一方面,Fendley等人[2]指出,Gepner势的某个形变与affine Toda

lattice联系起来。简单地说,物理学家建议了量子Schubert calculus, 奇点理论,loop

group的表示理论和可积系统理论之间的优美联系。这种联系的数学理论正在逐步地越来

越完整建立起来,围绕着这方面的数学研究一直都是热点, 牵涉到很多数学家的工作,这

里不一一介绍了。

3

参考文献

[1] R. Bott and L. Tu, “Differential Forms in Algebraic Topology”, Springer-Verlag, New

York, Berlin, Heidelberg, 1982.

[2] P. Fendley, W. Lerche, S.D. Mathur, N.P. Warner, N = 2 supersymmetric integrable

models from affine Toda theories, Nuclear Phys. B, vol. 348 (1991), no. 1, 66–88.

[3] W. Fulton, “Intersection Theory”, Springer-Verlag, New York, Berlin, Heidelberg,

1984.

[4] D. Gepner, Fusion rings and geometry, Commun. Math. Phys., vol. 141 (1991),

381–411.

[5] K. Intriligator, Fusion Residues, Mod. Phys. Lett. A 38 (1991), 3543–3556.

[6] W. Lerche, C. Vafa, N.P. Warner, Chiral rings in N = 2 superconformal theories,

Nuclear Phys. B, vol. 324 (1989), no. 2, 427–474.

[7] C. Vafa, Topological Landau-Ginzburg models, Mod. Phys. Lett. A 6 (1991),

337–346.

[8] E. Witten, The Verlinde algebra and the cohomology of the Grassmannian, In Geom-

etry, topology, & physics, Conf. Proc. Lecture Notes Geom. Topology, IV, 357–422.

Int. Press, Cambridge, MA, (1995).

4

胞腔边缘公式的证明和计算实例∗

刘诗南†

摘要

本文通过建立CW复形的胞腔边缘公式,将CW复形同调群的计算转化为球面映射

的映射度的计算,然后通过局部映射度(local degree)的方法实现映射度的计算,最

后具体计算nT 2,nP 2,RPn的同调群,展示CW复形在计算同调群时的威力。

1 CW复形及其同调群

1.1 CW复形和胞腔同调群的定义

CW复形的等价定义有几种,我们采用如下的:

定义1 一个CW复形是指一个由如下方式构造的拓扑空间X:

1. 从一个有离散拓扑的集合X0(X0中的元素称为X的0维胞腔)开始。

2. ∀n ∈ N+,X的n维骨架Xn由Xn−1通过一组连续映射{φα : Sn−1 → Xn−1}粘上一族n维胞腔{en

α}得到。也就是说,Xn是和空间Xn−1⊔

α Dnα在等价关系x ∼

φα(x), ∀x ∈ ∂Dnα下的商空间。其中Dn

α表示n维单位闭球,∂Dn−1α = Sn−1是n维单位

球面。n维胞腔enα就是Dn

α − ∂Dnα在商映射下的同胚像。

3. 对X =∪

n Xn上赋弱拓扑:一个集合A ⊂ X是开(或闭)当且仅当对每个n,

A∩

Xn在Xn中开(或闭)。

注1 当X只有有限个胞腔时,定义中的3是多余的,以下在未特别说明的情况下均假

设X是有限CW复形。

∗2011年春季学期代数拓扑课程报告†基数81,现在巴黎高师

5

注2 每个胞腔enα对应它的特征映射(characteristic map):

Φα : Dnα ↪→ Xn−1

α

Dnα → Xn(↪→ X)

其中左右两边的映射是包含映射,中间的映射是商映射。根据CW复形的定义可以验

证Φα是连续的,且Φα |∂Dnα= φα。

定义2 如果X是拓扑空间,A ⊂ X是非空闭子空间且A是某个开邻域的强形变收缩

核,则称(X,A)是“好对”。

我们不加证明地给出(证明可参见Allen Hatcher书)

命题1 (Xn, Xn−1)是“好对”。

命题2 如果(X, A)是“好对”,则商映射q : (X,A) → (X/A,A/A)诱导同调群的同

q∗ : Hn(X,A) → Hn(X/A,A/A) ∼= Hn(X/A)

命题3 对 wedge sum ∨αXα,包含映射iα : Xα ↪→ ∨αXα 诱导同构⊕α(iα)∗ :

⊕αHn(Xα) → Hn(∨αXα), 只要在形成wedge sum时,每个基点xα ∈ Xα使(Xα, xα) 是

“好对”即可

因此,我们有如下的

命题4 如果X是一个CW复形,则

a) Hk(Xn, Xn−1)在k = n时是零,在k = n时是自由Able群,且存在一组基使得每个基对

应X的n维胞腔。

b) 当k > n时,Hk(Xn) = 0。

c) 当k < n时,包含映射i : Xn ↪→ X诱导同构Hk(Xn)

i∗−→ Hk(X)。

证明

a) 因为(Xn, Xn−1)是好对,所以

Hk(Xn, Xn−1) ∼= Hk(X

n/Xn−1) ∼= Hk(∨αSnα) ∼= ⊕αHk(S

nα)

其中每个直和项对应一个n维胞腔。

只要注意到Hk(Sn) ∼=

{Z k = n

0 k = n即知a)成立。

6

b) k > n时,考虑正合列

Hk+1(Xn, Xn−1) → Hk(X

n−1) → Hk(Xn) → Hk(X

n, Xn−1)

由a)知首尾两项为0,从而Hk(Xn−1) ∼= Hk(X

n)。依此类推,Hk(Xn) ∼= Hk(X

n−1) ∼=· · · ∼= Hk(X

0) = 0。

c) k < n时,因为X是有限CW复形,设X = Xm 考虑正合列

Hk+1(Xn+1, Xn) → Hk(X

n) → Hk(Xn+1) → Hk(X

n+1, Xn)

依此类推,Hk(Xn) ∼= Hk(X

n+1) ∼= · · · ∼= Hk(Xm) = Hk(X)。

设X是一个CW复形,利用命题4.

考虑如下交换图表中(Xn+1, Xn),(Xn, Xn−1),(Xn−1, Xn−2)的同调群长正合列:

0

0

%%KKKKKKKKKK Hn(Xn+1) ∼= Hn(X)

99sssssssss

Hn(Xn)jn

%%KKKKKK

KK

99ssssssss

· · · → Hn+1(Xn+1, Xn)

∂n+199ssssssss dn+1 // Hn(Xn, Xn−1)

dn //

∂n %%KKKKKKKHn−1(X

n−1, Xn−2) → · · ·

Hn−1(Xn−1)

jn−1

99sssssss

0

99sssssssss

其中dn+1 = jn∂n+1, dn = jn−1∂n.因为dndn+1 = jn−1(∂njn)∂n+1 = 0, 故水平方向的群

列是链复形,我们称其为X的胞腔链复形,记它的n阶同调群为HCWn (X).我们有:

命题5 HCWn (X) ∼= Hn(X)

证明 HCWn (X) = ker dn

Im dn+1.因为dn = jn−1∂n而jn−1是单射,所以ker dn = ker ∂n =

Im jn

因为jn是单射,故它诱导了Hn(Xn)到jn(Hn(Xn)的同构,所以

ker dn

Im dn+1=

Im jn

Im jn∂n+1=

Hn(Xn)

Im ∂n+1

7

因为Hn+1(Xn+1, Xn)

∂n+1−−−→ Hn(Xn) → Hn(Xn+1) → 0是恰当列,所以

Hn(Xn)

Im ∂n + 1∼= Hn(Xn+1) ∼= Hn(X) (命题4)

即HCWn (X) ∼= Hn(X)

由此可见,X的胞腔同调群与X的胞腔分解是无关的。

1.2 CW复形链群Hn(Xn, Xn−1)的生成元

设X是(有限)CW复形,定义连续映射f : (⊔

α Dnα,

⊔α Sn−1

α ) → (Xn, Xn−1)使

得f |Dnα= Φα. 其中指标α跑遍X的n维胞腔en

α的指标集。我们有:

命题6 f∗ : Hn(⊔

α Dnα,

⊔α Sn−1

α ) → Hn(Xn, Xn−1)是同构。

从而根据Hn(⊔

α Dnα,

⊔α Sn−1

α ) ∼= ⊕αHn(Dnα, Sn−1

α ),取定Hn(Dn, Sn−1)的一个生成元c,

则{(Φα)∗c} ⊂ Hn(Xn, Xn−1)就是Hn(Xn, Xn−1)的一组基。

证明 考虑如下交换图表:

Hn(⊔

α Dnα,

⊔α Sn−1

α )f∗ //

��

Hn(Xn, Xn−1)

��

Hn(∨αSnα)

f∗ // Hn(Xn/Xn−1)

纵向的两个映射由商映射诱导,由于(⊔

α Dnα,

⊔α Sn−1

α ), (Xn, Xn−1)均是“好对”,这两个

映射均是同构。通过两个商映射诱导了f :⊔

α Dnα/

⊔α Sn−1

α → Xn/Xn−1,根据f的定义,

f是连续双射,再由球面的紧致性知这是闭映射,从而是同胚。f∗是同构,所以f∗也是同

构。

2 胞腔边缘公式

2.1 Hn(Sn)的标准生成元γn

定义H0(S0)的生成元γ0为{+1} − {−1}所在的同调类,(其中{+1}表示奇异链pt 7→

{+1},以下0维奇异链均采用类似表达)。假设已经定义了γn−1.记π∗是命题2中

确定的同构Hn(Dn, Sn−1)π∗−→ Hn(Dn/Sn−1, Sn−1/Sn−1). 由于正合列中有有同

构Hn(Dn, Sn−1)∂∗−→ Hn−1(S

n−1). 取γn为Hn(Sn) = Hn(Dn/Sn−1)的生成元,使得γn =

8

k−1∗ π∗∂−1

∗ γn−1

Hn(Dn, Sn−1)π∗ //

∂∗��

Hn(Dn/Sn−1, Sn−1/Sn−1) Hn(Dn/Sn−1)k∗oo

Hn−1(Sn−1)

2.2 将Hn(Xn, Xn−1)的基与n维胞腔作等同

由命题6,设c = ∂−1∗ γn−1 ∈ Hn(Dn, Sn−1). 其中Hn(Dn, Sn−1)

∂∗−→ Hn−1(Sn−1)是

边缘同态,则{(Φα)∗∂−1∗ γn−1}α ⊂ Hn(Xn, Xn−1)是Hn(Xn, Xn−1)的一组基。我们

记(Φα)∗∂−1∗ γn−1 =: en

α.

对n=0时,H0(X0)的一组基为{e0

α},可与e0α等同。

2.3 公式的叙述和证明

设enα ∈ Hn(Xn, Xn−1)是一组基。

因为dn(enα) ∈ Hn−1(X

n−1, Xn−2), 而Hn−1(Xn−1, Xn−2)有一组基{en−1

β }β .所以存在整

数dα,β使得

dn(enα) =

β

dα,βen−1β

设Φβ是en−1β 的特征映射。设q : Xn−1 → Xn−1/(Xn−1 − en−1

β ), π : Dn−1 → Dn−1/Sn−2是

商映射。因为Φβ(Sn−2) ⊂ Xn−1 − en−1β , 所以存在一个定义良好的一一映射Φβ :

Dn−1/Sn−2 → Xn−1 → Xn−1 − en−1β 使得下图交换

Dn−1Φβ //

π

��

Xn−1

q

��

Dn−1/Sn−2Φβ // Xn−1/(Xn−1 − en−1

β )

由π是商映射的性质知Φβ连续,再由球面的紧致性知Φβ 是闭映射,从而Φβ是同胚。

考虑交换图表:

Hn(Xn, Xn−1)∂∗ // Hn−1(X

n−1)j∗ // Hn−1(X

n−1, Xn−2)i∗ // Hn−1(X

n−1, A)q∗ // Hn−1(Xn−1/A, pt)

Hn(Dn, Sn−1)

(Φα)∗

OO

∂∗ // Hn−1(Sn−1)

(φα)∗

OO

Hn−1(Dn−1, Sn−2)

(Φβ)∗

OO

π∗ // Hn−1(Dn−1/Sn−2, pt)

(Φβ)∗

OO

Hn−1(Dn−1/Sn−2)

k∗

OO

9

其中A = Xn−1 − en−1β ,i∗, j∗, k∗都是包含映射诱导的同态,q∗, π∗是商映射诱导的同

态,∂∗为边缘同态。Φβ的定义如前。

左边矩形的交换性来自边缘同态的自然性。

因为Φα |Sn−1= φα,所以∂∗enα = (φα)∗∂∗(Φα)−1

∗ enα = (φα)∗γn−1 (根据之前en

α ∈Hn(Xn, Xn−1)的定义)。

从而j∗(φα)∗γn−1 = j∗∂∗enα = dn(en

α) =∑

β′ dαβ′en−1β′

由于∀β′ = β,eβ′承载在Φβ′(Dn−1) ⊂ Xn−1 − en−1β 上,所以i∗(

∑β′ dαβ′en−1

β′ ) = dαβen−1β 只

剩下一项。

再根据en−1β 的定义,(k∗)−1(Φβ)−1

∗ q∗en−1β = (k∗)−1π∗(Φβ)−1

∗ en−1β = γn−1

所以(k∗)−1((Φβ)−1qijφα)∗γn−1 = dαβγn−1

如果γn−1由Sn−1上的约化闭链c ∈ Zn−1(Sn−1)代表,则因为c是绝对同调群的闭链,上式

意味着[((Φβ)−1qφα)#c] = dαβ [c] 即(Φ−1β qφα)∗γn−1 = dαβγn−1 ∈ Hn−1(S

n−1).

当n > 1时,Hn−1(Sn−1) = Hn−1(S

n−1),所以dαβ就是球面映射

Sn−1 φα−−→ Xn−1 q−→ Xn−1/Xn−1 − en−1β

Φβ−1

−−−→ Sn−1

的映射度。

在n=1时,仍有∂∗e1α = (φα)∗∂∗(Φα)−1

∗ e1α = (φα)∗γ0。假设e1

α的特征映射Φα将+1, −1分别

映为eβ+, eβ−,则

d1(e1α) = (φα)∗γ0 = eβ+ − eβ−

特别的,只有一个零维胞腔时,d1是零映射。

从而我们证明了本文的主要结果:

胞腔边缘公式:当n > 1时,dn(enα) =

∑β dαβen−1

β , 其中enα, en−1

β 的意义如前,dαβ是复合

映射

Sn−1 ϕα−→ Xn−1 q−→ Xn−1/Xn−1 − en−1β

Φβ−1

−−−→ Sn−1

的映射度。

注3 公式中dαβ不仅依赖于拓扑空间X的胞腔分解结构,还依赖于胞腔的特征映

射Φα, Φβ. 这从等式dn(enα) =

∑β dαβen−1

β 也能看出:一旦改变特征映射Φβ , 根据en−1β ∈

Hn−1(Xn−1, Xn−2)的定义,en−1

β 也会改变,从而组合系数dαβ也要跟着变化。

3 映射度(degree)与局部映射度(local degree)

胞腔边缘公式把CW复形边缘同态的计算转化成了映射度的计算。以下的计算局部映

射度的方法能够在实际计算中帮助我们算出很多映射的映射度,例如S1 → S1, z 7→ z2。

10

定义3 设f : Sn → Sn是的连续映射,f诱导同态f∗ : Hn(Sn) → Hn(Sn).因

为Hn(Sn) ∼= Z,所以存在唯一的整数deg(f)使得∀x ∈ Hn(Sn), f∗(x) = deg(f)x.整

数deg(f)称为f的映射度。

定义4 设n > 0, V ⊂ Sn是非空开集,f : V → Sn是连续映射,Q ∈ Sn是一个点。考

虑复合同态

Hn(Sn)j∗−→ Hn(Sn, Sn−f−1(Q))

(i∗)−1

−−−−→∼=Hn(V, V −f−1(Q))

f∗−→ Hn(Sn, Sn−Q)(k∗)−1

−−−−→ Hn(Sn)

其中i, j, k都是包含映射。 i∗是同构是因为切除定理。k∗是同构是因为Sn − Q ∼=En−1.则存在唯一degQ f ∈ Z, s.t.复 合 同态x 7→ degQ(f)x的形 式,其 中x ∈Hn(Sn).称degQ f为f在Q点的局部度。

命题7 如果Q /∈ Im f ,则degQ f = 0.如果f : V → Sn是包含映射,则degQ f =

1, ∀Q ∈ V.如果f是从V到开集fV的同胚且Q ∈ fV ,则degQ f = ±1.

证明 略

命题8 如果f−1(Q) ⊂ K ⊂ U ⊂ V ,其中K是紧集,U是开集。则degQ f也可由如下

复合同态给出:

Hn(Sn)j∗−→ Hn(Sn, Sn − K)

(i∗)−1

−−−−→ Hn(U,U − K)f∗−→ Hn(Sn, Sn − Q)

(k∗)−1

−−−−→ Hn(Sn)

证明 由如下图表的交换性立即得到结论:

Hn(Sn, Sn − f−1(Q))(i∗)−1

// Hn(V, V − f−1(Q))f∗

))SSSSSSSSSSSSSSS

Hn(Sn)

j∗66lllllllllllll

j∗

((RRRRRRRRRRRRRHn(Sn, Sn − Q)

Hn(Sn, Sn − K) //

l∗

OO

Hn(U,U − K)

t∗

OO

f∗

55jjjjjjjjjjjjjjj

其中l, t是包含映射

推论1 如果f : Sn → Sn是连续映射,则∀Q ∈ Sn, deg(f) = degQ f.

证明 在命题8中取U = V = Sn.

以下两个命题是我们计算映射度的主要工具:

11

命题9 如果f : V → Sn和Q ∈ Sn如定义4,g : Sn → Sn是连续映射,则fg :

g−1(V ) → Sn在Q点的局部映射度为

degQ(fg) = degQ(f) deg(g)

证明 考虑交换图表:

Hn(Sn)j∗ //

g∗

��

Hn(Sn, Sn − g−1f−1(Q))(i∗)−1

//

g∗

��

Hn(g−1(V ), g−1(V ) − g−1f−1(Q))

g∗

��

(fg)∗ // Hn(Sn, Sn − Q)(k∗)−1

// Hn(Sn)

Hn(Sn)t∗ // Hn(Sn, Sn − f−1(Q))

(l∗)−1

// Hn(V, V − f−1(Q))

f∗

44iiiiiiiiiiiiiiiii

其中i, j, k, l, t都是包含映射。

上面一行将x ∈ Hn(Sn)映到degQ(fg)x,下面一行将x映到deg g · degQ f · x

从而degQ(fg) = degQ(f) deg(g).

命题10 设f : V → Sn和Q ∈ Sn如定义4,设V =∪r

λ=1 Vλ,其中V1, · · · , Vr是开

集,且f−1λ (Q)(fλ = f |Vλ

), 两两不交,f−1λ (Q)

∩f−1

µ = ϕ,如果λ = µ. 则degQ(f) =∑r

λ=1 degQ(fλ).

证明 因为{f−1λ (Q)}两两不交,所以存在f−1

λ (Q)在Vλ中的开邻域Uλ,使得{Uλ}rλ=1

两两不交。令U = ∪λUλ.

考虑如下图表:

Hn(Sn)j∗ //

{id}��

Hn(Sn, Sn − f−1(Q))(i∗)−1

//

{(lλ)∗}��

Hn(U, U − f−1(Q))f∗ // Hn(Sn, Sn − Q)

(k∗)−1

// Hn(Sn)

⊕λHnSn⊕(jλ)∗ // ⊕λHn(Sn, Sn − f−1

λ (Q))⊕(iα)−1

∗ // ⊕λHn(Uλ, Uλ − f−1λ (Q))

⊕(fλ)∗ //

{(l′λ)∗}

OO

⊕λHn(Sn, Sn − Q)

{id}

OO

⊕(kλ)−1∗ // ⊕λHn(Sn)

{id}

OO

其中j, jλ, i, iλ, k, kλ, lλ, l′λ是包含映射。

向下的{id}与{lλ}表示把x映到(x, x · · · , x)和((l1)∗x, (l2)∗x, · · · , (lr)∗x).

向上的{id}和{(l′λ)∗}表示把(x1, · · · , xr)映到x1 + · · · + xr和(l′1)∗x1 + · · · + (l′r)∗xr。

除了第二个矩形之外,图表其余部分显然是交换的。

设(x1, · · · , xr) ∈ ⊕λHn(Uλ, Uλ − f−1λ Q). 则i∗{(l′λ)∗}(x1, · · · , xr) = x1 + · · · + xr.对每

个λ,(lr)∗(x1 + · · · + xr) = xλ, 因为若µ = λ,则xµ承载在Uµ ⊂ Sn − f−1λ (Q)中,从而

在Hn(Sn, Sn − f−1λ )中同调于0. 故{(lλ)∗}(x1 + · · · + xr) = (x1, · · · , xr). 从而第二个矩形

也是交换的。于是整个图表也是交换的。

∀x ∈ Hn(Sn),由命题8,x被第一行的映射映到degQ(f)x,x被左右两列和第二行的映射映

到∑r

λ=1 degQ fλ · x 从而degQ f =∑r

λ=1 degQ fλ

利用命题9和命题10,我们就可以计算本段最开始提出的映射f : S1 → S1 z 7→ z2的

映射度。

12

事实上,取Q = 1,取V1是1的一个开邻域且diam V1 < 1/100,令g : S1 → S1 z → −z为对

径映射。由命题8,我们可以将f限制在V = V1 ∪ g(V1)上计算局部度。记V2 = g(V1), fi =

f |Vi ,则f1 = f2g,从而由命题9,degQ f1 = degQ f2 · deg g = degQ f2 · (−1)(1+1) = degQ f2.

从而deg f = degQ f = degQ f1 + degQ f2 = 2 degQ f1. 因为f11是从V1到fV1的同胚,所

以degQ f = ±1,从而deg f = ±2. 符号的确定在我们的之后的计算中是不需要的。

4 nT 2,mP 2和RPn的同调群的计算

4.1 nT 2的同调群

亏格为n的可定向比曲面有如下的胞腔分解:

nT 2 = e0 ∪ e1 ∪ · · · ∪ e1︸ ︷︷ ︸

2n

∪e2

其中粘接映射φ : S1 → e0 ∪ e1 ∪ · · · ∪ e1是把S1作4n等分,然后将前2n分依

次粘到第1, 2, · · · , 2n个1维胞腔所在的圆周上,之后再将后2n个份依次方向粘到

第1, 2, · · · , 2n个1维胞腔所在的圆周上。

记第1, 2, · · · , 2n个1维胞腔分别为e11, e

12 · · · e1

2n. 则映射

S1 φ−→ X1 q−→ X1/X1 − e1i

Φ−1i−−→ S1

在除S1的第i和第2n + i等份上的限制是常值。在第i份与第2n + i份上的“缠绕”方向

相反,容易证明这个映射同伦于常值映射,从而它的映射度是0. 因为上述讨论对每

个i = 1, 2, · · · , 2n都成立,根据胞腔边缘公式,d2 = 0.

注意到nT 2的CW链群列同构于

0 → Z d2−→ Z2n d1−→ Z → 0

其中d2 = 0,所以H2(nT 2) ∼= Z.

只有一个零维胞腔,d1 = 0,故H1(nT 2) = Z2n.

4.2 mP 2的同调群

亏格为m的不可定向闭曲面有如下胞腔分解

mP 2 = e0 ∪ e1 ∪ · · · ∪ e1︸ ︷︷ ︸

m

∪e2

13

其中2维胞腔的粘接映射φ的定义与nT 2的类似,只是将“4n等分”改为“2m等分”,并且

将第2i − 1和第2i份同向映到e′i上。此时复合映射

S1 φ−→ X1 q−→ X1/X1 − e1i

Φ−1i−−→ S1

同伦于映射z 7→ z2.根据之前的讨论,它的映射度为±2之一。根据胞腔边缘公式,

d2(e2) = ±(2e1

1 + 2e12 + · · · + 2e1

m)

再由mP 2的CW链群

0 → Z d2−→ Zm d1−→ Z → 0

和d1 = 0(类似nT 2时的情形),可以看出:

H2(mP 2) = 0

H1(mP 2) ∼= Zm−1 ⊕ Z/2

H0(mP 2) ∼= Z

4.3 RPn的同调群

n维实射影空间有如下的胞腔分解:

RPn = en ∪ en−1 ∪ · · · ∪ e1 ∪ e0

并且k维胞腔(0 ≤ k ≤ n)的粘接映射

φk : Sn−1 = ∂ek → RPn

就是将∂ek的对径点视为等同的二叶覆盖,考虑复合映射

f : Sk−1 φk−→ RPk−1 q−→ RPk−1/RPk−1 − ek−1 Φ−1k−1−−−→ Sk−1

其中q是商映射,Φk−1是ek−1的特征映射诱导的同胚。取Q ∈ Sk−1使得Φk−1(Q) ∈(RPk−1/RPk−1 − ek−1) − (RPk−1 − ek−1/RPk−1 − ek−1) 则q−1(Φk−1(Q))只含一个点,

且存在一个q−1(Φk−1(Q))的开邻域使得q限制在这个邻域上式到它像集的同胚。又

因为φk是二叶覆盖,所以f−1(Q) = φ−1k (q−1(Φk−1(Q)))仅包含一对对径点{x0, x0}.

设A : Sn−1 → Sn−1 x 7→ −x是对径映射. 取x0 ∈ Sk−1的开邻域V1使得V2 = A(V1)与V1不

交,且f |Vi= fi是从Vi到fVi的同胚(由φk是覆盖映射知这可以做到)。因为f1 = f2A,根

据命题9,degQ f1 = degQ f2 · degQ A = degQ f2 · (−1)k. 从而

deg f = degQ f = degQ f1 + degQ f2 = (1 + (−1)k) degQ f1 (∗)

14

其中degQ f1 = ±1 因为RPn的胞腔链群列为:

0 // Zdn // Z

dn−1 // · · · // Zd2 // Z

d1 // Z // 0n n − 1 2 1 0

根据胞腔边缘公式和(∗)可知:

dk(1) =

{0 若k ≤ 1是奇数

2或− 2 若k > 0是偶数

其中“1”表示Hk(Xk, Xk−1) ∼= Z的一个生成元.

由此立即算出:

当n是偶数时, Hk(RPn) =

Z/2Z k是奇数且k < n

Z k = 0

0 k是偶数或k ≥ n

当n是奇数时, Hk(RPn) =

Z/2Z k是奇数且k ≤ n − 2

Z k = 0, n

0 k是偶数或k > n

5 结语

本文的目的在于实现胞腔边缘公式证明中所有的细节。一些书在叙述胞腔边缘公式

的时候,并没有明确指出每个n维胞腔是如何对应Hn(Xn, Xn−1)中的生成元的,也不说明

地将某些同构的群视为等同,这对笔者理解胞腔边缘公式带来了一些困难。产生这些困难

的主要原因在于,假设A是n维球面Sn的对径映射,则A∗ : Hn(Sn) → Hn(Sn)为同构,但

当n是偶数时,deg A = −1. 从而Hn(Sn)f∗−→ Hn(Sn)与Hn(Sn)

f∗−→ Hn(Sn)A∗−−→ Hn(Sn)有

不同的映射度,都使最后一个同态A∗是同构。如果随意将同构的群视为等同,可能会使

映射度(特别是局部映射度!)的计算得到错误的结果。在本文中,笔者采用了文[1]的建

议,引入了Hn(Sn)的标准生成元,进而对Hn(Xn, Xn−1)中n维胞腔enα对应的生成元给出

了明确的定义,从而实现了公式证明中的所有细节。在映射度的计算中,利用命题9避免

了符号产生的混淆。在画交换图表时,笔者也将每个同构映射都具体写出,而不是简单

的说成同构。这给证明图表的交换性时也带来了方便。然而,即使我们严格证明了胞腔

边缘公式,在具体计算中,正如本文的第五部分,想要描述清楚CW复形的粘接映射和特

征映射也总是有些麻烦的。本文的第二部分主要来源于文[2],局部映射度的方法全部摘自

文[1]。

15

参考文献

[1] Albrecht Dold, Lectures on Algegraic Topology.

[2] Allen Hatcher, Algebraic Topology.

[3] James R. Munkres, Elements of Algebraic Topology.

[4] 尤承业, 基础拓扑学讲义.

数学趣闻

1996年春天,UC Berkeley为陈省身举行了一个庆祝会。很多微分几何名家都出席

了,陈省身以前的一个学生Simons, Jim(1938–)也来了,陈省身和他合写了一篇文章,提

出了Chern-Simons理论,后来Simons弃学经商,赚了不少钱,不过这个Simons比较爱开

别人的玩笑,这次会议其间,他做了一个报告,说到他离开学术界以后,陈自然感到很

婉惜,但是“毕竟他不是Hilbert”,Simons评论道:“把我跟Hilbert相比简直实在是太抬

举我了,用一个Hirzebruch, Friedrich(1927–)就足够了!”当时听众都乐了,只有一个人除

外,那就是坐在一个角落的Hirzebruch。

16

指数映射定义等价性的两种证明∗

张铭†

引言

通过学习,我们知道在李群理论和黎曼几何理论中都定义了指数映射。关于这

两种定义间的关系,伍鸿熙在其所著的《黎曼几何初步》一书中有一注记,大意是

设M = SO(n),MI为M在单位阵I处的切空间,若在M上给定由MI的 Killing型诱导

的双不变度量,那么黎曼几何意义下的指数映射expI : MI → M由下式给出:

expI A = eA =∞∑

m=0

Am

m!, ∀A ∈ MI

在注记的最后,伍鸿熙写到“这只是李群理论中一些平凡事实的综合,但是很抱歉,

我们找不到一本这方面的文献,能够扼要地说明这个事实”。

本文即是对上述评注的探讨。我们首先简单回顾李群和黎曼几何中指数映射的定

义,然后例举特殊李群—矩阵群,以说明“指数”一词的来历,最后用两种不同的方法

证明对带有双不变度量的李群,两种定义下的指数映射是一样的。

1 李群中的指数映射

设G为李群,其上单参数子群是指可微同态Φ : R → G,即Φ为G上光滑曲线,且对任

意t1, t2 ∈ R有:Φ(t1)Φ(t2) = Φ(t1 + t2)

由定义知Φ是过单位元的曲线。

有关单参数子群的一个重要结果是:对任意Xe ∈ TeG(TeG为G在单位元e处的切空间),

存在唯一单参数子群Φ : R → G使得Φ(0) = Xe。

完备性起见,我们将简要叙述这一结果的证明:

设X是由Xe决定的G上的左不变向量场,并设X对应的单参数可微变换群为φt(由

于G 具有群结构,细推可知X对应的局部单参数变换群φt实际上对t ∈ R均有定义,从而∗2011年春季学期微分流形讨论班上提出的问题†基数92

17

是单参数可微变换群)。对G中任意一点a,记左平移为La,细推可知向量场DLa(X)对应

单参数可微变换群为La ◦ φt ◦ (La)−1,又由于X是左不变向量场,故DLa(X) = X,由此

知:La ◦ φt ◦ (La)−1 = φt,即La ◦ φt = φt ◦ La。令Φ(t) = φt(e),则:

Φ(t1 + t2) = Φ(t2 + t1) = φt2 ◦ φt1(e) = φt2 ◦ LΦ(t1)(e)

= LΦ(t1) ◦ φt2(e) = LΦ(t1) ◦ Φ(t2) = Φ(t1)Φ(t2)

故Φ是单参数子群,且Φ(0) = Xe,由此便证明了给定初始向量Xe,则存在与之对

应的单参数子群Φ,下面还需要证明Xe所对应的单参数子群的唯一性。断言任意满

足a(0) = Xe的单参数子群a一定是X的积分曲线。如果断言成立,那么由积分曲线依初值

的唯一性知单位元处切向量与单参数子群是一一对应的。断言的证明是直接的:

a(t) =d

ds

∣∣∣∣s=0

a(t + s) =d

ds

∣∣∣∣s=0

La(t)a(s) = DLa(t)(a(0)) = DLa(t)(Xe) = Xa(t)

由上面的证明我们知道Xe对应的单参数子群是Xe所决定的左不变向量场X过单位

元e的积分曲线。有了这个观察后,我们便可定义李群中的指数映射:定义TeG到G的指

数映射为:

exp : TeG → G X 7→ ΦX(1)

其中ΦX(t)代表X对应的单参数子群。

由定义有下列重要观察:

1.由积分曲线依初值唯一性不难得出:ΦλX(t) = ΦX(λt), ∀λ, t ∈ R, X ∈ TeG

2.由于

exp(t1 + t2)X = Φ(t1+t2)X(1) = ΦX(t1 + t2)

= ΦX(t1)ΦX(t2) = Φt1X(1)Φt2X(1) = exp(t1X) exp(t2X)

特别的e = exp(t − t)X = exp(tX) exp(−tX),即exp(−tX) = (exp(tX))−1。

我们已经给出李群中指数映射的定义,现在来考察在特殊的李群—矩阵群中,指数映

射是怎样的:

设G为一个矩阵群,不妨设为GLn(V )(GL(n, C)或者GL(n, R))的子群。G在单位元处

切空间中向量可看作gln(V )(所有n阶方阵)中元素(譬如当G = SOn(V )或SLn(V )时,

对应单位元处切向量分别为斜对称方阵和零迹方阵)。我们在高代课上已经知道对任

意A ∈ gln(V )可以定义关于矩阵A的指数级数:

exp A = I + A + · · · +1

k!Ak + · · ·

18

指数级数有一重要性质:

对任意A,B ∈ gln(V ),当AB = BA时,

expA exp B = exp(A + B)

于是特别有:

exp t1A exp t2A = exp(t1 + t2)A, ∀A ∈ gln(V )

此式表明exp tA是GLn(V )的单参数子群。考虑到G是GLn(V )的子群,则当A ∈TIG时,exp tA是否属于G? 对此有一一般性结果:设G是G′的李子群,g和g′分别是它

们对应的李代数,若单位元处切向量Xe ∈ g,则Xe对应的单参数子群落在G中(对于这个

命题的详细讨论,读者可参见[5, §3])。由上面定理我们知道当A ∈ TIG ⊂ gln(V )时,由

于exp tA是GLn(V )中单位阵I处切向量A对应的单参数子群,故exp tA落在子群G中。这

表明exp tA实际上是子群G的单参数子群,并且由指数级数性质知 ddt

∣∣∣∣t=0

exp tA = A,所

以对任意A ∈ TIG,其对应的G中单参数子群即为exp tA。由此我们知道李群意义下的指

数映射即为:

expLie Groups A = exp tA

∣∣∣∣t=1

= exp A = I + A + · · · +1

k!Ak + · · ·

这便是“指数”一词的来历。

2 黎曼几何中的指数映射

设M为光滑的黎曼流形,由测地线性质知,对于任意固定p ∈ M,存在ε, δ > 0,使

得对任意v ∈ TpM, |v| < δ,存在唯一测地线γv : (−ε, ε) → M满足:

γv(0) = p

γv(0) = v

由于测地线是一组常微分方程的积分曲线,由积分曲线依初值唯一性不难证明:

γav(t) = γv(at), |v| < δ, a = 0, |t| <ε

|a|故我们可以选定a0,满足0 < a0 < ε,于是对任意v ∈ TpM, |v| < a0δ,γv(t)在[−1, 1]上均有

定义,由此我们便可以定义黎曼几何中的指数映射:

令Op = {v|v ∈ TpM, |v| < a0δ},定义:

expp : Op → M, v → γv(1)

其中γv为v对应的测地线(注意,在点p处指数映射定义中,Op只需是使得γv(1)有意义的切

空间零点处足够小邻域即可)。

19

3 指数映射定义等价性的两种证明

现在我们已经定义了两种指数映射,一个自然的问题是:当一个李群带有双不变的黎

曼度量时,李群意义下的指数映射同黎曼几何意义下单位元处切空间的指数映射是否相

同(注意,这里假定李群已经带有双不变度量。我们知道紧李群上一定有双不变度量,但

非紧的李群不一定具有双不变度量,读者可以试试GL(n, R)这个反例)。如果定义出的指

数映射相同,要证明这个命题自然可以从两个方向考虑:要么证明过单位元的测地线就是

单参数子群,要么证明单参数子群就是过单位元的测地线。下面我们分别从这两方面给出

两种不同的证明。

3.1 证法1.证明过单位元的测地线是单参数子群

证法1的关键源自这样一个观察:带有双不变度量(·, ·)的李群是一个对称空间。对称空间(symmetric spaces)指黎曼流形(M, g),满足对任意p ∈ M,存在一个等

距变换Ap,使得Ap(p) = p,且DAp : TpM → TpM是对径变换−I。直观地看,对称空间

在每点都存在“反射”(有关对称空间的讨论,读者可参见[1, §8])。

由定义可知,对任意测地线γ(t)(满足γ(0) = p),γ1 = Ap ◦ γ(t)仍是一条测地线,

并且γ1(0) = −γ(0),由测地线依初值的唯一性知γ1(t) = γ(−t),故若γ(t)中自变量t的取

值范围是(−a, b), a, b > 0,由γ1(t) = γ(−t),我们可将γ(t)的定义区间延拓到(−c, c),其

中c = max{a, b}。下面证明:带有双不变度量(·, ·)的李群G是对称空间。

分三步:

a. 定义Ae : g → g−1,令X ∈ TeG,则由X对应的单参数子群ΦX(t)满足ΦX(t)−1 =

Φ−X(t)知:DAe将X变为了−X,从而DAe是TeG → TeG的对径变换−I,特别知道其

在TeG上是等距变换。

b.下面通过左右平移来证明Ae是整体等距变换。

注意到有等式:

(DAe)|h = D(Rh−1 ◦ Ae ◦ Lh−1)|h = (DRh−1)|e ◦ (DAe)|e ◦ (DLh−1)|h

由于第二个等式右端三个切映射都是等距变换,故(DAe)|h是h处切空间到h−1处切空

间的等距映射,从而证明了Ae是G上整体等距变换,故我们已经在单位元e处验证了对称

空间定义中条件。

c.下面通过左右移动来证明G上每点都有对称空间定义中所需的等距变换。

构造是明显的,对任意p ∈ G,定义Ap = Lp ◦ Ae ◦ Lp−1,易见Ap是固定p的等距变

换,且在p点切空间上是对径变换。

20

以上便证明了:带有双不变度量(·, ·)的李群是一个对称空间。有了上述准备,下面来证明过单位元的测地线是单参数子群。

设γX(t)是测地线,满足γX(0) = e, γX(0) = X。由于在每点可以将测地线“反射”,

所以可以考虑在不同点进行两次“反射”:

AγX(c) ◦ Ae(γX(t)) = AγX(c)(γX(−t)) = γX(2c + t) (1)

其中c ∈ R。需要注意的是此处并未考虑γX(t)的定义区间,不难验证:通过不断的“反射”,可以

将γX(t)的定义区间延拓到整个R上,即对称空间实际上是完备的。上面主要用到的性质是测地线关于初值的唯一性,下面再考虑李群本身的群结构:

AγX(c) ◦ Ae(γX(t)) = AγX(c)(γX(t)−1)

= LγX(c) ◦ Ae ◦ Lγ−1X(c)

(γX(t)−1) = γX(c) · γX(t) · γX(c) (2)

结合(1)与(2)可知:

γX(2c + t) = γX(c) · γX(t) · γX(c), ∀t, c ∈ R (3)

从这个关键的等式中我们已经看到单参数子群的影子,为验证γX(t)确实是单参数子

群,剩下的就只是一些繁琐的验证了。首先我们断言:

γX(nt) = γX(t)n, n ∈ N, t ∈ R

由于γX(t)−1 = γX(−t),故只需证明n > 0的情形。归纳证明:k = 1时等式显然成

立。设1 ≤ k < n时已证明γX(kt) = γX(t)k,则当k = n时:

若n = 2j,令(3)中t = 0, c = jt1,则γX(nt1) = γX(2jt1) = γX(jt1)2 = γX(t1)

2j =

γX(t1)n

若n = 2j + 1,令(3)中c = jt,则γX(nt) = γX(jt) · γX(t) · γX(jt) = γX(t)n

从而由归纳证明了γX(nt) = γX(t)n, ∀n ∈ N, t ∈ R。再令t = 1m有:

γX(n

m) = γX(

1

m)n, m ∈ N

从而对任意分数m1n1

, m2n2有:

γX(m1

n1+

m2

n2) = γX(

m1n2 + m2n1

n1n2)

= γX(1

n1n2)m1n2 · γX(

1

n1n2)m2n1 = γX(

m1

n1) · γX(

m2

n2)

21

最后由连续性知,对任意实数t1, t2有:

γX(t1) · γX(t2) = γX(t1 + t2)

从而证明了过单位元的测地线是单参数子群,故李群意义下的指数映射与黎曼几何意

义下的指数映射是一样的。

3.2 证法2.证明单参数子群是过单位元的测地线

证法2的关键源自这样一个观察:对于带有双不变度量(·, ·)的李群G,其上协变导数

有很简单的表达[1, §3.4]:

∇Y X =1

2[Y, X] (4)

其中X, Y ∈ g,g为G上李代数,我们也可将g看做G上所有左不变向量场组成的集合,或

者将其看做TeG。

如果(4)式成立,那么对任意单参数子群Φ(t),由于它是Φ(0)对应的左不变向量场的

积分曲线,故

∇Φ(t)Φ(t) =1

2[Φ(t), Φ(t)] = 0 (5)

由定义,Φ(t)是G上过原点的测地线,所以证法2的关键在于证明(4)式。

为证明(4)式,我们首先介绍李群和李代数的伴随作用(adjoint action)。李群对自身的

伴随作用指内自同构Adg(x) = gxg−1,其中x, g ∈ G。此映射在TeG上微分为一线性映射,

仍记为Adg : g → g,可以证明这是李代数的自同构,于是我们得到同态Ad : G → Aut(g),

称此Ad为李群对李代数的伴随作用。此时如果再考虑Ad的微分,那么我们将得到李代数

对自身的伴随作用:

ad : g → End(g)

其中ad = D(Ad)|e。非常幸运的是作用ad有简单的显示表达,即

ad : X → adX(Y ) = [X, Y ], ∀X,Y ∈ g (6)

(6)式证明如下:

易见李群中元素h对李代数g的作用为Adh = DRh−1DLh。设g中元素X对应的单参数

可微变换群为φt (φ1(e) = exp(X|e)),则:

adX(Y )|e =d

dtDRφ−t(e)DLφt(e)(Y |e)|t=0

a=

d

dtDRφ−t(e)(Y |φt(e))|t=0

b=

d

dtDφ−t(Y |φt(e))|t=0

c= LXY = [X, Y ]

22

其中a等号成立是由于Y是左不变向量场;b等号成立是由于Rφt(e)(h) = φt(h), h ∈ G,这是

因为曲线φt(h) = φh(t)与Rφt(e)(h) = h · φe(t),当t = 0时都在h点,且初始速度均为X|h,故由积分曲线依初值唯一性知:Rφt(e)(h) = φt(h);c等式是李导数的定义。

有了伴随作用ad的显示表达,我们就能够导出李括号[·, ·]与度量(·, ·)间重要的关系式。

由于度量(·, ·)是双不变的,故有:

0 =d

dt(Adexp(tX)

(Y ),Adexp(tX)(Z))|t=0 = (adXY, Z) + (Y, adXZ)

即我们得到重要的斜伴随关系:

([X,Y ], Z) = −(Y, [X, Z]) (7)

由(7)式我们可以很容易地证明出证法2中最关键的(4)式。由协变导数满足

的Koszul[1, §2.1]公式,对任意X, Y, Z ∈ g,有:

2(∇Y X, Z) = DX(Y,Z) + DY (Z, X) − DZ(X,Y ) − ([X, Y ], Z) − ([Y, Z], X) + ([Z,X], Y )

= −([X, Y ], Z) − ([Y, Z], X) + ([Z, X], Y )

= −([Z, X], Y ) + ([Y, X], Z) + ([Z, X], Y ) = ([Y, X], Z)

所以我们证明了:

∇Y X =1

2[Y, X]

由(5)知我们证明了单参数子群是过单位元的测地线,从而证明了通过两种方式定义

出的指数映射是一样的。

4 结语

关于两指数映射定义等价性问题首先由杜升华1学长在讨论班上提出,讨论班成员对

此有过许多讨论,其中证法1由笔者提供2,证法2由杜升华学长提供。通过从不同方面考

察同一问题,大家相互讨论,获益颇多,在此感谢微分流形讨论班的每一位成员。在学习

中我们经常遇到这种情况:不同的数学分支通过不同的方式引入一些相互关联的概念。搞

1现于ETH Zurich跟随著名数学家Demetrios Christodoulou教授读博士2在本文审稿过程中,杜升华学长指出Spivak在 A comprehensive introduction to differential geometry 一

书第一卷401页命题21中给出了与证法1相同的证明,但仍鼓励笔者把证明整理出来,按他的话说:《荷思》

毕竟不是刊登数学前沿论文的正式数学期刊,它鼓励原创性的探索,只要是自己的思考成果,哪怕跟前人的

结果相重复,写出来也是有意义的。笔者作为现任编委成员,同样认为《荷思》的意义在于鼓励自主思考,

活跃学术气氛,所以决定把证明写出来。

23

清楚这些关联将大大增进我们对这些概念以及这两个分支的理解,并且,当弄清这些关联

后,我们可以将一个分支的方法与结果移植到另一分支中,从而能够获得新的观点,新的

结果。总之数学是一个整体,我们应当着力于培养对其整体的洞察力。

参考文献

[1] Peter Petersen, Riemannian Geometry. 北京: 科学出版社, 2007.

[2] W.Y.Hsiang, Lectures on Lie Groups. Singapore ; [River Edge, N.J.] : World Scien-

tific, c2000.

[3] 伍鸿熙,沉纯理,虞言林, 黎曼几何初步. 北京: 北京大学出版社, 1989.10.

[4] 陈省身,陈维桓, 微分几何讲义. 北京: 北京大学出版社, 2001.

[5] Frank W.Warner, Foundations of differentiable manifolds and Lie groups.北京: 世界

图书出版公司, 2004.

数学趣闻

20世纪50年代,陈省身在Chicago大学教微分几何,课程中广泛使用了微分形式的语

言。当时微分形式还不时髦。有一次一个学生去问Weil,说他不懂这些微分形式,Weil走

到黑板前写了一个希腊字母ω。

24

Rn中凸集是Lebesgue可测集

潘锦钊∗ 王若凡† 朱艺航‡

1 问题及其提出

我们在代数数论的书中介绍Minkowski理论的部分看到:

“若Rn中的凸集A其Lebesgue测度V (A)……”

看到这里我们不由得产生一个问题:是否Rn中的凸集一定是可测集?本文章将整理

我们讨论的结果,给出一个肯定的回答,并且给出几种不同的证明。先给出我们的主定

理:

定理1 Rn中凸集A是Lebesgue可测集,而且其边界∂A是Lebesgue零测集。

我们说明只需要对A是有界集时证明此命题就够了(证明中出现的一些符号我们将在

后面给出定义):

J 假设命题对有界凸集成立。如果A是Rn中任意一个凸集,则设Ak = A ∩ B(0, k),

其中B(0, k)是Rn中以原点为中心,k为半径的开球。则Ak是Rn中有界凸集,因此Ak是可

测集,A =∪∞

k=1 Ak是可数个可测集之并,还是可测集。

设x ∈ ∂A,则x的任意邻域都既包含A中的点,也包含不在A中的点。存在一个k使

得x包含在开集B(0, k)中,因此取x的任意包含在B(0, k)中的邻域,得到x ∈ ∂Ak。因

此∂A ⊂ ∪∞k=1 ∂Ak,包含在可数个零测集之并中,因此也是零测集。 I

接下来我们将回忆一些基础知识,然后给出定理在有界集时候的几种不同证明。

∗基数83†基数83‡基数82

25

2 预备知识

我们先给出一些基本的概念和一些符号约定。

Rn中的开球B(x, r)指的是集合{y = (y1, · · · , yn) ∈ Rn|∑ni=1(yi − xi)

2 < r2},其中x = (x1, · · · , xn)是Rn中给定的点,r > 0是给定的正数。Rn中的子集O称为开集,如果

对于任意x ∈ O都存在ε > 0使得B(x, ε) ⊂ O。注意空集∅也是开集。容易证明任意个开集的并集,以及有限个开集的交集还是开集,两个开集的笛卡儿积也是开集。Rn中的子

集F称为闭集,如果它的补集是开集。同样,任意个闭集的交集,以及有限个闭集的并集

还是闭集,两个闭集的笛卡儿积也是闭集。

集合A的闭包A指的是集合{x|∀ε > 0, B(x, ε)∩A = ∅}。容易证明A是闭集,而且A是

闭集当且仅当A = A。集合A的内部(或称为开核)A◦指的是集合{x|∃ε > 0使得B(x, ε) ⊂A}。容易证明A◦是开集,而且A是开集当且仅当A = A◦。另外我们有Rn \ A = (Rn \A)◦,

以及Rn \ A◦ = (Rn \ A)。还可以证明若A ⊂ B,则A ⊂ B, A◦ ⊂ B◦;以及(A ∪ B) = A ∪B, (A∩B)◦ = A◦∩B◦。集合A的外部指的是(Rn\A)◦,边界∂A指的是Rn\[A◦∪(Rn\A)◦],

容易证明这也等于A \ A◦。容易证明∂(A ∪ B) ⊂ ∂A ∪ ∂B, ∂(A ∩ B) ⊂ ∂A ∪ ∂B。

下面是简单的实分析介绍。回忆Rn中Lebesgue外测度的定义以及一些性质:

定义2 ([1], p. 34) Rn中子集A的Lebesgue外测度m∗(A)定义为

m∗(A) = inf{Ik}∞

k=1:A⊂∪∞k=1 Ik

∞∑

k=1

l(Ik)

其中Ik是Rn中的开区间:Ik = {(x1, · · · , xn)|aik < xi < bik, i = 1, · · · , n}。l(Ik)是开区间

的体积:l(Ik) =∏n

i=1 (bik − aik)。

命题3 ([1], p. 35) Rn中Lebesgue外测度满足以下性质:

1. (单调性) 若A ⊂ B ⊂ Rn,则m∗(A) 6 m∗(B)。

2. (可数次加性) m∗(∪∞

k=1 Ak) 6∑∞

k=1 m∗(Ak)。

回忆Rn中Lebesgue可测集的定义:

定义4 ([1], p. 35) 我们说Rn中一个子集A是Lebesgue可测集,若对任意Rn中一个子

集E,都有m∗(E) = m∗(E∩A)+m∗(E\A)。这时我们记m(A) := m∗(A)为A的Lebesgue测

度。

容易知道Rn中的零测集、开集和闭集都是Lebesgue可测集;可数个可测集的并集和

交集,以及可测集的补集都是可测集([1], pp. 36–37)。两个可测集的笛卡儿积也是可测

集,而且其Lebesgue测度等于原有两个集合测度的乘积。我们还有Rn中Lebesgue可测集

的几个等价定义:

26

命题5 ([1], p. 39) 若E ⊂ Rn,则下列命题等价:

1. E是Lebesgue可测集。

2. 对任意ε > 0,存在开集O ⊃ E使得m∗(O \ E) < ε。

3. 对任意ε > 0,存在闭集F ⊂ E使得m∗(E \ F ) < ε。

4. 对任意ε > 0,存在开集O ⊃ E,闭集F ⊂ E使得m(O \ F ) < ε。

5. 存在G属于Gδ(即可数个开集的交集)满足G ⊃ E, m∗(G \ E) = 0。

6. 存在F属于Fσ(即可数个闭集的并集)满足F ⊂ E, m∗(E \ F ) = 0。

7. 对任意ε > 0,存在可测集Q ⊃ E使得m∗(Q \ E) < ε。

8. 对任意ε > 0,存在可测集P ⊂ E使得m∗(E \ P ) < ε。

9. 对任意ε > 0,存在可测集P,Q ⊂ Rn使得P ⊂ E ⊂ Q,而且m(Q \ P ) < ε。

在下面几种证法中,我们都将利用等价定义9来证明我们的主定理。我们指

出Lebesgue测度的一些性质:

命题6 Lebesgue测度有如下性质:

1. (可数可加性, [1], p. 38) 设{Ak}∞k=1是可测集序列,则m(

∪∞k=1 Ak) 6

∑∞k=1 m(Ak),

若{Ak}两两不交,则等号成立。

2. (容斥原理) 设{Ak}nk=1是有限个有限测度的可测集,则

m(

n∪

k=1

Ak) =

n∑

k=1

m(Ak) −∑

16k1<k26n

m(Ak1 ∩ Ak2) + · · ·

+ (−1)l−1∑

16k1<···<kl6n

m(Ak1 ∩ · · · ∩ Akl) + · · ·

+ (−1)n−1m(A1 ∩ · · · ∩ An).

3 有界凸集可测的证法1

我们对空间维数n用数学归纳法。

当n = 1的时候,R中的有界凸集只能是有限区间,是Lebesgue可测集,而且其边界

为区间的两个端点,是零测集,命题成立。

27

下面设命题对n − 1成立。设A是Rn中有界凸集。

我们先断定一个结论:线性映射保凸集。设E是凸集,f是一个线性映射,把E映

成F。则对任意x, y ∈ F,存在x0, y0 ∈ E使得f(x0) = x, f(y0) = y,因此∀λ ∈ [0, 1], λx0 +

(1 − λ)y0 ∈ E,因此λx + (1 − λ)y = f(λx0 + (1 − λ)y0) ∈ F,因此F是凸集。特别地,

若E是Rn中的凸集,则E到Rn−1中的任意投影F是Rn−1中的凸集,因为投影映射是线性

映射。

我们定义如下集合:

Au,v := {(x1, · · · , xn) ∈ A|u 6 xn 6 v} ⊂ Rn

Bu,v := {(x1, · · · , xn−1)|∃x ∈ [u, v]使(x1, · · · , xn−1, x) ∈ A} ⊂ Rn−1

Au := Au,u

Bu := Bu,u

我们断言这些集合都是凸集。显然Au,v是两个凸集的交,因此是凸集。而Bu,v是Au,v

到Rn−1中的投影,因此由前面知道这也是凸集。

对任意δ > 0,我们定义如下集合:

P :=∪

k∈Z

(Bkδ ∩ B(k+1)δ) × [kδ, (k + 1)δ]

Q :=∪

k∈Z

Bkδ,(k+1)δ × [kδ, (k + 1)δ]

则两者都是可测集。因为由前面知Bkδ, B(k+1)δ, Bkδ,(k+1)δ都是Rn−1中的凸集,因

此Bkδ ∩ B(k+1)δ也是凸集。根据归纳假设,这些集合都是Rn−1中的可测集,而且边界是零

测集。因此在P,Q的表达式中可数并(实际上是有限并,因为A是有界集,因此当δ固定时,

这些集合当中只有有限个非空)当中每一项都是Rn−1中的可测集与R中闭区间的笛卡儿积,是Rn中的可测集。因此P, Q都是可数个可测集之并,为可测集。

而且我们有P ⊂ A ⊂ Q成立。设(x1, · · · , xn−1, x) ∈ A,且k使得x ∈ [kδ, (k + 1)δ]。则

根据Bkδ,(k+1)δ的定义,(x1, · · · , xn−1) ∈ Bkδ,(k+1)δ,因此(x1, · · · , xn−1, x) ∈ Bkδ,(k+1)δ ×[kδ, (k+1)δ] ⊂ Q成立。因此A ⊂ Q成立。假设P不包含在A中,则存在点(x1, · · · , xn−1, x) ∈P \ A。设k使得x ∈ [kδ, (k + 1)δ]。显然x = kδ或(k + 1)δ,否则由该点在P中得到其

在A中,与假设矛盾。因此有(x1, · · · , xn−1, x) ∈ (Bkδ ∩ B(k+1)δ) × [kδ, (k + 1)δ]成立,因

此(x1, · · · , xn−1) ∈ Bkδ ∩ B(k+1)δ,(x1, · · · , xn−1, kδ) ∈ Akδ ⊂ A,(x1, · · · , xn−1, (k +

1)δ) ∈ A(k+1)δ ⊂ A成立。但是kδ < x < (k + 1)δ,这与A是凸集矛盾。因此P ⊂ A成立。

记Ck = Bkδ,(k+1)δ\(Bkδ∩B(k+1)δ)。则其为可测集。考虑B := {(x1, · · · , xn−1)|(x1, · · · ,

xn−1, xn) ∈ A} = B−∞,+∞中的任意元素x在集族{Ck}k∈Z中的多少个集合中出现过。我们

断言x至多在集族中的2个集合中出现过。

28

若x = (x1, · · · , xn−1)至少在3个集合中出现过,即存在k < l < m使得x ∈ Ck, x ∈Cl, x ∈ Cm,则x ∈ Bkδ,(k+1)δ,即存在u ∈ [kδ, (k + 1)δ]使得(x1, · · · , xn−1, u) ∈ A。同理

存在w ∈ [mδ, (m + 1)δ]使得(x1, · · · , xn−1, w) ∈ A。又x /∈ Blδ ∩ B(l+1)δ,即x /∈ Bv,其

中v = lδ或者(l + 1)δ,故(x1, · · · , xn−1, v) /∈ A。但是u 6 v 6 w,这与A是凸集矛盾。因

此x至多在2个集合中出现过。也就是说,集族{Ck}k∈Z中任意三个不同集合的交集为空

集。

考虑∑

k∈Z m(Ck)。这些集合实际上只有有限个非空,因为A是有界集。又由于任

意三个不同集合的交集为空,因此根据容斥原理,有m(∪

k∈Z Ck) =∑

k∈Z m(Ck) −∑

k<l m(Ck ∩ Cl)。由于∀k ∈ Z, Ck ⊂ Bkδ,(k+1)δ ⊂ B,因此m(∪

k∈Z Ck) 6 m(B)。由

于{Ck}k∈Z中三个不同集合的交集为空,因此若{k1, l1} = {k2, l2},则(Ck1 ∩ Cl1) ∩ (Ck2 ∩Cl2) = ∅。因此

∑k<l m(Ck ∩ Cl) = m(

∪k<l Ck ∩ Cl) 6 m(B)。因此

∑k∈Z m(Ck) 6

m(B) + m(B) = 2m(B)。

我们来计算m(Q\P )。有Q\P ⊂ ∪k∈Z Ck × [kδ, (k + 1)δ],因此m(Q\P ) 6∑

k∈Z m(Ck×[kδ, (k + 1)δ]) = δ

∑k∈Z m(Ck) 6 2δm(B)。由于A是有界集,因此m(B)是一个固定的有

限数。由δ的任意性,我们得到A是可测集。

为了证明A的边界是零测集,我们考虑P ◦和Q。我们有

Q \ Q ⊂∪

k∈Z

∂Bkδ,(k+1)δ × [kδ, (k + 1)δ]

根据归纳假设,∂Bkδ,(k+1)δ是Rn−1中的零测集,因此可数并中的每一项都是Rn中的零测

集,因此Q \ Q也是零测集,m(Q) = m(Q)。

我们有

P \ P ◦ ⊂(∪

k∈Z

∂(Bkδ ∩ B(k+1)δ) × [kδ, (k + 1)δ]

)∪(∪

k∈Z

Akδ

)

同样根据归纳假设,∂(Bkδ ∩ B(k+1)δ)是Rn−1中的零测集,因此两个可数并中的每一项都

是Rn中的零测集。因此P \ P ◦也是零测集,m(Q◦) = m(Q)。

我们证明∂A ⊂ Q \ P ◦。只需证明Rn \ Q和P ◦均不包含A的边界点。事实上,两者都

是开集,而且不包含A中的点,所以其中任意点都有一个邻域与A的交集为空。

我们有m(Q \ P ◦) = m(Q) − m(P ◦) = m(Q) − m(P ) = m(Q \ P ),因此当δ → 0时,

m(Q \ P ◦) = m(Q \ P ) → 0,因此∂A可以包含在任意小的可测集中。因此得到∂A是零测

集。因此当A为有界凸集时命题成立,得证。

4 有界凸集可测的证法2

这个方法,连同下一个方法的基本思路是王若凡同学提出来的。

29

我们先考虑凸集A是否有内点。如果A中存在n+1个点x0, x1, · · · , xn没有处在一个n−1维的超平面内部,那么它们的凸包是一个n维的单形,其必定有内点,例如 1

n+1(x0+ · · ·+xn)。而A包含这个凸包,因此A有内点。换句话说,如果A没有内点,则A中任意n + 1个

点都共面(n − 1维超平面),我们得到整个A也落在一个n − 1维的超平面内部。而n − 1维

的超平面是Rn中的零测集,而且是闭集,因此A及其边界∂A都落在超平面内部,是Rn中

的零测集。这时命题成立。下面考虑A存在内点的情况。

不妨设0是A的内点。设Sn−1 = {(x1, · · · , xn)|∑ni=1 x2

i = 1}是Rn中的n − 1维单位

球面。对任意x ∈ Sn−1,设f(x) = sup{t > 0|tx ∈ A}。由于A有界,设A ⊂ B(0,M),

则f(x) 6 M。又由于0是A的内点,设B(0, δ) ⊂ A,则f(x) > δ。因此这定义了一个映

射f : Sn−1 → R。考虑集合A ∩ {tx|t > 0},此为两个凸集的交集,仍然是凸集,它又能看成是R>0的子集,只能是区间[0, f(x)]或者[0, f(x)[。因此我们有

P := {tx|x ∈ Sn−1, 0 6 t < f(x)} ⊂ A ⊂ {tx|x ∈ Sn−1, 0 6 t 6 f(x)} =: Q.

我们希望证明f是一个连续函数。设x, y ∈ Sn−1充分接近(事实上只需要0 < x ·y < 1),

考虑f(y)与f(x)有何种关系。设z = y−(x·y)x|y−(x·y)x|,则|z| = 1且x · z = 0。设0 < a < δ, 0 < t <

f(x),以及b ∈ R使得az, by, tx共线。我们先求出b的值。将这三个点看成span{x, y}中的元素,由三点共线得 ∣∣∣∣∣∣∣∣

− a(x·y)|y−(x·y)x|

a|y−(x·y)x| 1

0 b 1

t 0 1

∣∣∣∣∣∣∣∣= 0

解得

b =at

a(x · y) + t|y − (x · y)x| =

(1

t(x · y) +

1

a|y − (x · y)x|

)−1

> 0

我们验证

(by − az) · (by − tx) = b2(y · y) − bt(x · y) − ab(y · z) + at(x · z)

= b2 − bt(x · y) − ab1 − (x · y)2

|y − (x · y)x|

= b

(at

a(x · y) + t|y − (x · y)x| − t(x · y) − a1 − (x · y)2

|y − (x · y)x|

)

= b(x · y)−a2(1 − (x · y)2) − t2|y − (x · y)x|2

|y − (x · y)x|(a(x · y) + t|y − (x · y)x|

) < 0

30

因此by在az和tx之间,又因为az, tx ∈ A,所以by ∈ A,因此f(y) > b。因此

f(y) > sup0<a<δ,0<t<f(x)

(1

t(x · y) +

1

a|y − (x · y)x|

)−1

=δf(x)

δ(x · y) + f(x)|y − (x · y)x|

> δf(x)

δ(x · y) + f(x)|y − x|

最后一个不等式是因为|y−(x·y)x| 6 |y−x|,这又是因为两边平方得1−2(x·y)2+(x·y)2 62 − 2(x · y)2,化简得(x · y)2 6 1成立。因此

f(y) − f(x) > δf(x)

δ(x · y) + f(x)|y − x| − f(x) = f(x)

δ(x · y) + f(x)|y − x| − 1

)

> f(x)

δ + f(x)|y − x| − 1

)= − f(x)2|y − x|

δ + f(x)|y − x| > −M2

δ|y − x|

调换x, y我们就得到|f(y) − f(x)| 6 M2

δ |y − x|,当x · y > 0时成立。因此f是一个连续函

数(甚至是Lipschitz的)。

我们断言P是开集,Q是闭集,而且Q \ P是零测集。因此A是可测集,以及∂A ⊂Q \ P是零测集。

先看P。设x ∈ Sn−1, 0 6 t < f(x)。若0 6 t < δ,则由于∀y ∈ Sn−1, f(y) > δ,

因此B(tx, δ − t) ⊂ P,因此tx是P的内点。若δ 6 t < f(x),则我们考虑开球B(tx, ε)。

设y ∈ Sn−1, a > 0使得ay ∈ B(tx, ε),即|tx − ay| < ε。我们有

t − ε < |tx| − |ay − tx| 6 a = |tx + (ay − tx)| 6 |tx| + |ay − tx| < t + ε

因此|t − a| < ε。因此

ε > |tx − ay| = |(tx − ty) + (ty − ay)| > t|x − y| − |t − a| > t|x − y| − ε

因此|x − y| < 1t · 2ε,因此|f(y) − f(x)| 6 M2

δ · 1t · 2ε 6 M2

δ2 · 2ε(当x · y > 0时成立)。如果

我们取ε = min{δ, (f(x) − t)/(M2

δ2 · 2 + 1)},则有x · y > 0,而且

a < t + ε 6 f(x) − M2

δ2· 2ε 6 f(x) − |f(y) − f(x)| 6 f(y)

因此我们得到B(tx, ε) ⊂ P,tx是内点。综上所述,P是开集。

我们再看Q。考虑Rn \ Q = {tx|x ∈ Sn−1, t > f(x)},我们要证明这是个开集。设x ∈Sn−1, t > f(x)。与前面类似,取ε = min{δ, (t−f(x))/(M2

δ2 ·2+1)},则B(tx, ε) ⊂ Rn\Q成

立。于是Rn \ Q是开集,Q是闭集。

31

我们再看Q \ P = {f(x)x|x ∈ Sn−1}。我们注意到对任意x = (x1, · · · , xn) ∈ Sn−1都

有至少一种方法写为极坐标表示:

x1 = cos θ1,

x2 = sin θ1 cos θ2,

· · · · · · · · · · · ·xn−1 = sin θ1 sin θ2 · · · sin θn−2 cos θn−1,

xn = sin θ1 sin θ2 · · · sin θn−2 sin θn−1

其中θ1 ∈ [0, π], · · · , θn−2 ∈ [0, π], θn−1 ∈ [0, 2π]。因此这定义了一个连续的映满的映

射σ : [0, π]n−2 × [0, 2π] → Sn−1。对于N为充分大正整数,我们考虑这样的点集

X = {σ(i1π

N, · · · , in−1

π

N)|0 6 i1, · · · , in−2 6 N, 0 6 in−1 6 2N − 1} ⊂ Sn−1,

共有不超过(N + 1)n−2 · 2N 6 (2N)n−1个点。对任意x = (x1, · · · , xn) = σ(θ1, · · · , θn−1) ∈Sn−1,我们考虑i1, · · · , in−1 ∈ Z使得

|θk − ikπ

N| 6 π

2N, ∀k = 1, · · · , n − 1,

记θk = ikπN , x = σ(θ1, · · · , θn−1) ∈ X,考虑|x − x|。我们有

|x1 − x1| = | cos θ1 − cos θ1| 6 π

2N,

|x2 − x2| = | sin θ1 cos θ2 − sin θ1 cos θ2|6 | sin θ1 cos θ2 − sin θ1 cos θ2| + | sin θ1 cos θ2 − sin θ1 cos θ2|6 | sin θ1|

π

2N+ | cos θ2|

π

2N6 2 · π

2N,

|x3 − x3| 6 3 · π

2N,

· · · · · · · · · · · ·|xn−1 − xn−1| 6 (n − 1) · π

2N,

|xn − xn| 6 (n − 1) · π

2N.

因此

|x − x| =

√√√√n∑

k=1

|x1 − x1|2 6 π

2N

√12 + 22 + 32 + · · · + (n − 1)2 + (n − 1)2

2N

√1

6(n − 1)[3n2 − (n − 2)(n − 3)] 6 π

2N

√1

6n · 3n2 =

π

2N

√n3

2.

32

因此

|f(x)x − f(x)x| 6 |f(x)x − f(x)x| + |f(x)x − f(x)x| = f(x)|x − x| + |f(x) − f(x)|

6 M |x − x| +M2

δ|x − x| 6

(M +

M2

δ

2N

√n3

2=: ε.

因此我们考虑这样的开区间族{∏nk=1]xk − ε, xk + ε[|x = (x1, · · · , xn) ∈ X},则它们每个

的体积都是(2ε)n,而且它们覆盖Q \ P。因此

m(Q \ P ) 6 (2N)n−1 · (2ε)n = (2N)n−1 ·[(

M +M2

δ

N

√n3

2

]n

= 2n/2−1n3n/2

(M +

M2

δ

)nπn

N

于是当N → +∞时我们得到m(Q \ P ) = 0,因此Q \ P是零测集。至此我们证明了全部的

断言,于是命题成立。

5 有界凸集可测的证法3

这个方法本质上来说与上一个方法类似,不过我们不考虑Sn−1上的函数,转而考

虑Rn−1上的函数。

我们对维数n归纳。n = 1时命题已经成立。下面我们设n > 1。由A是有界集,我

们可以设M > 0使得A ⊂ [−M, M ]n。我们记B := {(x1, · · · , xn−1)|(x1, · · · , xn−1, xn) ∈A}与证法1中的符号一样。有B是Rn−1中的有界凸集(B ⊂ [−M, M ]n−1),因此由归纳

假设,B是可测集,边界∂B是零测集。对任意x = (x1, · · · , xn−1) ∈ B,我们考虑集

合A∩({x}×R),此为两个凸集的交集,仍然是凸集,而且可以看成R的子集,因此它一定是区间。于是我们设f(x) = sup{xn|(x1, · · · , xn) ∈ A},g(x) = inf{xn|(x1, · · · , xn) ∈ A},则f, g是B到R的有界函数(事实上|f(x)|, |g(x)| 6 M)。

我们验证g和−f是凸函数,即若x, y ∈ B, λ ∈ [0, 1],则有

g[λx + (1 − λ)y] 6 λg(x) + (1 − λ)g(y),

f [λx + (1 − λ)y] > λf(x) + (1 − λ)f(y).

设x = (x1, · · · , xn−1), y = (y1, · · · , yn−1),根据g的定义,∀ε > 0,存在xn和yn满足g(x) 6xn < g(x) + ε, g(y) 6 yn < g(y) + ε,使得x = (x1, · · · , xn) ∈ A, y = (y1, · · · , yn) ∈ A。因

此λx + (1 − λ)y ∈ A,于是g[λx + (1 − λ)y] 6 λxn + (1 − λ)yn < λg(x) + (1 − λ)g(y) + ε。

由ε的任意性,我们得到g[λx + (1 − λ)y] 6 λg(x) + (1 − λ)g(y)成立。同理,关于f不等式

也成立。

33

我们说明若x是B的内点,即若x ∈ B◦,则f, g在x处连续。先看g。我们设B(x, ε) ⊂B,以及y ∈ B使得0 < |y − x| < ε

2。设y = x + ε2

y−x|y−x|,则我们有y = λx + (1 − λ)y,其

中λ = 1 − 2|y−x|ε 。于是

g(y) 6 λg(x) + (1 − λ)g(y) = g(x) + (1 − λ)[g(y) − g(x)]

= g(x) +2|y − x|

ε[g(y) − g(x)] 6 g(x) +

4|y − x|ε

M.

我们又设y = x − ε2

y−x|y−x|,则我们有x = µy + (1 − µ)y,其中µ =

(1 + 2|y−x|

ε

)−1。于

是g(x) 6 µg(y) + (1 − µ)g(y),于是

g(y) > g(x) − (1 − µ)g(y)

µ= g(x) − 1 − µ

µ[g(y) − g(x)]

= g(x) − 2|y − x|ε

[g(y) − g(x)] > g(x) − 4|y − x|ε

M.

于是|g(y) − g(x)| 6 4|y−x|ε M,当0 < |y − x| < ε

2时成立。于是g在x处连续。同理f在x处也

连续。

设A0 = (∂B × R)∩A,A1 = (B◦ × R)∩A,则有A = A0 ∪A1。这是因为A ⊂ B × R ⊂B × R = (∂B × R) ∪ (B◦ × R)。根据归纳假设,∂B是Rn−1的零测集。因此A0是Rn的零测

集。我们有P = P1 ∩ P2 ⊂ A1 ⊂ Q,其中

P = {(x1, · · · , xn)|x = (x1, · · · , xn−1) ∈ B◦, g(x) < xn < f(x)},

P1 = {(x1, · · · , xn)|x = (x1, · · · , xn−1) ∈ B◦, xn > g(x)},

P2 = {(x1, · · · , xn)|x = (x1, · · · , xn−1) ∈ B◦, xn < f(x)},

Q = {(x1, · · · , xn)|x = (x1, · · · , xn−1) ∈ B◦, g(x) 6 xn 6 f(x)}.

我们要说明P, Q都是可测集,而且Q \ P是零测集。这样我们就能得到A1是可测集,因

此A是可测集。先看P1和P2。设(x1, · · · , xn) ∈ P1,则x = (x1, · · · , xn−1) ∈ B◦而且xn >

g(x)。由前面g在x连续,因此存在ε > 0使得当y ∈ B(x, ε) ⊂ B◦时,|g(y) − g(x)| <12(xn − g(x))成立。于是我们取δ = min{ε, 1

2(xn − g(x))},则有B((x1, · · · , xn), δ

)⊂ P1成

立。于是P1是开集,同理P2也是,于是P是开集,是可测集。我们有Q是这样的可数多个

开集的交集:

Q =∞∩

k=1

{(x1, · · · , xn)|x = (x1, · · · , xn−1) ∈ B◦, g(x) − 1

k< xn < f(x) +

1

k}

于是Q是Gδ型集,是可测集。

34

为了证明Q \ P = {(x1, · · · , xn)|x = (x1, · · · , xn−1) ∈ B◦, xn = f(x)或g(x)}是零测集,注意到这是f |B◦和g|B◦的图像的并集,因此只要证这两个集合都是零测集。我

们先看f |B◦的图像。由于B◦可测(是开集),我们用前面的等价定义,∀ε > 0存在闭

集F ⊂ B◦使得m(B◦ \ F ) < ε。于是(B◦ \ F ) × [−M, M ]盖住f |B◦\F的图像,且其测度

小于2Mε。为了找到盖住f |F的图像的集合,我们注意到F是有界的,因此是紧集,因

此f |F一致连续,故存在δ > 0使得当x, y ∈ F, |x − y| < δ时,|f(x) − f(y)| < ε。我

们取正整数N使得MN < δ√

n−1,把[−M, M ]n−1平均分成(2N)n−1个边长为M

N的方形闭

区间。对任意x, y落在同一个区间I内,有|x − y| 6√

n − 1MN <

√n − 1 δ√

n−1= δ,因此

有|f(x)−f(y)| < ε。我们这样选取Rn的区间:若I ∩F = ∅则不选取,否则任取x ∈ I ∩F,

我们取I × [f(x) − ε, f(x) + ε]。这样选取的闭区间覆盖住了f |F的图像,而且它们之并的测度不大于(2N)n−1

(MN

)n−1 · 2ε = 2nMn−1ε。因此我们得到f |B◦的图像的测度不大

于(2M + 2nMn−1)ε,由ε的任意性,f |B◦的图像是零测集。同理g|B◦的图像也是零测集,

因此Q \ P是零测集。

我们现在看∂A。有∂A ⊂ ∂A0 ∪ ∂A1,而∂A0 ⊂ A0 ⊂ ∂B × R,最后这是零测集。有P = P ◦ ⊂ A◦

1,又A1 ⊂ Q ∪ (∂B × R),右边这个集合是个闭集(事实上这个集合的

余集是3个不交开集的并集),故A1 ⊂ Q ∪ (∂B × R),故∂A1 ⊂ [Q ∪ (∂B × R)] \ P ⊂(Q \ P ) ∪ (∂B × R),这也是零测集。因此∂A是零测集。综上所述,命题成立。

参考文献

[1] H. L. Royden, 叶培新译, 实分析(原书第三版). 北京:机械工业出版社,2006。

35

从1 + 2 + · · · + 100 = 5050谈起: 第三部分

周坚∗

引言

在本文第一部分第6小节提到的华罗庚的方法, 实际上更早的作者有更一般的处理

方法(例如参看[4])。由于华先生的小书[1]是为中学生写的科普读物,主要做中学生能

接受的介绍,所以内容不很全面。实际上这里会涉及到Stirling数这种重要的组合数,

而且与《荷思》第一期上刘立达的文章“∑∞

n=1nk

n!是e的整数倍” 和《荷思》第二期上

王力的文章“∑∞

n=1nk

n!是e的整数倍的新证明”有关,特此做简要介绍。

1. Stirling数与幂和公式. 考虑多项式空间R[u]两组不同的基: {1, u, . . . , un, . . . }

和{1, u,(u2

), . . . ,

(uk

), . . . }, 其中

(uk

)= u(u − 1) · · · (u − k + 1)/k!. 则存在整数

[n

k

](称为第

一类Stirling数)与

{n

k

}(称为第二类Stirling数), 使得:

n! ·(

u

n

)=

n∑

k=0

(−1)n−k

[n

k

]· uk, (1)

un =n∑

k=0

{n

k

}· k! ·

(u

k

). (2)

这两类Stirling数有有趣的组合意义[5, 2]:

[n

k

]是一个n个元素的集合恰有k个轨道的所有

置换的个数,

{n

k

}是将一个n个元素的集合分为k个不相交的子集的分法的个数。

可以如下得到幂和公式。在(2)中分别令u = 0, 1, . . . , N − 1后求和:

N−1∑

j=0

jn =n∑

k=0

{n

k

}· k! ·

N−1∑

j=0

(j

k

)=

n∑

k=0

{n

k

}· k!

(N

k + 1

). (3)

∗清华大学数学系基础数学研究所教授

36

可以再用(1)改写等式右边:

N−1∑

j=0

jn =n∑

k=0

1

k + 1

{n

k

k+1∑

l=0

(−1)k+1−l

[k + 1

l

]· N l. (4)

2. Stirling数与Bernoulli数的关系. 已知等式(3)和(4)左边等于:

1

n + 1

n∑

j=0

(n + 1

j

)Bj · Nn+1−j , (5)

所以从(3)有:

1

n + 1

n∑

j=0

(n + 1

j

)Bj · un+1−j =

n∑

k=0

{n

k

}· k!

(u

k + 1

). (6)

比较等式两边在基{(

uk+1

)}下的系数后得:

{n

k

}=

k + 1

n + 1

n−k∑

j=0

(n + 1

j

)Bj ·

{n + 1 − j

k + 1

}; (7)

比较un+1−j的系数得:

Bj =n + 1(n+1

j

) ·n∑

k=n−j

(−1)n−k+j

k + 1

[k + 1

n + 1 − j

]·{

n

k

}. (8)

在等式(1)中分别取u = 0, 1, . . . , N − 1后求和得:

n! ·N−1∑

j=0

(j

n

)=

n∑

k=0

(−1)n−k

[n

k

]N−1∑

j=0

jk. (9)

等式左边改写为n!(

Nn+1

), 所以:

n! ·(

N

n + 1

)=

n∑

k=0

(−1)n−k

k + 1

[n

k

]k∑

j=0

(k + 1

j

)BjN

k+1−j . (10)

比较等式两边Nm (m ≥ 1)的系数后得到:

[n + 1

m

]= (n + 1) ·

n∑

k=m−1

(−1)m−1−k

k + 1

[n

k

] (k + 1

m

)Bk+1−m. (11)

37

3. Stirling数的递归关系. 从(1)和(2)容易推导Stirling数的递归关系。在(1)中将n改

为n + 1得:

(n + 1)! ·(

u

n + 1

)=

n+1∑

k=0

(−1)n+1−k

[n + 1

k

]· uk.

等式左边可如下改写:

(n + 1)! ·(

u

n + 1

)= (u − n) · n! ·

(u

n

)

= (u − n) ·n∑

k=0

(−1)n−k

[n

k

]· uk

=n+1∑

k=0

(−1)n+1−k

([n

k − 1

]+ n ·

[n

k

])· uk.

比较uk的系数后得: [n + 1

k

]= n ·

[n

k

]+

[n

k − 1

]. (12)

同理可得: {n + 1

k

}=

{n

k − 1

}+ k ·

{n

k

}. (13)

从(1)和(2)显然有

{n

n

}=

[n

n

]= 1,

[0

0

]=

{0

0

}= 1, (14)

{n

0

}=

[n

0

]= 0, n ≥ 1. (15)

它们提供了递归的初始值。

下面是

[n

k

]的一个取值表:

38

k = 0 k = 1 k = 2 k = 3 k = 4[0

k

]1

[1

k

]0 1

[2

k

]0 1 1

[3

k

]0 2 3 1

[4

k

]0 6 11 6 1

[5

k

]0 24 50 35 10

下面是

{n

k

}的一个取值表:

k = 0 k = 1 k = 2 k = 3 k = 4{0

k

}1

{1

k

}0 1

{2

k

}0 1 1

{3

k

}0 1 3 1

{4

k

}0 1 7 6 1

{5

k

}0 1 15 25 10

上面的两个表是两个无穷阶下三角矩阵的部分。由(1) and (2)我们有

n! ·(

u

n

)=

n∑

k=0

(−1)n−k

[n

k

k∑

l=0

{k

l

}· l! ·

(u

l

). (16)

所以,n∑

k=0

(−1)n−k

[n

k

]·{

k

l

}= δn,l. (17)

即无穷矩阵

((−1)n−k

[n

k

])∞

n,k=0

({k

l

})∞

k,l=0

互逆。

39

从以上递归关系可以证明,给定k以后,n 7→[

n

n − k

]和n 7→

{n + k

n

}都是n的多项式

函数[3],例如,

[n

n − 1

]=

(n

2

),

[n

n − 2

]= 2

(n

3

)+ 3

(n

4

),

[n

n − 3

]= 6

(n

4

)+ 20

(n

5

)+ 15

(n

6

).

{n + 1

n

}=

(n + 1

2

),

{n + 2

n

}=

(n + 2

3

)+ 3

(n + 2

4

),

{n + 3

n

}=

(n + 3

4

)+ 10

(n + 3

5

)+ 15

(n + 3

6

).

这些等式右边的系数是所谓二阶的Stirling数[2].

4. Stirling数的生成函数. 将(1)中的u换为−u并在等式两边同乘以(−1)n:

n∑

k=0

[n

k

]uk = u(u + 1) · · · (u + n − 1) = (u)n. (18)

等式两边同乘以tn/n!后对n求和得:

k≥0

n≥k

[n

k

]uk tn

n!=

∞∑

n=0

(u)n

n!tn = (1 − t)−u. (19)

将等式右边展为u的级数, 得到对给定的k ≥ 0,

n≥k

[n

k

]tn

n!=

(−1)k

k!· logk(1 − t). (20)

回忆第n阶差分算子定义为:

∆nuf(u) =

n∑

k=0

(−1)n−k

(n

k

)f(u + k), (21)

40

对等式(2)两边应用算子∆ku后取u = 0:

k! ·{

n

k

}= ∆k

uun|u=0 =

k∑

j=0

(−1)k−j

(k

j

)jn. (22)

两边同乘 tn

n!后对n求和:

∞∑

n=k

{n

k

}tn

n!=

1

k!

k∑

j=0

(−1)k−j

(k

j

) ∑

n≥k

jn tn

n!

=1

k!

k∑

j=0

(−1)k−j

(k

j

) ∑

n≥0

jn tn

n!

=1

k!

k∑

j=0

(−1)k−j

(k

j

)ejt.

在上面的第二个等号用到如下事实: 对n < k,

k∑

j=0

(−1)k−j

(k

j

)jn = ∆kxn|x=0 = 0. (23)

因此有:∞∑

n=k

{n

k

}tn

n!=

(et − 1)k

k!(24)

所以∑

k≥0

n≥k

{n

k

}uk tn

n!= eu(et−1). (25)

5. 指数多项式. 定义一列多项式:

An(u) =

n∑

k=0

{n

k

}uk. (26)

注意到

euet= etu d

du eu, (27)

所以由(25)得: ∑

n≥0

An(u)tn

n!= e−u · etu d

du eu, (28)

故有:

An(u) = e−u · (ud

du)neu. (29)

41

因此, An(u)在文献中有时被称为指数多项式(有时也称为Bell多项式)。它们出现在《荷

思》第二期上王力的文章“∑∞

n=1nk

n!是e的整数倍的新证明”中。令u = 1后得对于k ≥ 1:

e−1 ·∞∑

k=1

kn

k!=

n∑

k=0

{n

k

}. (30)

等式右边称为Bell数。

因为deg An = n, {A0(u), A1(u), . . . , }构成R[u]的一组基。利用(17)可得:

un =n∑

k=0

(−1)n−k

[n

k

]· Ak(u). (31)

类似地,如下定义一列多项式Bn(u):

Bn(u) =n∑

k=0

[n

k

]uk. (32)

由(18),

Bn(u) = (u)n (33)

是一个n阶多项式,所以{B0(u), B1(u), . . . , }是R[u]的一组基. 利用(17)可得:

un =

n∑

k=0

(−1)n−k

{n

k

}· Bk(u). (34)

6. Stirling数与对称多项式. 回顾基本对称多项式可如下定义:

n∏

j=1

(1 − ajx) =n∑

j=0

(−1)jej(a1, . . . , an) · xj . (35)

完全对称多项式可如下定义:

1∏nj=1(1 − ajx)

=∞∑

j=0

hj(a1, . . . , an) · xj . (36)

换言之,

ek(a1, . . . , an) =∑

1≤j1<···<jk≤n

aj1 · · · ajk, (37)

hk(a1, . . . , an) =∑

1≤j1≤···≤jk≤n

aj1 · · · ajk. (38)

42

由(1)得到:

(1 − u) · · · (1 − (n − 1)u) =n∑

k=0

(−1)n−k

[n

k

]· un−k. (39)

所以 [n

k

]= en−k(0, 1, . . . , n − 1). (40)

特别的, [n

n − k

]= ek(0, 1, . . . , n − 1), (41)

即 [n

n − k

]=

1≤j1<···<jk≤n−1

j1 · · · jk. (42)

下面我们将证明: {n + k

n

}= hk(1, 2, . . . , n), (43)

即有 {n

n − k

}=

1≤j1≤···≤jk≤n

j1 · · · jk. (44)

事实上,由(22)得到: {n + k

n

}=

n∑

j=0

(−1)n−j jn+k

j!(n − j)!, (45)

因此∞∑

k=0

{n + k

n

}xk =

n∑

j=0

(−1)n−j jn

j!(n − j)!

1

1 − jx, (46)

这里可以用到一个技巧: 增加变量考虑更一般的情况。运用归纳法可以证明,对于0 ≤ b ≤n和任意α:

n∑

j=0

(−1)n−j 1

j!(n − j)!

(j + α)b

1 − (j + α)x=

xn−b

∏nj=0(1 − (α + j)x)

. (47)

令α = 0和b = n后得到:

∞∑

k=0

{n + k

n

}xk =

1

(1 − x)(1 − 2x) · · · (1 − nx), (48)

练习。用(13)和归纳法证明上式。

43

从(41)和(43)可以再次看出对固定的k,

[n

n − k

]和

{n + k

n

}是n的多项式。事实上,

Newton多项式定义为:

pk(a1, . . . , an) = ak1 + · · · + ak

n. (49)

由简单的操作得到:

n∑

j=0

(−1)jej(a1, . . . , an) · xj =n∏

j=1

(1 − ajx) = expn∑

j=1

log(1 − ajx)

= exp(−n∑

j=1

∞∑

k=1

1

kak

j xk) = exp(−

∞∑

k=1

1

kpk(a1, . . . , an)xk),

故基本对称多项式可以表达为Newton多项式的多项式。同理,

∞∑

j=0

hj(a1, . . . , an) · xj =1∏n

j=1(1 − ajx)= exp(−

n∑

j=1

log(1 − ajx))

= exp(

n∑

j=1

∞∑

k=1

1

kak

j xk) = exp(

∞∑

k=1

1

kpk(a1, . . . , an)xk),

故完全对称多项式可以表达为Newton多项式的多项式。因为pk(1, 2, . . . , n−1) = 1k +2k +

· · · + (n − 1)k 与pk(1, 2, . . . , n) = 1k + 2k + · · · + nk 都是n的多项式,所以由(41)和(43)可

以看出:对固定的k,

[n

n − k

]和

{n + k

n

}是n的多项式。

参考文献

[1] 华罗庚,从杨辉三角谈起,科学出版社1956年初版,2002年再版(《数学小丛书》第

一本)。

[2] A. E. Feteke, Apropos two notes on notation, Amer. Math. Monthly 101 (1994), no,

8, 771-778.

[3] I. Gessel, R. P. Stanley, Stirling polynomials, Journ. Combinatorial Theory A 24

(1978), 24-33.

[4] C. Jordan, Calculus of finite differences, third edition, 1962.

[5] D. Knuth, Two notes on notation, Amer. Math. Monthly 99 (1992), no. 5, 403-422.

44

Banach-Tarski悖论∗

Karl Stromberg†

在这篇说明性的文章中我们将解释清楚并且证明由 Stefan Banach和 Alfred Tarski

在 1924 年提出的一个“悖论”性的定理[1]。我们之所以要做这件事情,是受到了 A. M.

Bruckner和 Jack Ceder最近的一篇文章的影响[2]。在这篇文章中,这个定理,连同一些

其它的定理,在他们关于不可测集的一些现象的有趣的讨论中被引入了。我们感谢 R. B.

Burckel教授使得我们注意到这篇文章,同时我们也热烈推荐这篇文章给读者。我们的目

的是给出这个非同寻常的事实的一个完全初等的证明,希望只有很少数学背景的读者也

能理解。我们只需要知道一些矩阵理论和基本的实分析。我们先陈述主定理,然后在进

入定理的证明之前给出其中概念的严格定义。我们先指出定理的证明需要 Zermelo的选

择公理,在下面定理3的证明中直接用到(这里选取的集合C不是用有限可构造的方法指定

的)。

Banach-Tarski 定理 如果X,Y是R3中的有界子集,并且内部非空,那么存在自然

数n以及{Xj : 1 6 j 6 n}和{Yj : 1 6 j 6 n}分别是X和Y的(分成n份)的分划,使得对于

每个j,Xj合同于Yj。

粗略地说,这个定理的意思是如果X和Y是两个空间中的物体,它们足够小,以至于

每个物体都能放到一个(可能非常大的)球中,它们又足够大,以至于每个物体都能包含一

个(可能非常小的)球,那么我们就可以把X分成有限份,然后把它们重新组装成Y (只使用

刚体运动)。这听起来明显是错的,如果我们遵循于常规,把几何中的理想物体与现实世

界中的真实物体混淆起来的话。如果我们断言能够把一个弹子球切成小块,然后我们可以

把它们重新组装成一个真实大小的 Banach雕像,那么我们看起来将十分愚蠢。当然,我

们不会做出这样的断言。在数学世界中,这个定理十分令人震惊,但它却是真的。

一些定义 对于R3中的元素x = (x1, x2, x3),我们定义x的范数为|x| = (x21 + x2

2 +

x23)

1/2。以a ∈ R3为中心,r > 0为半径的闭球是指集合{x ∈ R3 : |x − a| 6 r}。R3中的子

集X称为有界是指它能包含在某个闭球里面,X有非空内部是指它包含某个闭球。正交矩

阵是指转置等于它的逆(即它与它的转置乘积等于单位阵)的实值方阵。旋转指的是行列

∗译自 The Banach-Tarski Paradox, The American Mathematical Monthly, Vol. 86, No. 3 (Mar., 1979),

pp. 151–161.†Department of Mathematics, Kansas State University, Manhattan, KS 66506.

45

式等于1的3 × 3的正交矩阵ρ。我们同时把这样的ρ看成是R3映入R3的映射,通过将ρ(x)看

成ρ与列向量x的乘积得到的向量:ρ(x) = y = (y1, y2, y3),其中x = (x1, x2, x3),

ρ =

ρ11 ρ12 ρ13

ρ21 ρ22 ρ23

ρ31 ρ32 ρ33

, yi =

3∑

j=1

ρijxj , i = 1, 2, 3.

刚体运动指的是一个R3映入R3的具有形式r(x) = ρ(x) + a,∀x ∈ R3的映射r,其中ρ是固

定的旋转,a ∈ R3是固定的一点。我们记3 × 3单位矩阵为ι。两个R3中的子集X,Y称为合

同,记作X ∼= Y,如果存在某个刚体运动r使得r(X) = Y。(在这里,按照通常的习惯,

r(X)表示集合{r(x) : x ∈ X}。) 集合X的分划指的是一族集合,它们的并是X,并且任意

两个不同的集合交集是空集。因此,我们说{Xj : 1 6 j 6 n}是一个把X分成n份的分划的意思是

X = X1 ∪X2 ∪ · · · ∪Xn 并且 Xi ∩Xj = ∅,若i = j.

其中允许一些或者全部的Xj为空集。

我们用纯代数方法定义的旋转的几何含义由下面的命题给出。

命题1 设ρ是一个旋转,我们有如下结论:

(i)任意直线在ρ下的像还是直线,即ρ(b+ tc) = ρ(b) + tρ(c),∀b, c ∈ R3, t ∈ R。(ii) ρ保持内积,即若x, x′ ∈ R3, ρ(x) = y, ρ(x′) = y′,则

3∑

i=1

yiy′i =

3∑

j=1

xjx′j .

(iii) ρ保持距离:若x ∈ R3,则|ρ(x)| = |x|。(iv)如果ρ = ι,则集合A = {x ∈ R3 : ρ(x) = x}是一条经过原点的直线,即存在p ∈ R3使

得A = {tp : t ∈ R}而且|p| = 1。我们称A为ρ的旋转轴。

(v) 如果q ∈ R3满足(4)中所说的两条性质,则q = p或者q = −p。我们称p和−p为ρ的极点。

证明 断言(i)是显然的,(iii)可由(ii)取x′ = x得到。要证明(v),注意到如果{tp : t ∈R} = {tq : t ∈ R}以及|q| = |p| = 1,则存在某个t ∈ R使q = tp,而且t2 = t2|p|2 = |tp|2 =

|q|2 = 1,因此t = 1或−1。

要证明(ii),我们注意到ρ是正交的(∑

i ρijρik = ιjk = 1或0,分别当j = k或j = k),

46

i

yiy′i =

i

(∑

j

ρijxj

)(∑

k

ρikx′k

)

=∑

i

(∑

j

k

ρijρikxjx′k

)

=∑

j

k

ιjkxjx′k =

j

xjx′j .

要证明(iv)我们需要掌握稍微多一些矩阵理论和实分析的知识。 ρ的特征多项

式f(λ) = det(ρ − λι)是一个实系数三次多项式,根据中值定理,它至少有一个实根。

设λ1, λ2, λ3是它的三个复根(包括重根),λ1是最大的实根。则f(λ) = (λ− λ1)(λ− λ2)(λ−λ3),因此

λ1λ2λ3 = f(0) = det ρ = 1. (∗)

如果λk是实根,则线性方程组

3∑

j=1

(ρij − λkιij)xj = 0 (i = 1, 2, 3)

有不全为零的实根x1, x2, x3,因此存在x ∈ R3, x = 0,使得ρ(x) = λkx。由(iii)我们得

到|λk| = 1,因此λk = 1或−1。如果λ2非实根,则λ3为其复共轭,式(∗)变为λ1|λ2|2 = 1因

此λ1 = 1。如果λ2为实根,则λ3也是,所有三个根都为1或−1,式(∗)推出λ1 = 1, λ2 = λ3。

因此我们得到λ1 = 1,可以在上面的线性方程组中取k = 1来找到一个向量p ∈ R3, |p| =

1使得ρ(p) = p。我们有tp ∈ A,∀t ∈ R。我们还要证明A中没有其它的向量。假设u ∈ A使得u = tp, ∀t ∈ R。选择一个非零向

量v垂直于p, u和0所张成的平面,即∑vjpj =

∑vjuj = 0。由于ρ(p) = p以及ρ(u) = u,

从(ii)推出ρ(v)也垂直于此平面,因此从(iii)推出ρ(v) = v或−v。任意一个向量x ∈ R3中的

总可以写成x = αp + βu + γv,其中α, β, γ ∈ R。根据(i),ρ(x) = αp + βu + γρ(v)。由

于ρ = ι,因此ρ(v) = v不可能,因此ρ(v) = −v。矩阵

σ =

p1 u1 v1

p2 u2 v2

p3 u3 v3

有非零行列式,因为p, u, v线性无关。但是矩阵乘积

ρσ =

p1 u1 −v1p2 u2 −v2p3 u3 −v3

47

满足

−detσ = det(ρσ) = (det ρ)(detσ) = detσ

因此detσ = 0,发生矛盾。到这里我们证明了(iv)。

现在我们证明一些定理和引理,它们本身很有意思,而且是通向我们主要目标的重

要垫脚石。这些定理的前三个,特别是定理3是我们故事中的关键钥匙。这些定理是 Felix

Hausdorff在 1914年提出的([4], pp. 469–472)。我们考虑两个旋转

ψ =

−1/2 −√

3/2 0√

3/2 −1/2 0

0 0 1

ϕ =

− cos θ 0 sin θ

0 −1 0

sin θ 0 cos θ

其中θ是一个待定的实数。(从几何上来说,ψ将R3绕z轴旋转120◦,ϕ将R3绕xOz平面上的

直线x cos 12θ = z sin 1

2θ旋转180◦。) 可以验证ψ2矩阵表示中元素和ψ的类似,只是把√

3换

成−√

3,而且

ψ3 = ϕ2 = ι (1)

其中ι是单位矩阵。现在我们设G表示所有的可以表示为有限个ϕ或ψ乘积的矩阵全体。由

于(1),容易知道G在矩阵乘法下构成一个群(即若ρ, σ ∈ G则ρ−1, ρσ ∈ G),而且G中任意

元素ρ = ι都有至少一种方法表示为乘积

ρ = σ1σ2 · · ·σn (2)

其中n > 1,每个σj为ϕ或ψ或ψ2,而且对于1 6 j < n,σj和σj+1中恰有一个为ϕ。我们

称这样的表达式为由字母ϕ, ψ和ψ2构成的简化字。例如表达式ϕψ2ϕϕψ2ϕ不是一个简化

字,因为有两个相邻的ϕ,但是它与简化字ϕψϕ相等(指乘积得到的矩阵相同)。因此G中除

了ι, ϕ, ψ和ψ2以外的其它元素都能表示成下列四种形状中的至少一种:

α = ψp1ϕψp2ϕ · · ·ψpmϕ, β = ϕψp1ϕψp2 · · ·ϕψpm ,

γ = ϕψp1ϕψp2 · · ·ϕψpmϕ, δ = ψp1ϕψp2ϕ · · ·ϕψpm(3)

其中m > 1并且每个指数pj为1或2(对于δ来说m > 1)。这些是包含多于一个字母的简化

字。可能发生的情况是两个表达式不一样的简化字实际上乘出来的矩阵是相等的,这与我

们对θ的选取有关。例如当我们选取θ = π时,发现ψϕ = ϕψ2以及ψϕψϕ = ι。不过我们有

如下的引人注目的定理,它也是我们后续结果的关键。

48

定理1 ([4]) 如果cos θ是超越数,那么G中除了ι之外的元素存在唯一的方法表示为由

字母ϕ, ψ和ψ2构成的简化字。也就是说,如果

(i) σ1σ2 · · ·σn = ρ1ρ2 · · · ρm

其中等式的两端都是简化字,那么m = n而且σj = ρj对于1 6 j 6 n。

证明 我们只需要证明不存在简化字与ι相等。因为如果(i)成立并且使得n最小的话,

我们有n = 1而且ρ1 = σ1成立。

我们先说明(3)中的α = ι。我们有α = σmσm−1 · · ·σ2σ1,其中每个σ是ψϕ或者ψ2ϕ。

也就是说,每个σ是下面两个矩阵之一:

σ =

12 cos θ ±

√3

2 −12 sin θ

∓√

32 cos θ 1

2 ±√

32 sin θ

sin θ 0 cos θ

对m使用数学归纳法,容易验证如果K = (0, 0, 1),则

σmσm−1 · · ·σ1(K) = (sin θ · Pm−1(cos θ),√

3 sin θ ·Qm−1(cos θ), Rm(cos θ)),

其中P,Q和R是一些有理系数的多项式,它们的次数等于它们的下标,首项系数分别为

1

2

(3

2

)m−1

,±1

2

(3

2

)m−1

,

(3

2

)m−1

,

事实上,通过简单的计算可以知道

P0(x) = −1

2, Q0(x) = ±1

2, R1(x) = x,

Pm(x) =1

2xPm−1(x) ± 3

2Qm−1(x) − 1

2Rm(x),

Qm(x) = ∓1

2xPm−1(x) +

1

2Qm−1(x) ± 1

2Rm(x),

Rm+1(x) = (1 − x2)Pm−1(x) + xRm(x).

由于cos θ不是有理系数多项式的根,因此不可能有α(K) = K(否则Rm(cos θ)−1 = 0),因

此α = ι。

现在我们可以看到不存在(3)中的β等于ι,否则α = ϕβϕ = ϕιϕ = ϕ2 = ι。同样地,如

果γ = ι,则δ = ϕγϕ = ι,因此我们只需排除δ = ι的可能性。

假设δ = ι,其中δ有(3)中的形式,而且使得m最小。当然m > 1。如果p1 = pm,

则ψp1+pm的值是ψ2或ψ4 = ψ,因此

ι = ψ−p1δψp1 = ϕψp2 · · ·ϕψp1+pm

49

是一个形如β的简化字,这是不可能的。因此p1 + pm = 3。当m > 3时,我们有

ι = ϕψpmδψp1ϕ = ψp2ϕ · · ·ϕψpm−1

这也是一个δ形的简化字,但这与m的最小性矛盾。因此m = 2或3。但是m = 2的时候

有ι = ψp2δψp1 = ϕ,m = 3的时候有ι = ϕψp3δψp1ϕ = ψp2,这些显然都是不可能的。因此

最终我们得到δ = ι是不可能的。

现在我们固定一个θ使得cos θ是超越数。事实上,除了可数多个θ外,剩下的实数都满

足此条件。(顺便说一下,根据广义 Lindermann定理,任意非零的代数数都可以,例如

取θ = 1。)

如果元素ρ ∈ G已经唯一表示成(2)中简化字的形式,我们称n为ρ的长度,σ1为ρ的首

字母,或者称ρ开始于σ1。我们记l(ρ) = n以及l(ι) = 0。

按照通常的习惯,集合X的一个分划指的是X的两两不交的子集族,它们的并集

是X。

定理2 存在一个将G分成三个非空子集的分划{G1, G2, G3},使得对任意ρ ∈ G我们

(i) ρ ∈ G1 ⇔ ϕρ ∈ G2 ∪G3,

(ii) ρ ∈ G1 ⇔ ψρ ∈ G2,

(iii) ρ ∈ G1 ⇔ ψ2ρ ∈ G3。

(注意,ϕρ不一定开始于ϕ。例如ρ = ϕψϕ则ϕρ = ψϕ开始于ψ。其它的也类似。)

证明 根据G中每个元素的长度,归纳地将它们放入这三个子集中。令

ι ∈ G1, ϕ ∈ G2, ψ ∈ G2, ψ2 ∈ G3. (4)

设n > 1使得对任意σ ∈ G满足l(σ) 6 n都恰好放入子集G1, G2和G3三者之一。我们现在把

所有长度为n+ 1的元素也放入子集中。如果l(σ) = n而且σ开始于ψ或者ψ2,则令

ϕσ ∈ G2若 σ ∈ G1,

ϕσ ∈ G1若 σ ∈ G2 ∪G3.(5)

如果l(σ) = n而且σ开始于ϕ,则令

ψσ ∈ Gj+1若 σ ∈ Gj , (6)

ψ2σ ∈ Gj+2若 σ ∈ Gj , (7)

50

对于j = 1, 2, 3,其中G4 = G1, G5 = G2。根据归纳法,我们的分划已经定义好了。任

一个长度为n的元素在哪个子集中可以在n步内容易地判定出来。例如ρ = ψϕψϕψ2ϕψ2,

则l(ρ) = 7,我们从最后一个字母开始,依次得到

ψ2 ∈ G3, ϕψ2 ∈ G1, ψ

2ϕψ2 ∈ G3, ϕψ2ϕψ2 ∈ G1,

ψϕψ2ϕψ2 ∈ G2, ϕψϕψ2ϕψ2 ∈ G1, ρ ∈ G2.

容易验证长度为2的元素满足

{ϕψ, ϕψ2, ψ2ϕ} ⊂ G1, ψϕ ∈ G3,

因此当l(ρ) 6 1时(i)–(iii)均成立(例如(i)的两端都不成立,除非ρ = ι)。下面我们对元素长

度使用归纳法证明。设n > 1是一个正整数,而且命题对所有ρ ∈ G, l(ρ) < n成立。现在

设ρ ∈ G使得l(ρ) = n。分三种情况:

1. 若ρ开始于ϕ,则(6)和(7)中令σ = ρ,分别推出(ii)和(iii)成立。由于ϕρ长度为n − 1,

根据归纳假设,

ρ /∈ G1 ⇔ ϕ(ϕρ) = ρ ∈ G2 ∪G3 ⇔ ϕρ ∈ G1 ⇔ ϕρ /∈ G2 ∪G3

因此(i)对ρ也成立。

2. 若ρ开始于ψ,则(5)中令σ = ρ推出(i)成立。我们有ψρ = ψ2σ,其中l(σ) = n − 1而

且σ开始于ϕ,因此(7)和(6)推出

ψρ = ψ2σ ∈ G2 ⇔ σ ∈ G3 ⇔ ρ = ψσ ∈ G1 ⇔ ψ2ρ = σ ∈ G3

因此(ii)和(iii)对ρ成立。

3. 若ρ开始于ψ2,和前面一样(5)推出(i)成立。我们有ψρ = σ长度为n − 1,并且开始

于ϕ。同样由(6)和(7)推出

ψρ = σ ∈ G2 ⇔ ρ = ψ2σ ∈ G1 ⇔ σ ∈ G2 ⇔ ψ2ρ = ψσ ∈ G3

因此(ii)和(iii)成立。

因此对所有长度为n的元素,命题成立。根据归纳法,命题对所有G中元素成立,得证。

定理3 存在一个单位球面S = {x ∈ R3 : |x|2 = x21 + x2

2 + x23 = 1}的分

划{P, S1, S2, S3}使得

(i) P是可数集, (ii) ϕ(S1) = S2 ∪ S3,

(iii) ψ(S1) = S2, (iv) ψ2(S1) = S3.

51

证明 设P = {p ∈ S : ∃ρ ∈ G, ρ = ι使得ρ(p) = p}。由于G是可数的,每个G中元素ρ = ι仅固定S中的两个点(即ρ的极点),因此(i)成立。对每个x ∈ S \ P,令G(x) =

{ρ(x) : ρ ∈ G}。每个G(x)是S \ P的子集(如果ρ(x) ∈ P,则存在σ = ι使得σρ(x) = ρ(x),

因此ρ−1σρ(x) = x, ρ−1σρ = ι,因此x ∈ P ),有x ∈ G(x)(取ρ = ι),而且任意两个

集合G(x)和G(y)或者交集为空,或者两者相等(如果t ∈ G(x) ∩ G(y),则设ρ(x) = t =

σ(y),则∀z ∈ G(x),设z = τ(x),则有z = τ(x) = τρ−1(t) = τρ−1σ(y) ∈ G(y),因

此G(x) ∩G(y) = ∅ ⇒ G(x) = G(y))。因此集族F = {G(x) : x ∈ S \ P}是集合S \ P的分划。接下来,使用选择公理,在集族F的每个集合中选出一个点,这些点构成一个集合,

记为C。集合C具有以下性质:

C ⊂ S \ P, (a)

c1, c2 ∈ C, c1 = c2 ⇒ G(c1) ∩G(c2) = ∅, (b)

x ∈ S \ P ⇒ ∃c ∈ C使得x ∈ G(c) (c)

因为x ∈ G(c) ⇔ c ∈ G(x),∀x, c ∈ S \ P。定义

Sj = Gj(C) = {ρ(c) : ρ ∈ Gj , c ∈ C}

其中j = 1, 2, 3,G1, G2, G3如定理2中所述。根据(a)以及G(x) ⊂ S \ P当x ∈ S \ P,我们得到Sj ⊂ S \P对每个j。由G = G1 ∪G2 ∪G3以及(c),我们得到S \P = S1 ∪S2 ∪S3。如

果i, j ∈ {1, 2, 3}, i = j,则Sj ∩ Si = ∅(否则若x ∈ Sj ∩ Si,我们有x = ρ(c1) = σ(c2)对某

个c1, c2 ∈ C, ρ ∈ Gj , σ ∈ Gi,因此由(b)推出c1 = c2,记为c,有σ−1ρ(c) = c,但是c /∈ P,

因此σ−1ρ = ι,故ρ = σ,这与Gj ∩Gi = ∅矛盾)。因此{P, S1, S2, S3}是S的一个分划。最后我们使用定理2中的(i)–(iii),得到

ϕ(S1) = {ϕρ(c) : ρ ∈ G1, c ∈ C} = {τ(c) : τ ∈ G2 ∪G3, c ∈ C} = S2 ∪ S3,

ψ(S1) = {ψρ(c) : ρ ∈ G1, c ∈ C} = {τ(c) : τ ∈ G2, c ∈ C} = S2,

ψ2(S1) = {ψ2ρ(c) : ρ ∈ G1, c ∈ C} = {τ(c) : τ ∈ G3, c ∈ C} = S3,

因此(ii)–(iv)成立。命题得证。

接下来的引理以及使用它来从定理3推出定理4和5要归功于W. Sierpinski (见[6])。

引理1 如果P是S的任意可数子集,则存在一个可数集Q以及一个旋转ω,使得P ⊂Q ⊂ S以及ω(Q) = Q \ P。

52

证明 证明的想法很简单。我们先选择一个ω的旋转轴使得其不包括P中的点作为极

点,然后我们利用集合P × P × N的可数性,从不可数个实数中选出ω的旋转角,使得ω满足P ∩ ωn(P ) = ∅,∀n > 1,最后我们令

Q = P ∪∞∪

n=1

ωn(P ) (8)

接下来我们给出证明的详细步骤。

在所有S中的向量v = (v1, v2, v3)满足v3 = 0,只有可数多个使得v或者−v在P之中。因此可以选出向量v = (v1, v2, 0) ∈ S使得v和−v都不在P中。设u = (1, 0, 0)以及

σ =

v1 v2 0

−v2 v1 0

0 0 1

我们看到σ是一个旋转,σ(v) = u,而且集合σ(P )不包含u或者−u。对于实数t,考虑旋转

τt =

1 0 0

0 cos t − sin t

0 sin t cos t

这旋转保持u不动。对每个三元组(x, y, n),其中x, y ∈ σ(P ), n ∈ N,根据x22 + x2

3 > 0容易

推出恰有n个或者0个t ∈ [0, 2π[使得τnt (x) = y,分别当x1 = y1和x1 = y1时成立。由于只

有可数个这样的三元组,因此只有可数个t使得等式

σ(P ) ∩∞∪

n=1

τnt σ(P ) = ∅ (9)

不成立。固定一个t ∈ R使得(9)成立,这时令τ = τt。令ω = σ−1τσ以及Q如(8)中所述。由

于τnσ = σωn对所有n成立,因此(9)推出

σ(P ∩ ω(Q)) = σ

(P ∩

∞∪

n=1

ωn(P )

)= ∅

因此Q = P ∩ ω(Q) = ∅,命题得证。

定理4 存在一个将单位球面S分成10块的分划{Tj : 1 6 j 6 10},以及对应的旋转集合{ρj : 1 6 j 6 10},使得{ρj(Tj) : 1 6 j 6 6}是将S分成6块的分划,以及{ρj(Tj) :

7 6 j 6 10}是将S分成4块的分划。进一步地,我们可以取T7, T8和T9都是S1的旋转,以

及T1, T2, T3和T10都是可数集。

53

证明 我们继续沿用前面的记号。定义

U1 = ϕ(S2), U2 = ψϕ(S2), U3 = ψ2ϕ(S2),

V1 = ϕ(S3), V2 = ψϕ(S3), V3 = ψ2ϕ(S3).

由定理3我们知道{Uj , Vj}是Sj的分划,j = 1, 2, 3,因此这六个集合加上P构成S分成7块

的分划。令

T7 = U1, T8 = U2, T9 = U3, T10 = P,

ρ7 = ψ2ϕ, ρ8 = ϕψ2, ρ9 = ψϕψ, ρ10 = ι

可以验证ρ10(T10) = P以及ρj(Tj) = Sj−6, j = 7, 8, 9,因此{ρj(Tj) : 7 6 j 6 10}确实是S的分划。我们现在把S \ (T7 ∪ T8 ∪ T9 ∪ T10) = V1 ∪ V2 ∪ V3分成6块。设Q和ω如前面引

理所述,定义

T1 = ρ8(S1 ∩Q), T2 = ρ9(S2 ∩Q), T3 = ρ7(S3 ∩Q),

T4 = ρ8(S1 \Q), T5 = ρ9(S2 \Q), T6 = ρ7(S3 \Q).

显然我们有

{T1, T4}分划了 ρ8(S1) = V1,

{T2, T5}分划了 ρ9(S2) = V2,

{T3, T6}分划了 ρ7(S3) = V3,

因此我们看到{Tj : 1 6 j 6 10}是S的分划。接下来我们定义

ρ4 = ρ−18 , ρ5 = ρ−1

9 , ρ6 = ρ−17 , 以及 ρj = ω−1ρj+3

其中j = 1, 2, 3。显然

ρj+3(Tj+3) = Sj \Q (j = 1, 2, 3)

而且因为P ⊂ Q,因此这三个集合的并集是S \Q。最后,我们有

ρj(Tj) = ω−1ρj+3(Tj) = ω−1(Sj ∩Q) (j = 1, 2, 3)

因此这三个集合两两不交,它们的并集是ω−1(Q \ P ) = Q。

对于S的一个子集T,我们记T ′ = {tx : x ∈ T, 0 < t 6 1}。则S′ = {y ∈ R3 : 0 < |y| 61}是去心闭球,从单位闭球B = {y ∈ R3 : |y| 6 1}挖掉原点O = (0, 0, 0)得来。容易看到

如果我们把定理4中的S换成S′,Tj换成T′j则定理仍然成立。根据这个观察,我们有下面

的定理及证明。

54

定理5 存在一个将单位闭球B分成40块的分划{Bk : 1 6 k 6 40},以及对应的刚体运动集合{rk : 1 6 k 6 40},使得{rk(Bk) : 1 6 k 6 24}是将B分成24块的分划,以

及{rk(Bk) : 25 6 k 6 40}是将B分成16块的分划。

证明 设P是单元集{u},其中u = (1, 0, 0) ∈ S。对P应用前面的引理,我们得到一

个可数集Q使得u ∈ Q ⊂ S,以及一个旋转ρ0使得ρ0(Q) = Q \ {u}。设N1 = {12(q − u) :

q ∈ Q},以及刚体运动r0(x) = ρ0(x+ 12u) − 1

2u。

显然零向量0 ∈ N1而且r0(N1) = N1 \ {0}。记N2 = B \ N1, s1 = r0, s2 = ι,以

及Mh = sh(Nh), h = 1, 2,我们看到{N1, N2}是B的分划,{M1,M2}是S′ = B \ {0}的分划。为了完成证明,我们将这些分划和刚体运动与S′的分划{T ′

j : 1 6 j 6 10},以及旋转{ρj : 1 6 j 6 10}结合起来,如定理4之后的注解中所描述的那样。

我们注意到,对每个j = 1, · · · , 10,集族{T ′j ∩ ρ−1

j (Mi) : i = 1, 2}是T ′j的分划,

而{Mh∩T ′j ∩ρ−1

j (Mi) : h = 1, 2}是T ′j ∩ρ−1

j (Mi)的分划,i = 1, 2。因此{Mh∩T ′j ∩ρ−1

j (Mi) :

h = 1, 2, i = 1, 2, j = 1, · · · , 10}是将S′分成40块的分划,而且下面40个集合

Bhij = s−1h

[Mh ∩ T ′

j ∩ ρ−1j (Mi)

]

构成B的分划,另外对于固定的j,下面4个集合

ρjsh(Bhij) = Mi ∩ ρj(Mh ∩ T ′j) (h = 1, 2, i = 1, 2) (10)

构成ρj(T′j)的分划。现在我们使用定理4,得出下面的集族

{ρjsh(Bhij) : h = 1, 2, i = 1, 2, j = 1, · · · , 6}{ρjsh(Bhij) : h = 1, 2, i = 1, 2, j = 7, · · · , 10}

每一个都是S′的分划。同时对于固定的i,(10)中对应于这两个集族的12个和8个集合各

自都构成Mi的一个分划,我们再用s−1i 作用之后就变成Ni的分划。因此设rhij = s−1

i ρjsh,

我们推出集族

{rhij(Bhij) : h = 1, 2, i = 1, 2, j = 1, · · · , 6}

{rhij(Bhij) : h = 1, 2, i = 1, 2, j = 7, · · · , 10}

分别是将B分成24块和16块的分划。最后,我们给40个集合Bhij和40个刚体运动rhij重新

编下标k = 1, 2, · · · , 40。

定义 我们称R3中的两个子集X和Y为分片合同,记作X ∼ Y,如果存在自然数n以

及将X分成n块的分划{Xj : 1 6 j 6 n},以及对应的刚体运动集合{fj : 1 6 j 6 n},

55

使得{fj(Xj) : 1 6 j 6 n}是Y的分划。如果X分片合同于Y的一个子集,则我们记为X . Y。

我们的下一个定理给出了我们刚才定义的关系的一些简单性质。

定理6 对于R3的子集X,Y和Z,下列结论成立:

(i) X ∼ X,

(ii) X ∼ Y ⇒ Y ∼ X,

(iii) X ∼ Y 且 Y ∼ Z ⇒ X ∼ Z,

(iv) X ∼ Y ⇒ X . Y ,

(v) X . Y 且 Y . Z ⇒ X . Z,

(vi) X ⊂ Y ⇒ X . Y ,

(vii) X . Y 且 Y . X ⇒ X ∼ Y .

证明 由于Y ⊂ Y,因此(iv)是平凡的。由于ι是刚体运动,因此(i)和(vi)是平凡的(这

时n = 1)。结论(ii)由刚体运动的逆也是刚体运动推出。

要证明(v),设{Xj : 1 6 j 6 n}和{Yi : 1 6 i 6 m}分别是X和Y的分划,以及{fj :

1 6 j 6 n}和{gi : 1 6 i 6 m}是刚体运动的集合,使得{fj(Xj) : 1 6 j 6 m}是子集Y0 ⊂Y的分划,以及{gi(Yi) : 1 6 i 6 m}是子集Z0 ⊂ Z的分划。现在我们只需验证mn个集

合Aij = Xj ∩ f−1j (Yi)构成X的分划(对于固定的j,m个集合A1j , A2j , · · · , Amj两两不交,

而且它们的并集是Xj),以及对任意的i,n个集合fj(Aij) = Yi ∩ fj(Xj)(1 6 j 6 n)构成集

合Yi ∩ Y0的分划,因此{gifj(Aij) : 1 6 i 6 m, 1 6 j 6 n}是两两不交的子集族,它们的并集是Z的一个子集Z1。每个合成映射gifj都是刚体运动,因此我们有X ∼ Z1因此X . Z。

因此(v)成立。用同样的方法我们可以证明(iii),只要取Y0 = Y以及Z0 = Z。

要证明(vii),设X ∼ Y0以及Y ∼ X0,其中Y0 ⊂ Y,X0 ⊂ X。我们继续沿用前一段

的记号,取X = Z和X0 = Z0。我们照搬 Schroder-Bernstein定理的一个熟知的证明步骤

来证明X ∼ Y。首先我们定义f和g分别是X和Y中的映射,令f(x) = fj(x)若x ∈ Xj,以

及g(y) = gi(y)若y ∈ Yi。对任意E ⊂ X,按下式定义E′ ⊂ X:

E′ = X \ g[Y \ f(E)]. (11)

容易知道

E ⊂ F ⊂ X ⇒ E′ ⊂ F ′ (12)

定义D = {E : E ⊂ X,E ⊂ E′},注意∅ ∈ D。设D =∪

D为集族D中所有集合之并。对任

意E ∈ D根据(12)我们有E′ ⊂ D′因此E ⊂ D′。因此D ⊂ D′,根据(12)我们有D′ ⊂ (D′)′,

因此D′ ∈ D, D′ ⊂ D,因此D′ = D。在(11)中令E = D我们得到

D = X \ g[Y \ f(D)], X \D = g[Y \ f(D)].

56

容易看到X \D ⊂ X0。现在对于1 6 j 6 n和1 6 i 6 m,定义

Aj = D ∩Xj , An+i = gi[Yi \ f(D)], hj = fj 以及 hn+i = g−1i .

我 们 得 到{A1, · · · , An}构 成D的 分 划, {An+1, · · · , An+m}构 成X \ D的 分 划,

{h1(A1), · · · , hn(An)}构成f(D)的分划,{hn+1(An+1), · · · , hn+m(An+m)}构成Y \ f(D)的

分划。因此X ∼ Y成立,得证。

回忆R3中的闭球指的是形如A = {x ∈ R3 : |x − a| 6 ε}的集合,其中a ∈ R3, ε > 0为

给定的点和实数。子集A ⊂ R3的平移指的是这样的集合A + b = {x + b : x ∈ A},其中b ∈ R3为给定的点。

定理7 如果A ∈ R3为一个闭球,A1, A2, · · · , An是有限个A的平移,则有

A ∼n∪

j=1

Aj .

证明 不妨设A = {x ∈ R3 : |x| < ε}对某个ε > 0。任取a ∈ R3使得|a| > 2ε,

设A′ = A + a = {y ∈ R3 : |y − a| 6 ε}。我们用定理5来证明A ∼ (A ∪ A′)。设Bk和rk为

该定理所述。对任意子集D ⊂ R3以及δ > 0,设δD = {δx : x ∈ D}。考虑A的分划{εBk : 1 6 k 6 40}。按如下方式定义刚体运动sk:

sk(x) = εrk

(1

εx

)若 1 6 k 6 24,

sk(x) = εrk

(1

εx

)+ a 若 25 6 k 6 40.

(注意到如果r是刚体运动,即r(x) = ρ(x) + b,其中ρ是旋转,以及s(x) = εr(

1εx),则s是

一个刚体运动,因为s(x) = ρ(x) + εb。) 根据定理5我们知道{sk(εBk) : 1 6 k 6 24}是A的分划,{sk(εBk) : 25 6 k 6 40}是A′的分划,又因为A ∩ A′ = ∅,故{sk(εBk) : 1 6 k 640}是A ∪A′的分划。因此A ∼ (A ∪A′)成立。

要证明定理,我们对n用数学归纳法。当n = 1时定理显然成立。设n > 1使得A分

片合同于它的任意n − 1个平移之并。设A1, · · · , An是它的n个平移。根据归纳假设,

A ∼ [A1 ∪ · · · ∪An−1],而且显然An \ [A1 ∪ · · · ∪An−1]合同与A′的一个子集(只使用平移)。

因此我们有

A1 ∪ · · · ∪An . A ∪A′ ∼ A.

又因为A . A1 ∪ · · · ∪An显然成立,因此由定理6我们得到A ∼ A1 ∪ · · · ∪An成立。

我们现在重新陈述一遍 Banach-Tarski定理,并且证明它。

57

定理8 如果X和Y是R3中的有界子集,并且内部非空,则X ∼ Y。

证明 选择a, b分别是X,Y的内点,再选择ε > 0使得A = {x ∈ R3 : |x| 6 ε}满足A+ a ⊂ X以及A+ b ⊂ Y。由于X是有界集,因此存在A的有限个平移A1, · · · , An,它

们的并集包含X。因此使用定理7,我们有

A . X ⊂ (A1 ∪ · · · ∪An) ∼ A

因此由定理6我们有X ∼ A。同理Y ∼ A。再次使用定理6得到X ∼ Y。

评注 1.在定理5中出现的数字40并不是可能的最小数字。事实上,R. M, Robinson

在 1947年证明了存在一个把B分成5块的分划(其中一块还是单元集),使得它们可以通过

刚体运动重新组装成两个不交的单位闭球([5])。进一步地,T. J. Dekker和 J. deGroot证

明了这5个子集可以选取为连通的,而且是局部连通的([3])。

2.从定理3中推出这三个子集S′k = {tx : x ∈ Sk, 0 < t 6 1}, 1 6 k 6 3都不可能是

Lebesgue可测集,因为R3中的 Lebesgue测度λ3是旋转不变的。

3.定理3的一个糟糕的类似物通过下面描述的方法显式构造出来(不需要选择公理)。

固定一个超越数c满足|c| = 1(有很多这样的数存在,因为只有可数多个z满足|z| = 1不是

超越数。例如我们可以取c = ei)。令X是形如下式的复数全体:

z =n∑

j=0

ajcj

其中n和a0, a1, · · · , an是非负整数。对每个z ∈ X,这样的表达式唯一。设X0表示这些数

中满足a0 = 0的数全体,X1 = X \ X0。则{X0, X1}构成X的分划。定义复平面上的旋转ρ : ρ(z) = cz以及平移τ : τ(z) = z + 1。则ρ(X) = X0而且τ(X) = X1,因此X0和X1每

个都合同于X。之所以说这个例子“糟糕”是因为X是可数的,而且是无界的。

(潘锦钊1 译)

参考文献

[1] S. Banach & A. Tarski, Sur la decomposition des ensembles de points en parties

respectivement congruentes, Fund. Math. 6 (1924) 244–277.

[2] A. M. Bruckner & J. Ceder, On improving Lebesgue measure, Nordisk Mat. Tidskr.

23 (1975) 59–68.

1基数83

58

[3] T. J. Dekker & J. de Groot, Decompositions of a sphere, Fund. Math. 43 (1956),

185–194.

[4] F. Hausdorff, Grundzuge der Mengenlehre, Leipzig, 1914.

[5] R. M. Robertson, On the decomposition of spheres, Fund. Math. 34 (1947), 246–260.

[6] W. Sierpinski, Congruence of sets, Chelsea, New York, 1953.

数学趣闻

Wiener在20世纪20年代的时侯访问过一次Gottingen,当时做了一次学术报告,

Hilbert也在场,报告结束后吃晚餐的时候,Hilbert说:“现在的演讲比过去差远了,我年

轻的时候,人们都很讲究艺术,现在的年轻人却不这么干,在Gottingen尤其如此,今年

情况更坏,我压根就没有听到过一次好演讲,不过今天下午有个例外。”这时Wiener以

为Hilbert马上就要夸奖他了,结果Hilbert接着说:“今天下午这个演讲嘛,是最近所有当

中最糟糕的一次!”

59

代数几何简史

宗正宇∗

代数几何是一门有着非常悠久历史的学科,同时也是当今数学中非常活跃的领域之

一。代数几何的历史涉及了太多精彩的内容,这些内容既包括其自身的发展,也包括了代

数几何与其它的数学分支的相互影响。下面我简单总结一下代数几何的发展历史,由于篇

幅所限,这里只能总结那些最为重要的内容,而其它很多有趣的话题只能被省略掉了。粗

略地讲,经典的代数几何是一门研究仿射空间或射影空间中多项式方程组解的学科。从这

个意义上来讲,代数几何的兴起至少应该发生在坐标系以及解析几何的概念被提出之后。

然而,在这之前的希腊数学家们仍然为之后代数几何的兴起打下了一定的基础。在这个时

期(十七世纪之前),对于代数几何的研究主要集中在代数曲线上。实际上,早在古希腊

时期,人们就已经用纯几何的方法构造了很多的代数曲线,特别是对于圆锥曲线的研究已

经非常成熟。而对于高维的代数几何,那个时期的研究还比较少,主要限于对二次曲面的

一些研究。另一方面的问题在于,用这种方法研究的是实数域上的代数几何,而实数域不

是代数闭域。对于这个问题,后文中会继续涉及到。

在十七、十八世纪,随着坐标系和解析几何的诞生,代数几何有了新的发展。人们终

于可以用多项式方程组的零点来描述代数几何的研究对象。但是,这个时期人们对代数几

何的研究仍然是非常有局限性的。我认为这种局限性主要体现在以下的几个方面:首先在

这个时期,不仅是代数几何,整个几何的研究都限制在三维欧氏空间R3当中。这样一来,

代数几何就被限制在以下条件中:

1. 实数域上的、

2. 仿射的、

3. 曲线和曲面的代数几何。

尽管如此,这个时期对于代数几何的研究仍然有着重要的作用,其中对很多问题的

研究(或对某些现象的观察)起到了指导性的作用,为今后代数几何的发展指明了方向。

其中之一就是代数曲线的参数表示。举一个例子,平面代数曲线y2 = x2 + x3有参数表

∗原基数63

60

示x = t2 − 1; y = t(t2 − 1)。并不是所有的代数曲线都有这种参数表示,有这种参数表示

的曲线被称作有理曲线。Euler在当时得到了一系列有理曲线的例子。有理曲线的概念可

以被看作后来代数几何中双有理几何的开端。

另一个重要的发现就是奇点的概念。在这个时期,微积分以及微分几何已经发展了

起来,这为奇点的研究打下了基础。举例来说,设平面曲线F (x, y) = 0在点(x0, y0)处满

足F对x和y的偏导数均为零,则(x0, y0)就称为该曲线的奇点。平面代数曲线(看作复数域

上的曲线)的奇点有两类,一类就是结点(node),另一类就是尖点(cusp)。之前提到的曲

线y2 = x2 + x3在原点就是个结点,而曲线x3 = y2 + x4 + y4在原点是一个尖点。在今天,

奇点理论(特别是奇点消去理论)在代数几何中仍然占有非常重要的地位。

在这个时期,人们还发现了平面上两条代数曲线的交点个数与它们的次数之间的关

系。我们在中学学解析几何时都曾经注意过这样的问题,那就是两个圆锥曲线最多有四个

交点。而这种情况出现的时候,两条圆锥曲线都处于一个“一般”的位置上。于是人们猜

测,一条m次的曲线和一条n次的曲线在“一般”的位置上会有mn个交点。但是这个结论

非常不“整齐”,所谓的“一般”位置难以描述。如果要以一个漂亮的定理来描述这个结

论,就要完成三个大的变革:第一,要在复数域而不是实数域上来讨论代数曲线;第二,

要在射影空间而不是仿射空间中讨论代数曲线;第三,要以一种合理的方式描述交点的重

数。第三个变革是在后来把交换代数的工具引入代数几何才比较好地解决的,而前两个问

题十九世纪前期就得到了解决。现在我们就来讨论这个时期的代数几何。

在十九世纪前半叶,射影几何迅速发展,与此同时人们也开始重视研究复数域上的几

何。这两种几何都是关注到了之前的几何当中,人们忽略掉的一些点。射影几何相比较之

前的仿射几何,关注到了无穷远点。而复数域上的几何则关注到了被以前的人们称为虚

构(imaginary)的点。另外,在1845年,Grassmann和Cayley就已经提出了“n维空间”

的想法,这使得人们开始讨论n维射影空间中的代数簇。与仿射空间不同,讨论射影空间

的代数簇要考虑齐次的多项式方程组。由于n维射影空间可以被n + 1个仿射空间所覆盖,

所以将其中的一个变量取为1,就得到了相应的仿射簇的方程。这种思想已经开始突破以

前的只在欧氏空间中研究几何的做法,而真正革命性的突破要数Riemann所作的贡献。现

在我们就来讨论这个时期的代数几何。

在讨论Riemann的工作之前,首先值得一提的就是Abel对于椭圆积分和椭圆函数的

研究。Abel发现了椭圆函数的双周期性,从而为椭圆曲线以及更高次曲线的研究奠定了

基础。而谈到Riemann的工作,我们只能用伟大来形容。不仅是代数几何,Riemann对

整个几何学有着革命性的影响,他将几何学从古典时期带到了现代时期。Riemann的工

作彻底突破了欧氏几何的限制,创立了流形的概念以及Riemann几何。流形的思想对整

个数学都非常重要,特别地,它也对后来抽象代数几何的发展提供了思想上的帮助。说

到Riemann对代数几何最直接的帮助,其中之一就是Riemann曲面的概念。这个概念的建

61

立当然也与流形的思想有着紧密的关系。之所以说Riemann曲面与代数几何有着紧密的关

系,是因为紧Riemann面与复数域上的代数曲线基本上是一回事。利用Riemann曲面的概

念,Riemann定义了代数曲线的非常重要的离散不变量――亏格。之前提到的椭圆曲线就

是亏格为1的代数曲线。之所以说亏格是代数曲线的离散不变量,是因为还有一个相应的

连续不变量,这就是模空间(moduli space)的概念。我个人感觉模空间理论是一个极其

美丽的学科,例如在给定亏格的情况下,所有代数曲线的同构类的集合竟然会有代数簇的

结构,这确实是一个非常漂亮的结论。这样,代数曲线就被一个离散不变量(亏格)和一

个连续不变量(模空间)完全分类。有关模空间的理论在代数几何中占有非常重要的地

位,在后文中我们还将继续讨论这个问题。

此外,Riemann对于双有理几何的贡献也非常的大。实际上,Riemann几乎没有提到

过“代数曲线”这个概念,他研究的是Riemann曲面上的代数函数和它们的积分。这些研

究成为了后来双有理几何发展的基础,起到了指导性的作用。Riemann的这种研究方式实

际上反映了几何研究当中的一个重要的特点,那就是在几何的研究当中很多时候不是研究

几何对象本身,而是研究定义在该几何对象上的函数。

在十九世纪末二十世纪初的时候,代数几何出现了众多的学派。这些学派各有自己的

侧重点,但都希望通过自己的语言来奠定代数几何的基础。其中有代数学派,这个学派

由Kronecker, Dedekind和Weber建立。这个学派当时已经意识到了复数域上的代数簇与多

项式环中的理想的对应关系,并且从代数的角度定义了除子并证明了Riemann-Roch定理。

但是当时的代数工具发展得还不够完善,所以当时在代数概念上,他们也犯过一些错误。

另一个学派就是意大利的纯几何学派。这个古典的学派重视几何的直观,用纯几何的方法

得到了很多漂亮的结果。最有名的例子就是三次曲面上的27条直线,用纯几何的方法得到

这些精细的结果,直到今天也很令人赞叹。他们也对代数曲面在双有理等价的意义下做了

分类。但是几何学派由于缺乏有力的代数工具,所以很多的结果都是不严格的,当然也会

犯一些错误。而且纯几何的方法对于高维的问题或是比较复杂的问题就显得比较吃力。

在二十世纪二十年代之后,随着其它数学领域的发展,代数几何也迎来了进一步发展

的机会。一方面,随着代数工具(特别是交换代数)的发展,抽象的代数几何逐渐形成。

这个方向得到了Hilbert的支持,并且取得了不错的成绩。根据Hilbert零点定理,代数闭

域上代数簇与相应的多项式环中根式理想是一一对应的,而且不可约的代数簇对应的是素

理想。于是人们终于意识到代数闭域在研究代数几何时的重要性。在这个阶段,人们利用

代数的工具弥补了之前代数几何中的一些错误或是不严谨之处,并且可以开始比较有效地

研究高维的代数几何和比较复杂的情形。

另一方面,微分几何和复几何在这个阶段取得了重要的发展,这对代数几何也有非常

大的帮助。在这个时期,Poincare和Cartan发展了外微分式的理论,将微分几何带入了现

代时期。其中,对代数几何影响最大的应该是Kahler流形的发现和Hodge理论的发展。从

62

而以复解析理论为主的复代数几何迅速发展了起来,这个代数几何的分支与复流形的研究

紧密相关,直到今天也是研究代数几何的重要方法。

在二十世纪的前半叶,代数几何的学派众多,除了上文提到的几个之外,还有很多其

它的学派从不同的角度来研究代数几何,也都或多或少地取得了一些成果。但是,所有的

学派都没有能够很好地给出一个最为合适的基础语言,使得代数几何能够在这个基础的平

台上来进行发展。这个时候的代数几何似乎稍微显得有一些“乱”,尽管取得的成就是明

显的,但是人们仍然没有能够以一种行之有效的理论,来刻画出代数几何的深刻内涵以及

它的与众不同之处。这个人们期盼已久的代数几何的理论基础马上就要到来了。但在这之

前,我们必须要提到一个重要的人物,那就是Andre Weil。在历史上,几何与数论似乎总

是有一定的联系。在古希腊时期,平面几何与初等数论就有着千丝万缕的联系,而代数几

何与数论之间的联系也正在逐步地发展起来。Weil通过考虑抽象域(特别是有限域)上的

代数几何,使得抽象代数几何有了进一步的发展,也是代数几何与数论之间的联系更为明

显。他的书Foundation of Algebraic Geometry建立了抽象域上的代数几何理论。在二十

世纪五十年代,Serre将层这个重要的工具引入了代数几何,并且建立了凝聚层(coherent

sheaf)的上同调理论。

有了以上的这些基础,最振奋人心的时刻终于要到来了。Alexandre Grothendieck 创

立了以概形(scheme)为基础的代数几何理论,彻底改变了代数几何没有一个统一的语

言基础的局面。概形理论的建立标志着现代代数几何的开端,是代数几何的一场革命。

Grothendieck奠基性的著作《代数几何原理》(EGA)已经成为了代数几何领域的权威性

参考文献。概形理论使得代数几何在多个方面取得了突破。首先,仿射概形考虑了整个交

换环范畴,而之前人们研究的仿射代数簇实际上是

1. 代数闭域上的、

2. 有限型的(finite type)

3. 既约的(reduced)代数。

因此,如果从代数角度来看,概形理论扩大了代数几何的研究范畴。然而,最重要的

突破是下面的两点。第一,概形理论终于使得研究代数几何的内蕴几何成为了可能。具体

来说,由于概形成为了人们研究代数几何的基础平台,而概形是由仿射概形粘接而成的。

这样一来,概形所起的作用就如同微分几何中微分流形的作用一样。在古典微分几何中,

人们研究三维欧氏空间中的曲线和曲面,而Riemann创立的微分流形彻底改变了这个局限

性,使得流形成为了微分几何的基本研究对象。而在古典的代数几何中,人们研究的是仿

射空间或射影空间中的代数簇,所以这个时期代数几何所研究的对象依赖于坐标的选取。

而如果以概形为基本研究对象,那么代数几何的研究将摆脱坐标的限制。第二,也是最为

63

天才的一点,那就是仿射概形中的点是交换环中的所有素理想而不是极大理想。在古典的

代数几何中,(定义在代数闭域上的)仿射簇中的点与其仿射坐标环中的极大理想是一一

对应的。对应于其仿射坐标环中素理想的是仿射簇的子簇。因此在概形理论中,人们考虑

了比以前更多的点,而以前的点对应于概形当中的“闭点”。之所以在概形理论中考虑环

中所有的素理想,其实来源于很简单的技术原因,那就是对于一个环同态,极大理想的原

像不一定是极大理想,而素理想的原像一定是素理想。这样一来,概形理论处在了一个良

好的范畴当中,特别地,仿射概形范畴等价于交换环范畴的反范畴。概形的定义虽然与微

分流形的思想比较接近,但是概形与微分流形有一点是非常不同的:在微分流形中,任意

两个点从局部上看地位都是一样的;而在概形中,由于有大量非闭点的存在,两个不同的

点的邻域可能有着非常大的差别。

概形理论使得代数几何取得了快速的发展和巨大的成功。概形理论相比较古典代数几

何是比较抽象,而且要求代数几何学家必须要精通大量的交换代数与同调代数,因此概形

理论在开始的时候并没有被所有的人所接受。但是经过了大约25年的时间,人们逐渐承认

概形理论确实是一个使人们能够最深入理解和研究代数几何的理论,同时它也是一种最适

宜人们操作的平台。实际上,概形理论虽然涉及了大量的技术细节,但是实际上,概形理

论使得代数几何的问题变得简单。很多古典代数几何中比较散乱的结论,在概形理论中被

很好地统一了起来。概形理论逐渐成为了被大家广泛接受的基础语言。

在概形理论创立之后,代数几何越来越多地引入了现代的技术工具。其中,范畴的

语言和理论是被应用得最为广泛的。按照Grothendieck的观点,关注概形之间的态射要比

关注单个概形的结构更为重要。在代数几何中,人们常常固定一个“基概形”S,然后

考虑S-概形范畴中的态射。在经典的代数几何中,S经常为Spec(k),其中k是一个域。如

果固定一个S-概形S′,那么对于任意的S-概形X,X ⊗S S′就是一个S′-概形。这种方法在

代数几何中被称为基变换(base change)。基变换的方法在代数几何中非常有用,是一

个有力的工具。另外,如果我们固定一个S-概形X,对于任意的S-概形T,对应了一个集

合HomS(T, X)(称为X的T -值点),从而X对应了一个从S-概形范畴到集合范畴的反变函

子hX。这样的函子称为一个可表函子,一个函子是否可表是代数几何中非常重要的问题。

两个最为重要的可表函子应该是Hilbert函子和Picard函子,对应的概形称为Hilbert概形

和Picard概形。Hilbert概形是研究模空间问题的重要工具。利用范畴理论中群对象的一般

概念,我们还可以得到群概形、代数群等一些代数几何中非常重要的概念。

概形理论与经典的代数几何有一个非常不一样的地方。在经典代数几何中,仿射簇

的仿射坐标环都是既约的(无幂零元),而仿射概形Spec(A)中,A是可以有幂零元的。

这一不同使得概形理论与无穷小现象密切相关。代数几何的一个重要分支是形变理论

(deformation theory),它致力于研究一个域k上给定的概形的形变。而无穷小形变在整

个形变理论中很重要,占有基础的地位。形变理论与模空间问题的关系非常密切,模空间

64

问题是人们试图对代数簇进行分类,并将它们置于一个代数族中。而形变理论关注的是

与给定的代数簇“靠近”的那些簇。关于形变理论,Schlessinger的文章Functors of Artin

rings有着重要的作用。

有关模空间和不变量问题,Mumford在几何不变量理论(geometric invariant theory)

上有着重要的贡献。现在这个理论已经被广泛运用到了代数几何的各个领域。

在概形理论中,一个概形作为拓扑空间而言,它的拓扑是Zariski拓扑。有些时候,这

个拓扑显得过于“粗糙”。Grothendieck推广了通常的拓扑空间的概念,给予了概形一个

新的结构,称为etale拓扑,它比Zariski拓扑要更为精细。由etale拓扑,人们发展了etale上

同调这个有力的工具,Deligne运用etale上同调于1973年证明了Weil猜想,这再次反映了

代数几何对于数论所起的重要作用。随着代数几何与数论之间的关系越来越密切,算数代

数几何也越来越成熟。这门学科主要关注的是特征p(p是素数)上的代数几何以及如何运

用代数几何的工具解决数论中困难的问题。在算数代数几何中,Abel簇(abelian variety)

是一个重要的研究对象,它是一个具有群结构的射影代数簇。Abel簇是椭圆曲线的高维

推广,它们对数论都有着重要的作用。其中,Wiles在证明Fermat大定理时,椭圆曲线以

及模曲线就起到了很重要的作用。

随着代数几何的快速发展,越来越多的更为高级、更为抽象的概念被引进了代数几

何。例如,如果将概形进一步推广,就会出现叠(stack)和代数空间(algebraic space)

等概念,这些也都已经成为了代数几何的基本语言。此外,导出范畴(derived category)

的作用也越来越重要,它将代数几何与其它的很多数学领域联系在一起。

今天,代数几何仍然是数学当中最活跃的领域之一,并且它和很多其它的数学领域已

经紧密地结合在了一起。让我们共同来关注代数几何这个美丽而深刻的学科的发展吧!

65

孙念增、李欧奖学金介绍

叶俊∗

孙念增教授数学分析奖学金介绍

孙念增教授数学分析奖学基金最初由我系数师七班毕业生(1982届校友)在我系孙念

增教授去世后为纪念孙先生而设立,由数77,数86,数79,数80,数81校友及部分教师捐

款建立。孙先生在中国任教五十年,学术造诣精深,桃李遍天下。他一贯将学生的进步和

成长置于个人名利地位之上,从不居高临下,其平生最大乐趣乃与学生平等相处,开诚布

公。孙先生对学生的言传身教不仅包括数学和其他科学知识,更有许多可贵的人生基本准

则。对孙先生有意义的纪念并非金钱所能换取,这一有限的基金仅为表达捐赠者的共同心

愿–继承孙先生对清华大学及中国教育事业贡献微薄力量的遗志。

孙念增数学分析奖学金评奖方式为:

1. 每年评选一次,每次奖励两人,每人人民币5000元;

2. 获奖者为清华大学数学科学系大三本科生,其所修大学一、二年级数学分析课程

(选数学分析难度最高的教材)的总分为同年级学生中最高的两名;若总分最高分

人数多于二人,按名次由数名获奖者平分奖金。

李欧教授数学奖学金介绍

李欧教授数学奖学金由李欧先生家人为纪念李欧先生,以及鼓励清华大学数学科学系

学生热爱数学,努力学习而捐款建立。

李欧教授1941年毕业于燕京大学数学系,一生致力于数学教学工作,从1952年开始在

清华大学数学系工作,历任清华大学数学教研室副主任,应用数学系副系主任。从教50余

年间,教书育人,学术造诣精深,治学态度严谨,一丝不苟,精益求精,桃李满天下,受

∗清华大学数学系应用数学与概率统计研究所教授

66

孙念增奖学金历届获奖者情况

获奖学生姓名 班级 毕业去向 获奖时间

第一届 陈苗芬 数01 法国巴黎11大 2002年

第二届 吴 涵 数11 巴黎高工 2003年

第三届 朱力平 数21 Morgan Stanley 2004年

第四届 许庆晖 数32 巴黎高工 2005年

第五届 邱彦奇 数42 巴黎高师 2006年

赵 亮 数41 美国纽约城市大学研究生院 2006年

常寅山 数43 法国巴黎11大 2006年

第六届 吴 昊 基数51 法国巴黎11大 2007年

王 力 基数53 巴黎高师 2007年

第七届 喻 伟 基数63 香港中文大学 2008年

林 棽 基数61 巴黎高师 2008年

王竹海 基数62 美国哥伦比亚大学 2008年

第八届 林 洁 基数71 巴黎高师 2009年

陈 欢 基数72 巴黎高师 2009年

第九届 刘诗南 基数81 巴黎高师 2010年

王若凡 基数83 现大四 2010年

韩秋怡 基数83 现大四 2010年

第十届 孙宗汉 基数91 现大三 2011年

余成龙 基数91 现大三 2011年

67

到学生们的普遍尊敬和爱戴。被誉为“保持大面积,持续高质量教学”的典范。多次受到教

育部等部门的表彰和奖励。

李欧教授数学奖学金评奖方式为:

1. 每年评奖一次,奖金额为人民币5000元;

2. 获奖者为清华大学数学科学系大三本科生,其所修高等代数课程的总成绩最高,若

总分最高的人数多于一人,则他们将平分奖金。

李欧教授奖学金历届获奖者情况

获奖时间 获奖学生姓名 班级 现去向

2007年 张程业 基数53 卡耐基梅隆

宋颖达 基数52 香港科技大学

吴玉清 基数52 宾州大学

2008年 姚佳伟 基数63 普林斯顿大学

2009年 陈 欢 基数72 巴黎高师

杨 运 基数72 杜克大学

方 明 基数73 在申请新加坡的大学

2010年 刘诗南 基数81 巴黎高师

王梦露 基数82 现大四

任金波 基数82 现大四

2011年 余成龙 基数91 现大三

孙宗汉 基数91 现大三

刘琳媛 基数92 现大三

68

“孙念增教授数学分析奖学金”发言稿

余成龙∗

尊敬的各位老师、同学:

大家晚上好!

经过在数学系的两年学习,我很荣幸能够获得“孙念增教授数学分析奖学金”,孙教授

是一位把教育作为自己终身事业的好老师,而这份奖学金也正是他的学生为了纪念孙教

授,并继承孙教授对清华大学及中国教育事业贡献力量的遗志所设立的。

我要感谢这份奖学金的捐赠人,感谢你们对我们这些后辈学子的殷切希望与鼓励。同

时,我要感谢数学系的各位老师,你们用自己对数学的热情之火点燃了我对数学的喜爱,

特别是教我数学分析的卢旭光老师和张友金老师,你们向我展示了数学分析这个美妙的世

界;感谢江宁老师在习题课上的耐心讲解,课下对我们的关心;感谢课程助教邓娟助教,

杜升华助教,特别是杜升华学长,你不仅为我们批改作业讲解习题,还在课下无私地帮助

我们组织讨论班,毫无保留地与我们交流自己的心得体会;感谢一起讨论问题的各位同

学,和你们的交流使我受益匪浅。我的成绩的取得离不开你们的鼓励和帮助。所以在此,

我想谈一点自己学习的心得体会,希望能对新同学有所帮助,能让你们更快的适应大学生

活。

我的眼界最初是由卢旭光老师打开的,他教了我前两个学期的数学分析课,使我对于

分析的严谨概念有了最初的了解,让我第一次被数学的清晰严密所折服。严密准确是这门

课的一大特色。例如ε-δ语言,把哲学家们几百年间争执不休的无穷大无穷小说得一清二

楚了。因此你们新生刚开始接触它的时候,可能会为其繁复的语言感到困惑,其中有许多

直观的概念需要拐弯抹角的描述,一些看似显然的结论需要长篇大论的证明。这就要求我

们将直观和严密结合起来。一个好的方法是,在学习概念或者定理时,多画一些图形来表

达书中的文字表述,很多复杂的表述画一画就清楚了。还有就是多向老师和同学学习,学

习他们对定义定理的理解。一个看似冗长的证明往往只是将一个简单的想法严格化而已。

我们自己不一定能挖掘出每段话背后的故事,而老师都有着丰富的经验,上课的时候认真

听听他们的讲解就能收获很多书本上没有的东西。同学之间的交流也能促进大家对问题的

理解。同时我们还要训练把自己的直观想法转化为严密的数学表述的能力,这一点只有通

∗基数91

69

过长期的足够的练习来做到。数学家有时候是迂腐的,为了换取逻辑上的无懈可击,他们

用华丽的修辞掩饰了自己内心最真实的想法。而每当自己能从字里行间读出这些秘密时,

或者将自己的思考也转化成这种文体时,我便有一种怡然自得的感觉,希望你们在之后的

学习中也能多多体会到这种“每有所得,便欣然忘食”的快乐。

在学习态度方面,我觉得坚持不懈是最重要的。相信大家在来清华前都是各个学校的

佼佼者,在之前的十年寒窗中基本上是一路顺风。来到清华这个人才济济的地方,很容易

滋生被忽略的失落感。在刚开始的学习中也很有可能因为暂时的不适应遭受失败的打击。

这时请不要被一时的结果吓倒。人生的路还有很长的,我们需要树立远大的目标,并始终

如一地坚持下去。如果仅仅因为半年一年的低潮就放弃了最初的梦想,走上自甘平庸的道

路,实在是对不住自己的智商,对不住自己能够接受中国最好的高等教育的机会。当然这

种坚持要与自己的兴趣结合起来。肖杰老师就常常教导我们,我们要快乐地学数学。只有

领略到数学中的快乐,才能长期坚持而不觉得疲惫。

最后,我想说一点,就是不要在低处流连太久,要大胆地往前走。在已经掌握了一块

知识后,应尽快去学习更高级的东西。从上面看下面的风景会看得更多,更透。例如在学

习数分时我就自学了很多点集拓扑的知识,点集拓扑把数分中的很多具体概念变得更加抽

象了,许多定理中的因果关系也更容易看明白了。抽象的一般的东西更容易处理,这是你

们将会经常碰到的。周坚老师讲课时经常向我们展示许多高级知识的想法是如何追溯到数

分高代这两门基础课中的。后续的许多课程都离不开这两门课,学习更高级的知识确实能

够促进对基础课理解的巩固和加深。

以上是我自己的一点体会,供学弟学妹们参考,你们可以在接下来的学习中做出自己

的判断,找到适合自己的方法。祝你们的大学生活快乐充实!

谢谢大家!

70

李欧奖学金发言稿

孙宗汉∗

各位尊敬的来宾,老师,同学们:

大家好!我很荣幸有这样的机会作为李欧数学奖学金获得者的代表在这里发言。按捺

不住心中的激动,我首先要在这里表达三重感谢:首先,李欧教授是一位把数学教育作为

终身事业的杰出教师,李欧奖的设立表达了李老师的家属们对数学教育事业的殷切期望与

关怀,请允许我代表各位同学向李欧教授及李欧教授数学奖学金基金会致以崇高的敬意!

同样重要的是,我还要对两年来讲授各门课程的老师,和孜孜不倦地辅导我们学习的

助教表示衷心的感谢!这里着重表达对张贤科老师的感激之情,是张老师生动的的讲课技

巧和对我们的鼓励,使我在大一上学期高等代数考试惨败之后,仍然燃烧着对数学的热爱

与执着。如今张老师已经去支援南科大建设,然而他光辉伟大的形象却好像昨天一样历历

在目;他的离开使我茫然若失,我必须时时劝告自己:张老师在为祖国建设新式一流大学

出力,才能利用爱国情怀抵消我对张老师无尽的思念。

其次,我要对朝夕相处的同学们,尤其是对刘琳媛、余成龙两位在全学年遥遥领先的

同学,表达感谢之情。刘琳媛同学曾经苦口婆心地问我很深刻的问题,每次我试图做出回

答,得到的答复总是:“这个我早就想到了,可是这里还有问题……”与其说是问我问题,

不如说是告诫我还有很多问题和领域等待我们清华学子去探索,以此激发我学习的动力;

余成龙同学解答我冥思苦想不曾解决的问题如高斯证明威尔逊定理一般,自然流畅绝无半

点阻塞,却又处处见技巧,显功力,绝非凡人所为,让人感觉一听就懂。还有一些勤学好

问的同学,经常用向我提问的方式帮我检查知识漏洞,这些恩情我自然早已牢记在心。

同样,我也十分高兴和大家交流一下学习高等代数这门课的感悟,以启发将要作为李

老师张老师继承者的你们。初学这门课的同学普遍认为这门课偏难,我有幸在高中时代节

约半年时间预习了一下线性代数,多少对它有些了解,降低了课程的主观难度。认为这门

课难大多是因为它的特点——抽象,不如学线性代数直观具体。毕竟,高等代数展现的是

一种比中学数学更高级的思想和语言,对抽象的掌握是数学工作者必需的素质。试想遥远

的史前,原始人在大量的计数过程中总结经验,剥离了诸如四角桌子砍去四个角反而剩八

个角,一个男人加上一个女人不是两个人,等不合一般计数规律的特殊情况,抽象出了数

∗基数91

71

的加减法,这种纯粹的数学运算,脱离实物而存在,是多么伟大的进步!初中代数课上,

我们研究运算的一般规律,把具体数抽象成了x和y,又是一个跨越;现在是该把加法乘

法抽象成可交换可结合的可逆二元运算的时候了!群的概念就是这样产生的。我们的代数

课程就象这样,是人类思维能力的飞跃。如果谁只能掌握具体的算式,对于抽象的规律深

恶痛绝,说明他的思维方式适合去学工科,要注意听分流介绍,他们适合在工科方向展露

自己的才华。

具体说来,当时张老师的高等代数课程一上来就讲群环域,有很多人初学不适应。确

实,这章知识和高中严重脱节,这恰恰是一定要认真学的原因,因为它能够使我们从更高

的起点去欣赏高等代数,还有助于对以后抽象代数等课程的理解,如主理想环,唯一析因

环,欧氏环,模等概念。上学期的内容主要是线性代数,内容和一般教材差别不大,只是

讲的更深入,眼光更高,这些知识不精通会直接影响二年级数学分析和常微分方程的学

习,抽象代数想学懂就更困难了。下学期的课程中,二次型的重要性不言而喻,它马上就

在多元微积分中得到应用。越往后学,越会感觉到中学时看似无关的各个数学分支,像地

理大发现时代原本割裂的大陆一样由航线连接了起来,越来越紧密,形成一件优美的工艺

品。如果现在高等代数的教学割掉了群环域,哪里是驱赶走了学生学习的拦路虎,简直就

像一件宋朝瓷器打破了一个缺口,盛水即漏,价值立贬。即便本科课程只能揭示冰山一

角,产生的好奇心也足以构成我们探索前进的动力,这是自然产生而非外力诱使的。对金

钱的追求可以使资质平庸的人精通经济,对胜利的渴望可以令身体虚弱的人武力高强,但

是对数学信仰无法由名利所激发,而完全出自内心对严格性,逻辑性,永恒性,客观性的

热爱。英语仅仅是几百万人约定俗成创造的,生物学规律的有效范围只不过几万公里,物

理学定律也仅仅成立了两百亿年,它们同数学相比,高下立现。

除了天份与兴趣,汗水也是成功的化学成分之一。我们之中几乎没有伽罗瓦式的天

才,所以习题课不能缺,助教或者同学的很多想法都会使自己受益匪浅;当然,正课更不

能缺,作业要独立完成,甚至可以额外刷些题。据我一些在普通大学就读的小学同学介

绍,他们同学有一些只想考试保过保及格,光靠和老师打点好关系,一个学期没上过课没

做过作业,考试前弄到前几届考题背一遍答案应付过去,六十分万岁。然而在我们清华大

学,出现这种情况就令人遗憾了,我们甚至要防微杜渐,争取一节课不缺、一次作业不落

下。虽然学习方法因人而异,我证明不出对于每个人都存在一个完美的学习方法,但因为

勤奋成功的人不胜枚举,因为懒惰成功的有几人?勤奋是促使铁规律,张老师有名言“努

力是成功的必要条件,在基科班是充要条件”。

两年前,这两个奖项的颁发典礼令我记忆犹新,在台下聆听学长学姐肺腑之言的时

候,我便被学长学姐高超的言语技巧激发出了努力获奖的冲动,幻想着作为获奖者上台发

言的喜悦,现在这一天终于到来了。虽然两年的学习生活总有一些困难是无法预知的,总

有一些挫折令我措手不及,但是像我初中华罗庚数学竞赛那样的人生滑铁卢已经一去不

72

复返了。这时,一个人能不能坚持下去实现理想就要看他的志向能否战胜心中的懦弱,因

为坚持不懈的道理是普适的。大家如果努力学习两年,结果这两个奖项还是被更有天份的

同学夺走了,难道就得不偿失了吗?两年的辛苦就付诸东流了吗?不,人生的旅行刚刚到

了第一站,真正的比拼还没有开始,鹿死谁手,尚未可知,自己只要努力不会一无所成,

就能坚定学习数学的决心与志向。古时诸葛亮六出祁山,北伐中原无功而返,但因为鞠躬

尽瘁,死而后已,也赢得了后人的景仰尊重。我受水平所限,攻不破世界难题,但只要把

一生奉献给数学事业,培养出一大批优秀人才,向数学顶峰发起猛烈冲击,也算不虚此生

了!

最后,相信大家经过聪慧的思考和不懈的努力,一定能学好高等代数以及后面其他数

学课。真心祝愿大家在这里学业有成,实现理想!同时,也达到了李老师家属设立奖项的

初衷。也祝大家生活愉快!我愿与大家共勉!

谢谢大家!

73

征稿启事

《荷思》是清华大学数学系学生自主创办的数学学术刊物,面向各个院系中对数学感

兴趣的本科生及研究生。

本刊欢迎全校师生任何与数学有关的投稿,无论是长篇的论述,还是精彩的小品,抑

或学习/教学的心得、习题的妙解。在原作者的允许下,推荐他人的作品也同样欢迎。

为了编辑方便,建议投稿者能够提供电子版,并且采用 LATEX或Word排版。来稿请

注明作者,联系方式。

投稿请寄:THUmath@googlegroups.com

欢迎访问荷思网站:http://mathmu.cn/hesi

《荷思》编辑部

2011年12月

主办:清华大学数学科学系《荷思》编辑部

主编:余成龙

顾问:张端阳

编委:(按姓氏笔画为序)

车子良 乐鹏宇 冯 鑫 朱艺航 刘诗南 刘琳媛

苏 桃 李奇芮 李梦龙 李嘉伦 余成龙 郑志伟

张 铭 郭家胤 程经睿 谢松晏 赖 力 潘锦钊

封面:陈凌骅

排版:潘锦钊

联系本刊:THUmath@googlegroups.com

北京市海淀区清华大学紫荆9号楼 602B

010-515-31905

74

top related