《陶哲轩实分析》(中文第一版)——§11.1解答

习题11.1

11.1.1证明:当X是空集或单元素集(即X是退化区间)时引理11.1.4是平凡的.

我们进一步考虑X至少含有两个元素的情形:如果X是有界区间,由定义9.1.1和定义9.1.22知X的左端点a和右端点b均为实数,再由X至少含有两个元素知a<b,类似于例11.1.3的论证我们知其是连通的,综上X是有界连通集,即(b)\Longrightarrow(a).           如果X是有界连通的,进而我们知道(\inf(X), \sup(X))\in\mathbb{R}. 我们假设存在x_0\in(\inf(X), \sup(X))使得x_0\notin X,进而有\inf(X)<x_0<\sup(X),故x_0不是X的上界和下界. 由于x_0不是X的下界,进而存在x_1\in X使得x_1<x_0;同理由于x_0不是X的上界知存在x_2\in X使得x_0<x_2. 综合起来就是存在x_1,x_2\in X使得x_1<x_0<x_2. 而我们知道X是连通的,这说明x_0\in[x_1, x_2]\subseteq X,即x_0\in X,这个矛盾说明假设不成立,即对任意x\in(\inf(X), \sup(X))x\in X,即(\inf(X), \sup(X))\subseteq X. 而对任何x\in\mathbb{R}\backslash[\inf(X), \sup(X)]显然有x\notin X. 综上,X至少有开区间(\inf(X), \sup(X))这么大,至多有闭区间[\inf(X), \sup(X)]这么大. 而两个区间的区别仅在于是否包含\inf(X), \sup(X)这两个端点,故X是区间的形式,故X是有界区间.

综上命题得证.

 

11.1.2证明:由于I为有界集且I\cap J\subseteq I,进而有I\cap J\subseteq I\subseteq[-M, M](M\in\mathbb{R}, M>0),即I\cap J\subseteq[-M, M],故I\cap J也是以I的界为界的有界集合. 已知I、J均为连通集,进而对任意x,y\in I\cap J,如果x<y,我们就有x,y\in Ix,y\in Jx<y,进而有[x, y]\subseteq I[x, y]\subseteq J,进而有[x, y]\subseteq I\cap J. 综上I\cap J也为连通集. 所以I\cap J为有界连通集,由引理11.1.4知I\cap J为有界区间.

 

11.1.3证明:设I是形如(a, b)[a, b)的有界区间,其中a<b. 设\{I_1, ..., I_n\}是I的一个分法. 设实数c有a\leqslant c<b.

大假设:对一切自然数1\leqslant j\leqslant nI_j不是形如(c, b)[c, b)的区间.

小假设:存在自然数1\leqslant j'\leqslant n使得\sup(I_{j'})\geqslant b.

论证:由于I_{j'}\subseteq I\sup(I)=b,进而我们有\sup(I_{j'})\leqslant b,结合小假设知\sup(I_{j'})=b,进而I_{j'}非空,于是I_{j'}为非空有界区间,于是其上确界b确为其右端点的值,但这与我们的大假设相矛盾,故在承认大假设的前提下小假设不成立,即如果大假设成立则有对一切自然数1\leqslant j\leqslant n\sup(I_j)<b. 进而有max\{\sup(I_j) : j\in\{i\in\mathbb{N} : 1\leqslant i\leqslant n\}\}<b. 而我们有I\subseteq\bigcup_{j\in\{i\in\mathbb{N} : 1\leqslant i\leqslant n\}}I_j,故\sup(I)\leqslant max\{\sup(I_j) : j\in\{i\in\mathbb{N} : 1\leqslant i\leqslant n\}\}<b. 这与\sup(I)=b相矛盾,故大假设不成立. 综上命题得证.

 

11.1.4证明:\mathbb{P}\#\mathbb{P}':=\{K\cap J : K\in\mathbb{P}, J\in\mathbb{P}'\}=\bigcup\{\{K\cap J : K\in\mathbb{P}\} : J\in\mathbb{P}'\}. 由于\mathbb{P}为有限集,则对一切J\in\mathbb{P}'\{K\cap J : K\in\mathbb{P}\}为有限集. 由于\mathbb{P}'为有限集,故有限集的有限并\bigcup\{\{K\cap J : K\in\mathbb{P}\} : J\in\mathbb{P}'\}(归纳法易证)仍为有限集,即\mathbb{P}\#\mathbb{P}'为有限集.

对一切p\in\mathbb{P}\#\mathbb{P}',由推论11.1.6知p为有界区间,并且易知p\subseteq I.

对一切i\in I,由于\mathbb{P}为I分法知恰存在一个K\in\mathbb{P}使i\in K;同理知恰存在一个J\in\mathbb{P}'使i\in J,故有i\in K\cap J\in\mathbb{P}\#\mathbb{P}'. 假设仍存在K'\cap J'\in\mathbb{P}\#\mathbb{P}'使i\in K'\cap J',进而有i\in(K \cap K')\cap(J\cap J'),由一个分法中的元素互不相交我们知必有K=K'J=J'. 故恰存在一个K\cap J\in\mathbb{P}\#\mathbb{P}'使i\in K\cap J.

综上,由定义11.1.10知\mathbb{P}\#\mathbb{P}'为I的一个分法.

由定义11.1.4显然知\mathbb{P}\#\mathbb{P}'为比\mathbb{P}\#\mathbb{P}'都更细的分法.

 

 

文内补充

1.定义11.1.1与章节8.2的博文中对实数集的连通集定义有些许区别. 对于无限实数集两者相容. 对于有限实数集:前者认为空集和单点集是连通的,后者则不然;其余至少有两个元素的有限实数集两者均认为不连通.

 

2.例11.1.3中的“为什么?”.

显然.

 

3.引理11.1.4的(b)“X是有界区间”改成“X可以写成有界区间形式”更好.

 

4.定义11.1.8的另一个等价的表述是:设I是有界区间,当I=\emptyset|I|=0;否则|I|=\sup(I)-\inf(I).

 

5.定义11.1.10:设I是有界区间. 集合\mathbb{P}是I的一个分法要求其满足三点——1.\mathbb{P}为有限集;2.\mathbb{P}的元素均为I的子集并且均为区间;3.对任意i\in I恰存在一个p\in\mathbb{P}使得i\in p.

并且我们容易验证有\displaystyle I=\bigcup_{P\in\mathbb{P}}P.

 

6.定理11.1.13证明中的“为什么?”.

第一个为什么:若I非空,则分法非空.

第二个为什么:显然.

第三个为什么:显然.

第四个为什么:我们容易从分法要求的三点逐一验证.

 

7.例11.1.15中的“为什么?”.

第一个为什么:显然.

第二个为什么:显然.

第三个为什么:归谬法或构造性证明.

 

8.例11.1.17中的“为什么?”.

显然.

 

9.证明一个小命题:设I、J均为有界区间,并且I\cup J仍为区间并且I\cap J=\emptyset. 那么我们有|I\cup J|=|I|+|J|.(这个命题是定理11.1.3的证明中|I|=|K|+|I\backslash K|的总结)

证明:当I或J为空集时结论显然成立. 故考虑两集合均非空的情形. 我们假设\sup(I)<\inf(J),进而有\sup(I)<\frac{\sup(I)+\inf(J)}{2}<\inf(J),我们任取一个x\in Iy\in J,于是我们有x\leqslant\sup(I)<\frac{\sup(I)+\inf(J)}{2}<\inf(J)\leqslant y,进而\frac{\sup(I)+\inf(J)}{2}\in[x, y]. 由于I\cup J仍为有界区间并且x,y\in I\cup J并且x<y,由引理11.1.4和定义11.1.1我们知道有[x, y]\subseteq I\cup J,进而\frac{\sup(I)+\inf(J)}{2}\in I\cup J,于是有\frac{\sup(I)+\inf(J)}{2}\in I或者\frac{\sup(I)+\inf(J)}{2}\in J,但这个陈述由\sup(I)<\frac{\sup(I)+\inf(J)}{2}<\inf(J)知为假,这个矛盾说明假设不成立,进而得到\sup(I)\geqslant\inf(J). 同理我们可证\sup(J)\geqslant\inf(I).

进而我们可以假设有\sup(I)>\inf(J)并且\sup(J)>\inf(I). 于是我们发现有max\{\inf(I), \inf(J)\}<min\{\sup(I), \sup(J)\},进而区间(max\{\inf(I), \inf(J)\}, min\{\sup(I), \sup(J)\})非空,我们任取一个元素x\in (max\{\inf(I), \inf(J)\}, min\{\sup(I), \sup(J)\}),进而有max\{\inf(I), \inf(J)\}<x<min\{\sup(I), \sup(J)\},进而有\inf(I)<x<\sup(I)\inf(J)<x<\sup(J),由于I、J均为区间故有x\in Ix\in J(因为非空区间的确界即为其端点值),进而x\in I\cap J,这与I\cap J=\emptyset相矛盾,说明我们的假设不成立,再结合第一段的论证我们知有\sup(I)=\inf(J)\sup(J)=\inf(I). 进而由\sup(I)=\inf(J)\sup(J)=\inf(I)这两个等式可以分别推得“\sup(I\cup J)=\sup(J)\inf(I\cup J)=\inf(I)”和“\sup(I\cup J)=\sup(I)\inf(I\cup J)=\inf(J)”,但无论何种情形我们有|I\cup J|=\sup(I\cup J)-\inf(I\cup J)=\sup(J)-\inf(J)+\sup(I)-\inf(I)=|I|+|J|. 这就完成了证明.

 

我们还容易证明:1.如果\mathbb{P}是I的分法,并且\mathbb{P}'是某p\in\mathbb{P}的分法,那么有\mathbb{P}\backslash\{p\}\cup\mathbb{P}'是比\mathbb{P}更细的分法.

2.如果\mathbb{P}是I的分法并且\mathbb{P}基数不小于2,那么对任意p\in\mathbb{P},总存在p'\in\mathbb{P}\backslash\{p\}使得p\cup p'是区间. 这个命题很直观显然,但证明还是有点繁琐的,留给读者自证了:). ————-在命题“设g:I\rightarrow\mathbb{R}是单调的以正实数M>0为界的连续函数,其中定义域I是非空有界区间. 我们来证明:对任意I的分法\mathbb{P}'''\displaystyle \sum_{J\in\mathbb{P}'''; J\neq\emptyset}(\sup_{x\in J}g(x)-\inf_{x\in J}g(x))=\sup(\{g(x) : x\in I\})-\inf(\{g(x) : x\in I\}).”中的小命题1.和小命题3.证明后,这个结论是显然的,详细请点链接.

《陶哲轩实分析》(中文第一版)——§8.5解答

习题8.5

8.5.1证明:此集合是偏序、全序和良序的. 因为空集使得所有的要求都是空真的成立的.

 

 

 

 

 

8.5.2证明:集合在前,关系\mathcal{R}在后.

(a)\mathbb{N}; a\mathcal{R} b\text{ iff } a\leqslant b\text{ and } |a-b|\leqslant 1.

(b)\mathbb{N}^+; a\mathcal{R} b\text{ iff } \exists n\in\mathbb{N}^+\text{ such that }na>b.

(c)1.\mathbb{R}^*上的<.       2.或者\mathbb{R}; a\mathcal{R} b\text{ iff }a=\sqrt{b^2}.       3.或者一个由集合构成的的集合族X和关系\subsetneq.

 

 

 

 

 

8.5.3证明:1.自反性:n=n=1\cdot n,故n|n.

2.反对称性:如果n|mm|n,则n=am=abn(a, b\in\mathbb{N}^+),进而有a=b=1,故n=m.

3.传递性:如果a|bb|c,则c=bm=anm(n, m\in\mathbb{N}^+),故a|c.

综上集合\mathbb{N}\backslash\{0\}同序关系|是偏序集.

 

由于对2和7有2|7, 7|2均不成立,故其不是全序集.

 

 

 

 

 

8.5.4证明:反证,设m\in\mathbb{R}^+\mathbb{R}^+的最小元,即不存在x\in\mathbb{R}^+使得x<m. 现在我们令x':=\frac{m}{2},则此时有x'\in\mathbb{R}^+x'<m. 矛盾,假设不成立,命题得证.

 

 

 

 

 

8.5.5证明:勘误:习题8.5.5第二行“f(x)\leqslant_Y f(x')”应改为“f(x)<_Y f(x')x=x'”.

1.自反性:对任意x\in X,由于有x=x,故有“f(x)<_Y f(x)x=x”为真,进而x\leqslant_X x.

2.反对称性:对任意x_1, x_2\in X,如果x_1\leqslant_X x_2x_2\leqslant_X x_1,则有“f(x_1)<_Y f(x_2)x_1=x_2”且“f(x_2)<_Y f(x_1)x_2=x_1”,但无论何种情形总有x_1=x_2.

3.传递性:对任意x_1, x_2, x_3\in X,如果x_1\leqslant_X x_2x_2\leqslant_X x_3,则有“f(x_1)<_Y f(x_2)x_1=x_2”且“f(x_2)<_Y f(x_3)x_2=x_3”,但无论何种情形总有x_1\leqslant_X x_3.

综上,\leqslant_X 使X成为偏序.

 

\leqslant_Y使得Y为全序集时,对任意x_1, x_2\in X,有x_1=x_2x_1\neq x_2. 当x_1=x_2时有x_1\leqslant_X x_2. 当x_1\neq x_2时,加上f为单射则有f(x_1)\neq f(x_2). 此时亦有x_1\leqslant_X x_2.

 

 

 

 

 

8.5.6证明:f显然是满射. 对任何x_1, x_2\in X,如果x_1\neq x_2,则x_1\leqslant_X x_2x_2\leqslant_X x_1不可能同时成立. 我们分三种情形讨论:

1.x_1\leqslant_X x_2x_2\leqslant_X x_1均不成立,此时有x_1\notin (x_2)x_1\in(x_1),故(x_1)\neq(x_2);

2.x_1\leqslant_X x_2不成立和x_2\leqslant_X x_1成立,同理此时x_1\notin (x_2)x_1\in(x_1),故(x_1)\neq(x_2);

3.x_1\leqslant_X x_2成立和x_2\leqslant_X x_1不成立,此时x_2\notin (x_1)x_2\in(x_2),故(x_1)\neq(x_2).

综上f为单射. 进而f为双射.

 

对于任何x,y \in X,如果f(x)\subseteq f(y),则有x\in f(y),进而有x\leqslant_X y.       如果有x\leqslant_X y,那么对于任意x'\in f(x)x'\leqslant_X x,进而x'\leqslant_X y. 故x'\in f(y),故f(x)\subseteq f(y).

综上,对于任何x, y\in X有“x\leqslant_X y   iff   f(x)\subseteq f(y)”.

 

 

 

 

 

8.5.7证明:设y_1, y_2均为Y的最小元,即y_1, y_2\in Y且不存在y'\in Y使得y'<y_1且不存在y''\in Y使得y''<y_2. 由于Y为全序,故对一切y'\in Y有“y_1\leqslant y'\text{ or }y_1=y'”,进而有“y_1\leqslant y_2\text{ or }y_1=y_2”.

类似地可得“y_2\leqslant y_1\text{ or }y_2=y_1”.

于是无论哪种情形总有y_1=y_2. 于是最小元只有一个.

 

同理可证最大元只有一个.

 

 

 

 

 

8.5.8证明:设X为全序集. 设Y为X的非空有限子集,显然Y也为全序集.

如果\#(Y)=1,则其为单元素集,其唯一的元素即为最大元和最小元. 这就完成了归纳基始.

现在归纳假设当\#(Y)=n\geqslant 1(n\in\mathbb{N})时命题成立.

那么当\#(Y)=n+1时,我们记Y=(Y\backslash\{y_0\})\cup\{y_0\}(y_0\in Y). 此时知\#(Y\backslash\{y_0\})=n,进而由归纳假设知Y\backslash\{y_0\}有最大元和最小元,分别记为y_{max}, y_{min}. 于是乎有对一切y\in Y\backslash\{y_0\}有“y\leqslant y_{max}\text{ or }y=y_{max}”. 而对y_0,我们有y_0\leqslant y_{max}y_{max}\leqslant y_0. 由于y_{max}\in Y\backslash\{y_0\},进而有“y_0<y_{max}y_{max}<y_0.”.       当y_0<y_{max}时,就不存在y\in\{y_0\}和不存在y\in Y\backslash\{y_0\}使得y_{max}<y. 进而不存在y\in Y使得y_{max}<y. 于是y_{max}为Y的最大元.       当y_{max}<y_0时,对一切y\in Y\backslash\{y_0\}y<y_0. 故不存在y\in Y使得y_0<y. 综上Y总有最大元.

类似地论述知Y总有最小元.

这就完成了归纳,命题得证.

 

 

 

 

 

8.5.9证明:假设X是无限集. 由于X\subseteq X故X有最小元x_0\in X. 而X_1:=X\backslash\{x_0\}\subseteq X,进而X_1有最小元x_1\in X,并且容易证明x_0<x_1. 由于X是无限集,我们可以证明每次从中剔除掉一个元素得到的集合仍是无限集,于是上述过程可以不断重复下去,于是我们将得到X中的一个无穷增序列x_0<x_1<x_2<.... 这说明X无最大元,矛盾,假设不成立,故X是有限集.(此论证不必用到选择公理,因为虽然要重复可数无穷次,但是是可递归定义的,或者说每次的选择是明确的.)

 

 

 

 

 

8.5.10证明:归纳原理的集合版本.

一个错误的证明:
容易证明当X为有限集时命题成立. 于是我们现在假设X为无限集.
我们递归定义一个集合序列S_0, S_1, S_2, ....
基始定义S_0:=X.
归纳假设已定义好S_n(n\in\mathbb{N}).
我们定义S_{n+1}:=S_n\backslash A_n,其中A_n定义为:
若S_n为空集则A_n:=\emptyset;若S_n非空则令A_n:=\{\min(S_n)\}.
这就完成了归纳定义.

注意,这里没有像习题8.1.1中用到依序选择公理DC,因为A_n在每一步中都是唯一确定的.
上述定义其实就是对X取最小元后去掉此最小元形成新集合,
再对新集合重复同样的操作而得到一个集合的序列.

我们定义B_n:=S_n\backslash S_{n+1}(n\in\mathbb{N})(=A_n=\{\min(S_n)\}),定义集合C_n:=\{B_m : m\in\mathbb{N}, 0\leqslant m\leqslant n\}(n\in\mathbb{N}).

于是我们将看到一个递增的序列\min(S_0)<\min(S_1)<\min(S_2)<...,其中\min(S_n)\in B_n(n\in\mathbb{N}).

对自然数0,有\bigcup C_0=B_0=S_0\backslash S_1=\{\min(S_0)\}.
易知此时P(\min(S_0))成立.
归纳假设对某自然数n有对一切c\in\bigcup C_nP(c)成立.
那么对一切c\in\bigcup C_{n+1}有:对某自然数n'\leqslant n+1c\in B_{n'}=S_{n'}\backslash S_{n'+1}=\{\min(S_{n'})\}.
当n'\leqslant n时由归纳假设知有P(c)成立;
当n'=n+1时有c\in S_{n+1}\backslash S_{n+2}=\{\min(S_{n+1})\},
易证对一切x\in Xx<_X cx=\min(S_p)(p\in\mathbb{N}, p<n+1)
这是因为把X中元素x分为x<_X c以及其他两个集合,由于c\in\{\min(S_{n+1})\}以及
递增的序列\min(S_0)<\min(S_1)<\min(S_2)<...我们知道满足x<_X c的X的元素只能在
序列\min(S_0)<\min(S_1)<\min(S_2)<...<\min(S_n).
即我们容易证明S_n=S_{n+1}\cup A_n(n\in\mathbb{N}),
进而证明X=S_{n+1}\cup\{\min(S_0), \min(S_1), \min(S_2), ..., \min(S_n)\}=S_{n+1}\cup\bigcup C_n,
故由归纳假设知P(x)成立,进而命题8.5.10的蕴涵关系知P(c)成立.
故对一切自然数n有\bigcup C_n中的一切元素都使得性质P成立.

而对一切y\in X,存在自然数m使得\bigcup C_m=\{x\in X : x\leqslant_X y\}(或存在自然数m使得y\in\bigcup C_m),
故P(n)为真.

命题得证.

这个错误证明错在论断“对一切y\in X,存在自然数m使得\bigcup C_m=\{x\in X : x\leqslant_X y\}(或存在自然数m使得y\in\bigcup C_m)”,一个反例是X:=\{1\}\cup\{1-\frac{1}{n} : n\in\mathbb{N}\backslash\{0\}\}以及标准大小序\leqslant. 由\mathbb{N}\backslash\{0\}是良序的且集合\{1-\frac{1}{n} : n\in\mathbb{N}\backslash\{0\}\}中定义n\in\mathbb{N}\backslash\{0\}我们容易证明其是良序的. 此时对1\in X论断“存在自然数m使得\bigcup C_m=\{x\in X : x\leqslant_X 1\}(或存在自然数m使得1\in\bigcup C_m)”是错误的,因为\bigcup C_m是有限集而\{x\in X : x\leqslant_X 1\}是无限集(因为1是X的最大元,而由C_m定义我们知道若存在自然数m使得1\in\bigcup C_mC_{m+1}为空集,由于X是无限集知这是不可能的.)这个例子说明良序集中非最小元的元素不一定有前驱(如果有前驱,容易证明前驱是唯一的),但是良序集中除了最大元的元素均有唯一的后继.

故(可数)良序集并不意味着你可以集合的最小元开始按序关系在有限步内取到任意你要的元素(这样的良序集可以证明必定是至多可数的,比如自然数集,自然数除了0均有唯一的前驱和后继.),其在选择公理成立的前提下只能说明由良序集中元素构成的严格递减序列必定是有限序列.

 

 

命题8.5.10的直观是:只要我们假设存在x_0\in X使得P(x_0)为假,于是根据已知的蕴含式命题可以找到x_1\in X使得x_1<x_0P(x_1)为假. 这个步骤要进行多少次都可以,于是我们可以得到X的严格递减的序列x_0>x_1>x_2>...(此处必须假定依序选择公理成立才能取到此序列),这与X为良序相矛盾. 但下面的两个严格证明都没有依赖任何形式的选择公理.

我们考虑集合\{x\in X: P(x) \text{ is false}\}. 我们假设集合\{x\in X: P(x) \text{ is false}\}非空. 由于\{x\in X: P(x) \text{ is false}\}\subseteq X和X是良序集,我们知道\{x\in X: P(x) \text{ is false}\}是良序,由于假设其非空,故其有最小元,我们记为x_0. 这说明对一切x\in X,对一切x<_X x_0P(x)为真. 但从命题的蕴涵关系我们知P(x_0)为真,这与x_0\{x\in X: P(x) \text{ is false}\}的最小元相矛盾,这个矛盾说明我们的假设不成立,进而\{x\in X: P(x) \text{ is false}\}为空集,于是对一切x\in XP(x)为真. 这就完成了证明.

 

我们也可以按照习题的提示(这其实也是弱归纳原理证明强归纳原理的思路)来进行证明:考虑集合Y:=\{n\in X : \exists m\in X, m\leqslant_X n\text{ such that } P(m)\text{ is false.}\}. 同理我们知道Y是良序的. 假设Y非空,于是Y存在最小元,我们记为x_0. 即存在x_0\in X,存在m\in X使得m\leqslant_X x_0且P(m)为假的. 而又由于x_0为Y的最小元,这说明对一切x\in X,如果x<_X x_0有:对y\in X,如果y\leqslant_X xP(y)为真. 也即说明:对一切x\in X,如果x<_X x_0P(x)为真,再由归纳假设知P(x_0)为真. 于是我们得到“对一切x\in X,如果x\leqslant_X x_0P(x)为真”. 这明显与x_0\in Y相矛盾,这个矛盾说明我们的假设不成立,于是Y是空集,进而说明对一切x\in X有:对一切y\in X,如果y\leqslant_X x有P(y)为真. 这蕴涵对一切x\in X有P(x)为真.

 

 

一旦构建了自然数集,我们就可以证明“强归纳原理”和“良序原理(命题8.1.4)”是等价的. 虽然不同的逻辑构建道路上是有先后顺序之分的.

这道习题告诉我们,虽然数学归纳法来源于自然数的抽象,但其也可以用于良序集,无须局限于自然数集.

 

 

 

 

 

8.5.11证明:如果Y\cup Y'是良序的,由定义8.5.8知Y\cup Y'是全序的.

 

如果Y\cup Y'是全序的,对任意Y\cup Y'的非空子集S\subseteq Y\cup Y',S也是全序集.

我们定义集合M:=S\backslash Y'. 对任意元素m\in M,即有m\in Sm\notin Y',进而有m\in Y\cup Y'm\notin Y',进而m\in Y. 于是我们看到M\subseteq Y. 故M也为良序集.

而我们有S\cap Y'也为良序集. 而有恒等式S=(S\backslash Y')\cup(S\cap Y')=M\cup(S\cap Y').

当M或S\cap Y'中有一个为空集时,显然S是良序的,即有最小元.

当M和S\cap Y'均非空,由于上面论证了它们皆为良序,记a:=\min(M), b:=\min(S\cap Y'). 由于S是全序的,则有“a\leqslant b或者b\leqslant a”.

如果为a\leqslant b,那么对任意元素s\in S,我们假设有s<a,如果s\in M就会与a是M的最小元相矛盾,于是在假设s<a前提下有s\in S\cap Y',进而有s<a\leqslant b,即s<b,这又与b为S\cap Y'的最小元相矛盾,综上我们的假设s<a不成立. 故不存在s\in S使得s<a,于是此时a为S的最小元.

同理当b\leqslant a我们可以证明b为S的最小元.

综上Y\cup Y'为良序的.

命题得证.

 

 

 

 

 

8.5.12证明:勘误:习题8.5.12中第三行“如果x\leqslant_X x'”应为“如果x<_X x'”.

自反性:对任意(x, y)\in X\times Y,有x=xy\leqslant_Y y,于是有(x, y)\leqslant_{X\times Y} (x, y).

反对称性:对任意(x_1, y_1), (x_2, y_2)\in X\times Y,如果(x_1, y_1)\leqslant_{X\times Y} (x_2, y_2)(x_2, y_2)\leqslant_{X\times Y} (x_1, y_1),则只能是“(x_1=x_2y_1\leqslant_Y y_2)且(x_2=x_1y_2\leqslant_Y y_1)”,于是有x_1=x_2, y_1=y_2. 故(x_1, y_1)=(x_2, y_2).

传递性:对任意(x_1, y_1), (x_2, y_2), (x_3, y_3)\in X\times Y,如果(x_1, y_1)\leqslant_{X\times Y} (x_2, y_2)(x_2, y_2)\leqslant_{X\times Y} (x_3, y_3),我们有四种情形:“(x_1<_Xx_2x_2<_Xx_3)或(x_1<_Xx_2且(x_2=x_3y_2\leqslant_Y y_3))或((x_1=x_2y_1\leqslant_Y y_2)且x_2<_Xx_3)或((x_1=x_2y_1\leqslant_Y y_2)且(x_2=x_3y_2\leqslant_Y y_3))”. 但无论何种情形总有(x_1, y_1)\leqslant_{X\times Y} (x_3, y_3).

综上,序关系\leqslant_{X\times Y}使得X\times Y为偏序集.

 

我们设X, Y均为全序. 对任意(x_1, y_1), (x_2, y_2)\in X\times Y,由于X为全序,则我们有x_1\leqslant_X x_2或者x_2\leqslant_X x_1. 不失一般性,我们只考虑x_1\leqslant_X x_2.       如果x_1\neq x_2,则有x_1<_X x_2,进而(x_1, y_1)\leqslant_{X\times Y} (x_2, y_2);如果x_1=x_2,由于Y为全序集,则我们有y_1\leqslant_Y y_2或者y_2\leqslant_Y y_1,同不失一般性只考虑y_1\leqslant_Y y_2,于是我们可以看到x_1=x_2y_1\leqslant_Y y_2,此时(x_1, y_1)\leqslant_{X\times Y} (x_2, y_2).

综上,此时X\times Y为全序集.

 

我们设X, Y均为良序,进而X, Y均为全序,由上论证我们知X\times Y为全序.

对任意X\times Y的非空子集A\subseteq X\times Y. 我们有非空集合\{x : (x, y)\in A\}\subseteq X,由于X为良序进而其子集\{x : (x, y)\in A\}良序,我们记其最小元a:=\min(\{x : (x, y)\in A\}),进而有非空集合\{(x, y)\in A : x=a\},进而我们有非空集合\{y: (x, y)\in\{(x, y)\in A : x=a\}\}\subseteq Y,同理我们可以记其最小元b:=\min(\{y: (x, y)\in\{(x, y)\in A : x=a\}\}). 于是我们找到了一个元素(a, b)\in X\times Y. 现在就来证明其为A的最小元.

我们假设存在某(x, y)\in A使得(x, y)<_{X\times Y}(a, b),即(x, y)\leqslant_{X\times Y}(a, b)(x, y)\neq (a, b),进一步地有(x<_X a或(x=a且y\leqslant_Y b))且(x\neq ay\neq b),化简此逻辑表达式后我们将得到“x<_X a或(x<_X ay\neq b)或(x=ay<_Y b)”.

x<_X a和(x<_X ay\neq b)明显与a定义相矛盾,故为假. 于是只剩下(x=ay<_Y b)为真,这又与b定义相矛盾,于是假设不成立,故元素(a, b)\in X\times Y为A的最小元.

综上此时X\times Y为良序集.

 

 

 

 

 

8.5.13证明:(引用文段是为了帮助理解正式的证明,可以跳过不看)

引理8.5.14的证明开头的直观描述非常符合我们的常规操作,这里遇到的困难是我们不能保证在有限步骤内完成证明,甚至是在可数无限步骤内  (当\{x_0\}的严格上界是至多可数时我们容易证明引理8.5.14的直观操作是行得通的. 不过当\{x_0\}的严格上界是可数时论证稍微麻烦一点,关键是在可以找到[f:\mathbb{N}\rightarrow\{x\in X : x\text{ is a strict upper bound of }\{x_0\}\},f是严格增的.]时论证对\{x_0\}的每个严格上界x_{up}都能找到可数步骤内第n步添加的严格上界f(n)使得x_{up}\leqslant f(n). 这需要一点简单的技巧——先排列好x_{up}g(0), g(1), g(2), ...,然后构造f时就要使得对一切自然数n有g(n)\leqslant f(n)).   而严格证明通过一个技巧性非常强的构造来得到一个好像“用尽”一切严格上界的集合来导出矛盾.

我们考虑集合\{x_0\},其显然以x_0为最小元且为良序且是好集合. 如果是常规操作思路,我们只需要选取一个严格上界(只要有严格上界)添加进\{x_0\}即可. 而按严格证明思路,我们已为x_0指定了一个严格上界s(\{x_0\}),于是我们就得到好集合\{x_0, s(x_0)\},其与常规操作思路得到的集合不同的地方是:常规操作思路给了你选择严格上界的自由,进而带来了不确定性,或者说有无穷种选择道路;而选择公理排除了这种不确定性,给你指定了唯一的道路.

于是我们看到了严格证明是如何使用选择公理绕过了可能无穷重复的步骤:我们在使用选择公理的时候就已经为常规操作思路的可能无穷步中每个步骤指定了应该选择的严格上界,并且每个这样的步骤都可以在原来的好集合基础上添加进选择公理指定的严格上界而形成一个新的好集合. 反过来说好集合如果是有限的意味着此集合也可以看成按常规操作思路在有限步骤内得到(这确实可以证明. 但不是所有好集合都是有限集,我们可以根据习题8.5.10中提到的集合X:=\{1\}\cup\{1-\frac{1}{n} : n\in\mathbb{N}\backslash\{0\}\}来构造一个无限的有严格上界好集合). 然后严格证明就转向证明好的集合的并确实是好集合,于是把由选择公理指定的好集合的并的严格上界加进好集合的并中还是好集合,进而导出矛盾完成证明.

总结上面的讨论就是:其实我们还是在按照书上直观描述的常规操作思路来进行证明,只不过认为是可以从好集合\{x_0\}开始可以添加无穷多的严格上界进集合而形成一系列好集合(由于原来的好集合基础上添加进选择公理指定的严格上界可以形成一个新的好集合). 使用选择公理是为了让我们确定每次添加的严格上界是哪个. 由于所有好集合的由选择公理指定的严格上界都包含在另一个好集合中,故通过好集合的并一次性完成好集合\{x_0\}所有严格上界的添加,进而绕过了常规操作只能进行有限步骤的限制. 并且我们知道了: 反过来,我们有好集合如果是有限的意味着此集合也可以看成按常规操作思路在有限步骤内得到(这确实可以证明).

有了上面的讨论,我们应该可以断定(拥有相同最小元x_0的)两个好集合A和B应该有一个是由另一个反复添加严格上界得到的,否则就有使用选择公理的时候为A和B的交集指定两个不同的严格上界,这是不可能的. 我们以此为突破口,用反证法证明此事.

Y, Y'是好集合.

我们大假设Y\backslash Y', Y'\backslash Y均非空(这说明Y\subseteq Y'Y'\subseteq Y均不成立). 由于Y, Y'均为良序,于是我们看到Y\backslash Y', Y'\backslash Y也均为良序. 由于Y\backslash Y', Y'\backslash Y均非空,我们可以取Y\backslash Y'的最小元y_0Y'\backslash Y的最小元y_1. 于是我们看到y_0\neq y_1.

由于Y, Y'均为好集合,进而有s(\{y\in Y : y<y_0\})=y_0s(\{y\in Y' : y<y_1\})=y_1. 我们已知y_0\neq y_1,进而有

\{y\in Y : y<y_0\}\neq\{y\in Y' : y<y_1\}

而我们有\{y\in Y : y<y_0\}=\{y\in Y\cap Y' : y<y_0\}\cup\{y\in Y\backslash Y' : y<y_0\}\{y\in Y' : y<y_1\}=\{y\in Y\cap Y' : y<y_1\}\cup\{y\in Y'\backslash Y : y<y_1\}.

因为Y\backslash Y'的最小元是y_0Y'\backslash Y的最小元是y_1,故同时有\{y\in Y\backslash Y' : y<y_0\}=\emptyset\{y\in Y'\backslash Y : y<y_1\}=\emptyset.

进而我们得到

\{y\in Y\cap Y' : y<y_0\}\neq\{y\in Y\cap Y' : y<y_1\}

这说明了y_0, y_1不可能同时为Y\cap Y'的(严格)上界,否则我们有\{y\in Y\cap Y' : y<y_0\}=Y\cap Y'=\{y\in Y\cap Y' : y<y_1\}.

由于\{y\in Y\cap Y' : y<y_0\}\neq\{y\in Y\cap Y' : y<y_1\},即陈述“\{y\in Y\cap Y' : y<y_0\}\subseteq\{y\in Y\cap Y' : y<y_1\}\{y\in Y\cap Y' : y<y_1\}\subseteq\{y\in Y\cap Y' : y<y_0\}”不成立,这说明:存在y_x\in Y\cap Y'使得y_x<y_0\lnot (y_x<y_1),或存在y'_x\in Y\cap Y'使得y'_x<y_1\lnot (y'_x<y_0).

已知y_x\in Y\cap Y'\subseteq Y'y_1\in Y'\backslash Y\subseteq Y'和Y’为良序(进而Y’为全序),故如果\lnot (y_x<y_1)y_1\leqslant y_x.             同理可知如果\lnot (y'_x<y_0)y_0\leqslant y'_x.

故原来的结论“存在y_x\in Y\cap Y'使得y_x<y_0\lnot (y_x<y_1),或存在y'_x\in Y\cap Y'使得y'_x<y_1\lnot (y'_x<y_0)”可改为:存在y_x\in Y\cap Y'使得y_x<y_0y_1\leqslant y_x,或存在y'_x\in Y\cap Y'使得y'_x<y_1y_0\leqslant y'_x.

这说明我们有y_1\leqslant y_x<y_0y_0\leqslant y'_x<y_1,即y_1<y_0y_0<y_1. 这说明y_0, y_1是可比较的.

不失一般性,我们假设有y_1<y_0. 这说明\{y\in Y\cap Y' : y<y_1\}\subseteq\{y\in Y\cap Y' : y<y_0\},进而由前面讨论知有\{y\in Y' : y<y_1\}\subseteq\{y\in Y : y<y_0\}.

现在考虑\{y\in Y : y<y_1\},容易证明其为良序且以x_0为最小元.于是在使用选择公理的时候为其指定了一个严格上界s(\{y\in Y : y<y_1\})\in X.

\{y\in Y : y<y_1\}\\=\{y\in Y\cap Y' : y<y_1\}\cup\{y\in Y\backslash Y' : y<y_1\}\\=\{y\in Y\cap Y' : y<y_1\}\\=\{y\in Y' : y<y_1\}(因为\{y\in Y\backslash Y' : y<y_1\}\subseteq\{y\in Y\backslash Y' : y<y_0\}=\emptyset).

进而我们看到s(\{y\in Y : y<y_1\})=s(\{y\in Y' : y<y_1\})=y_1.

我们前面说过,严格证明中选择公理的使用使得我们可以从思维方式上不严谨地认为:所有好集合是从好集合\{x_0\}开始不断添加选择公理指定的严格上界进去而形成的,添加的严格上界的数量可以是无穷的. 这当然是有悖常规操作的,因为实际上我们只能添加有限个严格上界.

而如果A是好集合,也确实是可以由对一切x_m\in A\backslash\{x_0\}x_m=s(\{y\in A : y<x_m\})我们可以证明\{y\in A : y<x_m\}也是好集合. 因为我们容易从A是好集合知道\{y\in A : y<x_m\}是以x_0为最小元且良序. 而对一切x\in\{y\in A : y<x_m\}\backslash\{x_0\}s(\{p\in\{y\in A : y<x_m\} : p<x\})(x_m\in A\backslash\{x_0\})=s(\{y\in A : y<x\})=x,只要我们注意到x<x_m.

于是上面这一段很好地验证说明直观“严格证明中选择公理的使用使得我们可以从思维方式上不严谨地认为:所有好集合是从好集合\{x_0\}开始不断添加选择公理指定的严格上界进去而形成的,添加的严格上界的数量可以是无穷的.”还是很可靠的.

于是对于好集合\{y\in Y' : y<y_1\},也即集合\{y\in Y : y<y_1\},由于\{y\in Y' : y<y_1\}\subseteq\{y\in Y : y<y_0\},根据上面不严格思维方式的说明我们有足够的理由相信:\{y\in Y : y<y_0\}是由\{y\in Y' : y<y_1\}不断地添加进选择公理指定的严格上界S_1, S_2, ...(可以有无穷个)而得到的. 这就说明了我们应该有\{y\in Y : y<y_1\}=\{y\in Y : y<S_1\},而S_1\in\{y\in Y : y<y_0\}\subseteq Y. 下面我们就严格做此事.

考虑集合\{y\in Y : y_1\leqslant y\}. 由于y_1<y_0\in Y\backslash Y'\subseteq Y,于是\{y\in Y : y_1\leqslant y\}非空. 由于Y是良序的,故\{y\in Y : y_1\leqslant y\}也是良序的. 于是我们可以取到\{y\in Y : y_1\leqslant y\}的最小元y_2.

现在考虑\{y\in Y : y<y_1\}\{y\in Y : y<y_2\}. 由于y_2\in\{y\in Y : y_1\leqslant y\}y_1\leqslant y_2,进而\{y\in Y : y<y_1\}\subseteq\{y\in Y : y<y_2\}. 我们小假设存在y_3\in Y使得y_3<y_2y_1\leqslant y_3,即y_1\leqslant y_3<y_2. 进而我们看到y_3\in\{y\in Y : y_1\leqslant y\}y_3<y_2,这与y_2\{y\in Y : y_1\leqslant y\}的最小元相矛盾,故小假设不成立,进而对一切y\in Y如果y<y_2那么y_1>y. 这就证明了\{y\in Y : y<y_2\}\subseteq\{y\in Y : y<y_1\}.

综上,我们证明了\{y\in Y : y<y_1\}=\{y\in Y : y<y_2\}.

由于Y为好集合且y_2\in Y\backslash\{x_0\},于是我们看到s(\{y\in Y : y<y_2\})=y_2. 而同时s(\{y\in Y : y<y_2\})=s(\{y\in Y : y<y_1\})=s(\{y\in Y' : y<y_1\})=y_1,于是应该有y_1=y_2. 而已知y_2\in\{y\in Y : y_1\leqslant y\}y_2\in Y,也即y_1\in Y,这明显与y_1\in Y'\backslash Y相矛盾,这个矛盾说明我们的大假设不成立,故有Y\backslash Y', Y'\backslash Y两者至少有一个为空集.

综上,我们知道Y, Y'中一个为另一个的子集.

 

于是我们可以马上看到Y\cap Y'是好的集合.

 

现在我们来证明“Y\Y’的每个元素都是Y’的上界,且Y’\Y的每个元素都是Y的上界.”. 我们将使用在良序集上的强归纳法.

不失一般性,我们假设Y'\subseteq Y.

于是“Y’\Y的每个元素都是Y的上界.”是空真成立的.

而当Y\backslash Y'为空集时同理“Y\Y’的每个元素都是Y’的上界.”是空真成立的.

于是我们只需要考虑Y\backslash Y'非空.

我们容易知Y\backslash Y'为良序集,由于知Y\backslash Y'非空,我们可以取其最小元y_c.

由于Y'是以元素x_0为最小元的良序集,于是强归纳原理适用于集合Y'.

归纳基始:由y_c\in Y\backslash Y',而x_0\in Y, Y',于是我们看到y_c\neq x_0. 而同时x_0为好集合Y的最小元,简单的推理可知应有x_0<y_c. 这就完成了归纳基始.

x_r\in Y'. 归纳假设:对任意x\in Y',如果x<x_r那么x<y_c(我们考虑x<y_c是合理的,因为它们都属于好集合Y).

我们现在要证明也有x_r<y_c. 反证:

假定有y_c\leqslant x_r. 由于x_r\in Y'y_c\in Y\backslash Y',于是不可能x_r=y_c. 于是从y_c\leqslant x_r得到y_c<x_r.
而从归纳假设已知:对任意x\in Y',如果x<x_r那么x<y_c,于是我们看到y_c为集合\{y\in Y' : y<x_r\}的严格上界. 这进一步说明有\{y\in Y' : y<x_r\}\subseteq\{y\in Y : y<y_c\}(Y'\subseteq Y).
\{y\in Y : y<y_c\}=\{y\in Y' : y<y_c\}\cup\{Y\backslash Y' : y<y_c\}, 由y_cY\backslash Y'的最小元我们知道\{Y\backslash Y' : y<y_c\}=\emptyset,进而\{y\in Y : y<y_c\}=\{y\in Y' : y<y_c\}. 再由y_c<x_r我们得到\{y\in Y : y<y_c\}\subseteq\{y\in Y' : y<x_r\}.
综上,我们看到\{y\in Y' : y<x_r\}=\{y\in Y : y<y_c\}(Y'\subseteq Y). 进而有s(\{y\in Y' : y<x_r\})=s(\{y\in Y : y<y_c\}). 由于Y, Y'均为好集合,于是有s(\{y\in Y' : y<x_r\})=x_rs(\{y\in Y : y<y_c\})=y_c,进而再由s(\{y\in Y' : y<x_r\})=s(\{y\in Y : y<y_c\})我们得到x_r=y_c. 这是一个矛盾,因为我们有x_r\in Y'y_c\in Y\backslash Y'. 这个矛盾说明我们的假定y_c\leqslant x_r不成立,进而有x_r<y_c.

至此,我们补全了使用强归纳原理所需要的所有步骤,于是乎我们可以陈述:对一切y\in Y'我们都有y<y_c. 而y_cY\backslash Y'的最小元. 我们终于可以陈述:Y\backslash Y'中的每个元素均为Y'的严格上界.

我们完成了习题的证明.


当然,我们也可以按照书上习题hint来进行解答.

a\in Y\cap Y'.

由于Y, Y'都是好的集合,则有x_0\in Y, x_0\in Y',进而x_0\in Y\cap Y'. 而x_0Y, Y'的最小元,进而我们有\{y\in Y : y\leqslant x_0\}=\{y\in Y' : y\leqslant x_0\}=\{x_0\}=\{y\in Y\cap Y' : y\leqslant x_0\}. 这就完成了归纳基始.

 

归纳假设:对一切m\in Y\cap Y',如果m<a就有\{y\in Y : y\leqslant m\}=\{y\in Y' : y\leqslant m\}=\{y\in Y\cap Y' : y\leqslant m\}.

进而有\emptyset=\{y\in Y : y\leqslant m\}\backslash\{y\in Y' : y\leqslant m\}=\{y\in Y\backslash Y' : y\leqslant m\};

\emptyset=\{y\in Y' : y\leqslant m\}\backslash\{y\in Y : y\leqslant m\}=\{y\in Y'\backslash Y : y\leqslant m\}.

 

我们先证明集合\{n\in Y\backslash Y' : n<a\}是空集,因为下面的等式变换要用到.

反证,假设\{n\in Y\backslash Y' : n<a\}不是空集,于是存在y_a\in\{n\in Y\backslash Y' : n<a\}. 进而我们看到y_a<a.

我们容易知\{n\in Y\backslash Y' : n<a\}是良序,于是我们看到其最小元y_c\leqslant y_a<a,即y_c<a.

由于Y, Y'是好集合,于是s(\{y\in Y : y<y_c\})=y_c, \{y\in Y' : y<a\}=a(当a=x_0\{n\in Y\backslash Y' : n<a\}显然是空集,故只需考虑a\neq x_0). 于是有\{y\in Y : y<y_c\}\neq\{y\in Y' : y<a\}.

\{y\in Y : y<y_c\}\neq\{y\in Y' : y<a\}说明陈述“\{y\in Y : y<y_c\}\subseteq\{y\in Y' : y<a\}\{y\in Y' : y<a\}\subseteq\{y\in Y : y<y_c\}”不成立.

\{y\in Y : y<y_c\}=\{y\in Y\cap Y' : y<y_c\}\cup\{y\in Y\backslash Y' : y<y_c\}以及y_c\{n\in Y\backslash Y' : n<a\}的最小元,我们知道\{y\in Y\backslash Y' : y<y_c\}是空集,进而\{y\in Y : y<y_c\}=\{y\in Y\cap Y' : y<y_c\}. 于是陈述“\{y\in Y : y<y_c\}\subseteq\{y\in Y' : y<a\}\{y\in Y' : y<a\}\subseteq\{y\in Y : y<y_c\}”不成立可改为:陈述“\{y\in Y\cap Y' : y<y_c\}\subseteq\{y\in Y' : y<a\}\{y\in Y' : y<a\}\subseteq\{y\in Y\cap Y' : y<y_c\}”不成立.

\{y\in Y' : y<a\}=\{y\in Y\cap Y' : y<a\}\cup\{y\in Y'\backslash Y : y<a\}并且\{y\in Y\cap Y' : y<y_c\}中元素不可能属于\{y\in Y'\backslash Y : y<a\},故由\{y\in Y\cap Y' : y<y_c\}\subseteq\{y\in Y' : y<a\}简单讨论可知有\{y\in Y\cap Y' : y<y_c\}\subseteq\{y\in Y\cap Y' : y<a\};并且\{y\in Y\cap Y' : y<a\}\subseteq\{y\in Y' : y<a\}. 进而陈述“\{y\in Y\cap Y' : y<y_c\}\subseteq\{y\in Y' : y<a\}\{y\in Y' : y<a\}\subseteq\{y\in Y\cap Y' : y<y_c\}”不成立可改为:陈述“\{y\in Y\cap Y' : y<y_c\}\subseteq\{y\in Y\cap Y' : y<a\}\{y\in Y\cap Y' : y<a\}\subseteq\{y\in Y\cap Y' : y<y_c\}”不成立.

但是由于y_c<a,我们看到\{y\in Y\cap Y' : y<y_c\}\subseteq\{y\in Y\cap Y' : y<a\}是成立的,于是\{y\in Y\cap Y' : y<a\}\subseteq\{y\in Y\cap Y' : y<y_c\}”不成立.

由于\{y\in Y\cap Y' : y<a\}\subseteq\{y\in Y\cap Y' : y<y_c\}”不成立,这说明存在y_x\in Y\cap Y'使得y_c\leqslant y_x<a(y_c\in Y\backslash Y'),这明显与我们在归纳假设得到的\emptyset=\{y\in Y\backslash Y' : y\leqslant m\}相矛盾,故假设不成立,进而\{n\in Y\backslash Y' : n<a\}是空集.

 

那么对a,有:

\{y\in Y : y\leqslant a\}\\\\=\{y\in Y : y<a\}\cup\{a\}\\\\=\bigcup\{\{y\in Y : y\leqslant m\} : m\in\{n\in Y : n<a\}\}\cup\{a\}\\\\=\bigcup\{\{y\in Y : y\leqslant m\} : m\in\{n\in Y\cap Y' : n<a\}\cup\{n\in Y\backslash Y' : n<a\}\}\cup\{a\}\\\\=\bigcup\{\{y\in Y : y\leqslant m\} : m\in\{n\in Y\cap Y' : n<a\}\}\cup\{a\}\\\\=\bigcup\{\{y\in Y\cap Y' : y\leqslant m\} : m\in\{n\in Y\cap Y' : n<a\}\}\cup\{a\}\\\\=\{y\in Y\cap Y' : y<a\}\cup\{a\}\\\\=\{y\in Y\cap Y' : y\leqslant a\}

同理可证\{y\in Y' : y\leqslant a\}=\{y\in Y\cap Y' : y\leqslant a\}.

这就完成了归纳. (其中\{y\in Y : y<a\}\cup\{a\}=\bigcup\{\{y\in Y : y\leqslant m\} : m\in\{n\in Y : n<a\}\}\cup\{a\}所做的变换是为了后面步骤用上归纳假设)

故由强归纳原理知对一切a\in Y\cap Y'\{y\in Y : y\leqslant a\}=\{y\in Y' : y\leqslant a\}=\{y\in Y\cap Y' : y\leqslant a\}.

 

现在来证Y\cap Y'是好的集合.

由于x_0\in Y\cap Y',我们假设存在x'\in Y\cap Y'使得x'<x_0,即存在x'\in Y使得x'<x_0. 这与x_0是Y的最小元相矛盾(因为Y为好的集合),故假设不成立,即不存在x'\in Y\cap Y'使得x'<x_0,故x_0Y\cap Y'的最小元.

由于Y\cap Y'\subseteq Y而Y是良序的,故Y\cap Y'也是良序的.

而对一切x\in(Y\cap Y')\backslash\{x_0\},我们有集合\{y\in Y\cap Y' : y<x\}为集合X的子集合,以x_0为最小元,为良序的,进而考虑s(\{y\in Y\cap Y' : y<x\})是合理的,并且s(\{y\in Y\cap Y' : y<x\})=s(\{y\in Y\cap Y' : y\leqslant x\}\backslash\{x\})=s(\{y\in Y : y\leqslant x\}\backslash\{x\})=s(\{y\in Y : y<x\}=x. 进而Y\cap Y'也是好集合.

 

而对任意a\in Y\cap Y',对任意b\in Y\cup Y',如果b\leqslant a,由上论证我们知有b\in\{y\in Y\cup Y' : y\leqslant a\}=\{y\in Y : y\leqslant a\}\cup\{y\in Y' : y\leqslant a\}=\{y\in Y : y\leqslant a\}=\{y\in Y' : y\leqslant a\}=\{y\in Y\cap Y' : y\leqslant a\},故有b\in Y\cap Y'. 进而对一切b\in Y'\backslash Y\subseteq Y\cup Y',对一切a\in Y\cap Y'b\notin Y\cap Y',进而有b>a,即集合Y'\backslash Y中元素均为Y\cap Y'的上界.             同理可证集合Y\backslash Y'中元素均为Y\cap Y'的上界.

我们假设Y'\backslash Y非空,则由Y'为良序的知可取其最小元\min(Y'\backslash Y). 已知Y'为好的集合,那么对(x_0\neq)\min(Y'\backslash Y)\in Y',有\min(Y'\backslash Y)=s(\{y\in Y' : y<\min(Y'\backslash Y)\})=s(\{y\in Y\cap Y' : y<\min(Y'\backslash Y)\})=s(Y\cap Y')(第二个等式把Y分解成Y'\cap YY'\backslash Y后根据\min(Y'\backslash Y)Y'\backslash Y的最小元得到;最后一个等式是由前一段结论得到).             假设Y\backslash Y'非空前提下同理可证\min(Y\backslash Y')=s(Y\cap Y'). 于是我们发现\min(Y\backslash Y')=\min(Y'\backslash Y)\}),即有\min(Y\backslash Y')\in Y'\backslash Y,这是个矛盾. 故说明两个假设不能同时成立,即Y'\backslash YY\backslash Y'中一个为空集,进而我们知道Y'\subseteq YY\subseteq Y'. 不失一般性,我们假设Y'\subseteq Y,那么陈述“Y'\backslash Y的每个元素都是Y的上界”是空真地成立的;而对每个元素x\in Y\backslash Y',有x是Y\cap Y'=Y'的上界.

这就完成了证明.

 

 

 

 

 

8.5.14证明:我们假设X没有最大元,即对任意元素x\in X都存在x'\in X使得x<x'. 设Y是X的有上界的子集,即对任意元素y\in Yy\leqslant x_0(x_0\in X)(即x_0是Y的一个上界). 进而由X没有最大元知存在x'\in X使得x_0<x',进而y<x'. 故Y有严格上界.

如果X的每个全序子集Y都有上界,我们假设X无最大元,由上论证知Y有严格上界. 这明显与引理8.5.14相矛盾,故假设不成立,故X有最大元.

设A为偏序集,B为A子集. 若B有上界但无严格上界的话(这说明B非空,因为空集有严格上界),那么B的所有上界都属于B,那么B必有最大元(简单论证即知上界即为唯一的最大元). 再结合上面的第一段论证我们知道A也有最大元(不一定唯一). 即我们证明了:设A为偏序集,B为A子集. 若B有上界但无严格上界的话A和B均有最大元,B的唯一最大元即为其上界,若A为全序的话其唯一最大元是其上界.

也就是说:一个偏序集的上界如果其属于此偏序集那么此上界就是其唯一最大元;但此偏序集的最大元(不一定唯一)却不一定是其上界,除非其为全序(偏序集为全序时其最大元也是唯一的).

 

 

 

 

 

8.5.15证明:我们沿着提示来尝试证明.

 

一个容易观察到的事实是:

考虑集合\{X\subseteq B : \exists f:X\rightarrow A\text{ is injective}\}. 由于空函数是单射,于是我们看到\emptyset\in\{X\subseteq B : \exists f:X\rightarrow A\text{ is injective}\}.

对任意S\in\{X\subseteq B : \exists f:X\rightarrow A\text{ is injective}\},如果有S\neq B,进而S\subsetneq B,即存在b\in B使得b\notin S. 我们大假设不存在S\cup\{b\}到A的单射. 于是我们看到存在S到A的单射f且不存在S\cup\{b\}到A的单射. 我们小假设S到A的单射f不是满射,即存在a\in A使得对一切x\in Sf(x)\neq a. 于是我们定义函数f':S\cup\{b\}\rightarrow A,如果x\in Sf'(x):=f(x);如果x=bf'(x):=a. 我们容易验证函数f’的定义是成功的,并且容易证明函数f':S\cup\{b\}\rightarrow A是单射,这与我们的大假设相矛盾. 于是在大假设成立的前提下小假设不成立,即S到A的单射f是满射,进而我们得到:S到A的函数f是双射. 进一步知道存在A到S的单射f^{-1},由于S\subseteq B,于是我们可以把函数f^{-1}的值域扩大到B而保持其单射性,也即我们找到了A到B的单射,这与我们的题设“不存在A到B的单射”相矛盾. 于是大假设不成立,即存在S\cup\{b\}到A的单射.

综上,我们证明了:对任意S\in\{X\subseteq B : \exists f:X\rightarrow A\text{ is injective}\},如果S\neq B,那么对任意b\in B\backslash S\neq\emptyset我们有存在S\cup\{b\}到A的单射. 进而如果集合S\in\{X\subseteq B : \exists f:X\rightarrow A\text{ is injective}\}有以\subseteq为序关系的最大元那么最大元只能是集合B.(注意到证明这个事实的过程中已经使用到了条件“不存在A到B的单射”,于是凡是使用到此事实的论证都间接使用到了“不存在A到B的单射”.

 

 

对每个B的子集X\subseteq B,由幂集公理(公理3.10)我们可以考虑所有定义域为X以及值域为A的函数组成的集合A^X.

再由替换公理(公理3.6)以及分类公理我们可以考虑集合F_S:=\{f\in\bigcup\{A^X : X\in 2^B\} : f\text{ is injective}\}. 也即:只要X为B子集,那么X到A的单射函数就属于F_S;并且F_S中元素均为B的某一子集到A的单射函数.

 

 

我们定义一个F_S上的一个关系\leqslant:对任意f, g\in F_Sf\leqslant g当且仅当

f的定义域D_f以及g的定义域D_g我们有D_f\subseteq D_g,且对一切x\in D_ff(x)=g(x).

定义此关系的动机是:1.由前面已经说明的事实知——如果我们知道了存在B的子集X到A的单射f,如果X不等于B,那么我们可以在X到A这个单射f的基础上往X增加一个不同于X中元素的元素x而构建出X\cup\{x\}到A的单射g. 而这样的构建过程必定使得“g的定义域D_g包含f的定义域D_f,且对一切x\in D_ff(x)=g(x)”. 于是对X到A的单射我们不断重复此操作就使得其越来越“接近”B到A的单射;

2.更为关键的是,我们将有:只要有f\leqslant g或者g\leqslant f,那么存在D_f\cup D_g到A的单射. 后面我们将看到这条性质推广满足某种性质的无穷个函数的“并”是单射后,对证明起到关键性作用.

我们接下来证明上述定义的关系\leqslant确实使得F_S为偏序.

  1. 自反性:由于对一切f\in F_Sf=f,于是有f\leqslant f
  2. 反对称性:设f, g\in F_Sf\leqslant g, g\leqslant f. 仔细讨论我们将发现总有f=g
  3. 传递性:设f, g, h\in F_Sf\leqslant g, g\leqslant h. 仔细讨论我们将发现总有f\leqslant h.

于是(F_S, \leqslant)确实是一个偏序集.(实际上对于只由函数构成的集合W,(W, \leqslant)均为偏序集

 

 

接下来我们来证明“f\in F_S是B到A的单射”的一个等价命题.

必要条件:

假设有f\in F_S是B到A的单射. 对一切g\in F_S,如果f\leqslant g,那么对f的定义域D_f以及g的定义域D_g我们有D_f\subseteq D_g,而已经说明“f\in F_S是B到A的单射”以及“并且F_S中元素均为B的某一子集到A的单射函数.”,我们看到B=D_f\subseteq D_g\subseteq B,即D_g=B,再由f\leqslant g要求“对一切x\in D_ff(x)=g(x)”我们知道有g=f. 综上,我们证明了在假设有f\in F_S是B到A的单射的前提下:对一切g\in F_S,如果f\leqslant g那么g=f. 也即在假设有f\in F_S是B到A的单射的前提下不存在g\in F_S使得f<g.

综上,我们证明了:f\in F_S是B到A的单射\LongrightarrowfF_S的最大元.

 

充分条件:

假设fF_S的最大元. 如果f的定义域不是B,由前面已经证明的“对任意S\in\{X\subseteq B : \exists f:X\rightarrow A\text{ is injective}\},如果S\neq B,那么对任意b\in B\backslash S\neq\emptyset我们有存在S\cup\{b\}到A的单射.”(即对定义关系\leqslant说明的第1点)我们可以构建出一个函数g\in F_S使得f<g,这与假设fF_S的最大元相矛盾. 故在假设fF_S的最大元前提下我们有f的定义域是B,即f\in F_S是B到A的单射.

综上,我们证明了:fF_S的最大元\Longrightarrowf\in F_S是B到A的单射.

 

于是我们找到了“f\in F_S是B到A的单射”的一个等价命题:fF_S的最大元.(还可以考虑引理8.5.14给出的F_S无严格上界良序集的最大元与存在B到A的单射的关系,这里的证明由于不涉及到就不展开了.)

 

 

于是我们只需要证明集合F_S有最大元即可. 我们将借助佐恩引理(引理8.5.15)来证明.

由于空函数是单射,故F_S非空. 设P\subseteq F_S是全序集. 我们只需要证明P有上界即可完成证明. 下面就做此事.

 

对任意函数p\in P,记其定义域为D_p. 我们考虑集合\bigcup\{D_p : p\in P\}:对任意x\in\bigcup\{D_p : p\in P\},我们知有对某f\in P使得x\in D_{f},即集合\{p\in P : x\in D_{p}\}非空. 于是根据选择公理我们可以为每一个x\in\bigcup\{D_p : p\in P\}选择一个\{p\in P : x\in D_p\}中的元素并且记此元素为g_x(g_x\in\{p\in P : x\in D_p\}, x\in D_{g_x}).

我们现在来定义一个函数f_{sup}:\bigcup\{D_p : p\in P\}\rightarrow A:对一切x\in\bigcup\{D_p : p\in P\},我们已经为x选择了一个g_x(g_x\in\{p\in P : x\in D_p\}, x\in D_{g_x}),于是我们定义f_{sup}(x):=g_x(x).

现在我们来证明函数f_{sup}:\bigcup\{D_p : p\in P\}\rightarrow A是单射. 设a, b\in\bigcup\{D_p : p\in P\}a\neq b. 于是我们知有f_{sup}(a):=g_a(a)f_{sup}(b):=g_b(b),其中对g_a, g_bg_a\in\{p\in P : a\in D_p\}, a\in D_{g_a}g_b\in\{p\in P : b\in D_p\}, b\in D_{g_b}. 进而有g_a, g_b\in P,由于P为全序,于是我们知道有g_a\leqslant g_b或者g_b\leqslant g_a. 不失一般性,我们只考虑g_a\leqslant g_b,进而由\leqslant定义知道有D_{g_a}\subseteq D_{g_b},于是我们看到a, b\in D_{g_b}. 再由于g_b\in\{p\in P : b\in D_p\}以及P\subseteq F_S我们知道g_b是单射,进而有g_b(a)\neq g_b(b). 再由\leqslant定义知道有g_a(a)=g_b(a). 综上我们看到g_a(a)\neq g_b(b),也即f_{sup}(a)\neq f_{sup}(b).

综上我们证明了:对任意a, b\in\bigcup\{D_p : p\in P\},如果a\neq bf_{sup}(a)\neq f_{sup}(b). 故函数f_{sup}:\bigcup\{D_p : p\in P\}\rightarrow A是单射. 于是f_{sup}\in F_S.

 

而对一切f\in P,1.我们对f的定义域D_f容易知道有D_f\subseteq\bigcup\{D_p : p\in P\}.             2.而对一切x_0\in D_f:我们有f_{sup}(x_0)=g_{x_0}(x_0),其中g_{x_0}\in\{p\in P : x_0\in D_p\}, x_0\in D_{g_{x_0}}. 于是我们看到f, g_{x_0}\in P,由于集合P是全序的,于是我们看到有f\leqslant g_{x_0}或者g_{x_0}\leqslant f. 当f\leqslant g_{x_0}时由\leqslant定义知道有f(x_0)=g_{x_0}(x_0)=f_{sup}(x_0);   当g_{x_0}\leqslant f时,结合\leqslant定义知对一切x\in D_{g_{x_0}}g_{x_0}(x)=f(x). 而我们从f_{sup}定义容易观察到一个事实是“如果x\in D_f那么就有x\in D_{g_x}”,进而对x_0\in D_f,有x_0\in D_{g_{x_0}},进一步有g_{x_0}(x_0)=f(x_0),即有f_{sup}(x_0)=g_{x_0}(x_0)=f(x_0).     综合2.的论述,我们即证明了:对一切x\in D_ff_{sup}(x)=f(x).

结合1.和2.的论述,我们知道:对一切f\in Pf\leqslant f_{sup},进而f_{sup}是P的上界.

 

由佐恩引理我们知道F_S有最大元,由“F_S有最大元”等价命题知存在B到A的单射. 这就完成了证明. \blacksquare

 

 

 

 

以下为对习题8.5.15证明的补充说明,可不看.

回顾上面的证明,我们发现即使没有条件“不存在A到B的单射”,(F_S, \leqslant)也是有最大元,只是最大元不必要是B到A的单射. 换句话说,我们不依赖于条件“不存在A到B的单射”就能用Zorn引理证明(F_S, \leqslant)是有最大元. 一个自然而然的问题就是:为何(F_S, \leqslant)有最大元?(F_S, \leqslant)取到最大元的时候到底意味着什么?

 

而对于任意的f, g\in F_S,我们在偏序关系\leqslant定义的基础上容易证明:f<g当且仅当

f的定义域D_f以及g的定义域D_g我们有D_f\subsetneq D_g,且对一切x\in D_ff(x)=g(x).

 

对任意的f\in F_S,我们希望找一个g\in F_S使得f<g. 于是由上面的讨论知必须满足两点:1.D_f\subsetneq D_g,且2.对一切x\in D_ff(x)=g(x).

其中寻找的策略是:

由第1点我们看到D_f\subsetneq D_g\subseteq B,即D_f\subsetneq B. 于是当D_f=B(即f为B到A的单射)时我们是不能找到这样的g的. 这就是上面已证“f\in F_S是B到A的单射\LongrightarrowfF_S的最大元.”的内容. 于是为了满足第1点,要求函数f的定义域不是B.

于是我们假定f的定义域不是B.

我们发现要满足两点“1.D_f\subsetneq D_g,且2.对一切x\in D_ff(x)=g(x)”是很容易的. 在函数f\in F_S的基础上,往其定义域D_f添加进一些同样映射到A的新元素(即新元素属于B\backslash D_f)后形成的新函数h:D_h\rightarrow A都是满足以上两点的.             并且只要h是单射就有h\in F_S,进而有f<h(因为我们的序关系\leqslant是只定义在集合F_S上的).

综上,我们也即证明了引理0:设f\in F_Sh:X\rightarrow A(X\subseteq B).

h\in F_S, f<h

\Longleftrightarrow

函数f的定义域不是B,且函数h可看成以f为基础按上述策略中方式构造而来,且h是单射.

 

现在,我们可以终于探究一下取到(F_S, \leqslant)的最大元f_m时到底发生了什么?

F_S的最大元f_m的定义域D_{f_m}有:D_{f_m}=BD_{f_m}\neq B.

D_{f_m}=B时,f_mF_S的最大元的原因是简单明了的:因为B中元素全部用到了. 故我们只需考虑D_{f_m}\neq B的情形.

由于函数f_m的定义域不是B,于是对于任何以f_m为基础按上述策略中方式构造而来的函数h:X\rightarrow A(X\subseteq B, D_{f_m}\subsetneq X)(即往f_m定义域D_{f_m}添加进一些同样映射到A的新元素(即新元素属于B\backslash D_{f_m})后形成的新函数),其不可能是单射. 因为如果h是单射,从前面证明的引理0我们容易发现h\in F_S, f<h,这与f_mF_S的最大元相矛盾.

综上,使用反证法,考虑往f_m定义域D_{f_m}只添加进一个同样映射到A的新元素后形成的新函数h:X\rightarrow A(X\subseteq B, D_{f_m}\subsetneq X, X\backslash D_{f_m}=\{x_p\}, x_p\in B\backslash D_{f_m}),我们容易证明函数f_m是满射. 也即函数f_m用尽了A中的元素而导致f_mF_S的最大元.

综上,我们终于知道(F_S, \leqslant)的最大元f_m时到底发生了什么:f_m的定义域是B或者f_m的值域是A,也即函数f_m用尽A, B中的至少一个.

 

 

我很难想象到我在思考的命题“对任意集合S_1, S_2:存在S_1S_2的单射,或者存在S_1S_2的单射”是以这样的方式出现(这个思考曾出现在下面的一个不完整证明1.中),它居然等价于考虑(F_S, \leqslant)是否存在最大元.

由于我们已经证明了(F_S, \leqslant)是一定存在最大元的,于是我们知道存在A到B的单射或者存在B到A的单射. 现在我们终于看清“不存在A到B的单射”作用在哪了.

 

 

于是我们终于可以回答“为何(F_S, \leqslant)有最大元?(F_S, \leqslant)取到最大元的时候到底意味着什么?”. ——(F_S, \leqslant)取到最大元时说明“存在A到B的单射或者存在B到A的单射.”;而为何(F_S, \leqslant)有最大元,只能说只要你承认选择公理其就有最大元. 换句话说,只要你承认选择公理,两个集合之间必定有一个集合的基数小于另一个集合的基数. 这也是本习题的题干已经告诉我们的.

 

 

于是我们也看到了习题的另一个证明思路(代替原证明中证明““f\in F_S是B到A的单射”的一个等价命题是:fF_S的最大元.”):1.同原解答定义(F_S, \leqslant);2.进而同样的论述说明(F_S, \leqslant)有最大元;3.类似的论述证明引理0,进而依据引理0通过类似的论述说明(F_S, \leqslant)取到最大元的意义是“存在A到B的单射或者存在B到A的单射.”;4.简单的论述完成证明.

 

 

 

以下为习题8.5.15的不完全证明或错误证明(思路),可跳过不看.

不完整证明1.:

我们玩一个思维游戏“寻找A和B之间的单射”,只要你能找到A和B之间的任意单射,你就取得胜利.

你首先尽一切努力构造A到B的单射,你为A中的一个元素a匹配一个B中的元素b后,将a从A中标记为已用元素并且将b从B中标记为已用元素(已用元素不可再用),然后对其它未用元素重复上述步骤,只要你“用尽”A中元素时B中还剩未用元素或也恰好用完就成功构造了A到B的单射.(这个构造单射的一般思路是如此符合我们的直觉,以至于很难想到更一般的构造方法) 于是“不存在从A到B的单射函数”说明你总是还未“用尽”A中元素B就已经空了,你按上述思路构造A到B的单射总是失败的!

但是你很聪明,你发现这个游戏结束时A和B中已用元素都是1对1匹配的,于是再一次玩这个游戏时你尝试寻找B到A的单射,你有了上一次游戏寻找A到B的单射失败的经验,你记住了上一次游戏从开始到失败的全部步骤,你就“假装”按原来思路先选B中元素再选A中元素(其实你的头脑思考步骤总是依照上一次游戏过程先选A中元素再选B中元素),最终你取得了和上一次一样游戏结果:B中元素用完了但A中元素未用完,于是你找到了B到A的单射,游戏胜利!

也就是说:在“寻找A和B之间的单射”这个游戏中,当你自己陈述了“不存在从A到B的单射函数”为真时,你也即陈述了“存在从B到A的单射函数”为真. 当然这样说不是很准确,因为这要求这个游戏可以结束,更具体来说是我们总可以按照上述单射构造思路来穷尽A或B中的至少一个. 而当A且B为无限时,我们不能保证这一点,我们需要更强的关于无穷的公理.

 

 

当然一个接着一个地穷尽某个集合的所有元素这个思想实施起来是有非常大的困难的【如果将此思想中的“一个接着一个地穷尽”严格化为我们人类的本能数数(更规范的说即认为可以找到一个序(数数的规则):除了起始元素每个元素都有唯一的前驱和后继,且起始元素有唯一后继),那么这个思想表达的就是“所有集合都是至多可数的”. 这当然在ZF内是不允许的,但或许某个人可以给“一个接着一个地穷尽”另一个严格化定义. 我这里“另一个严格化定义”想表达的是,是否可能将不可数上的无穷处理的如同人类对待有限集.】. 一个具体的例子是自然数集,因为自然数集是按标准序为良序的且每个非零自然数都有唯一前驱(即每个非零自然数都有唯一的前驱和后继,零也有唯一的后继),进而我们根据习题8.5.10“错误证明”中取“递增的序列”的思路用归纳法小心论证就可以证明我们确实可以“一个接着一个地”穷尽(即证明\min(S_n)=n(n\in\mathbb{N}),需要先证明\{i\in\mathbb{N} : i\geqslant n\}=S_n(n\in\mathbb{N}))自然数集(或者直接使用命题8.1.5证明过程).             当然仅仅是良序集是不够的,一个反例就是“X:=\{1\}\cup\{1-\frac{1}{n} : n\in\mathbb{N}\backslash\{0\}\}以及标准大小序\leqslant”. 标准序不能够使集合X:=\{1\}\cup\{1-\frac{1}{n} : n\in\mathbb{N}\backslash\{0\}\}可以“一个接着一个地”穷尽.

于是我们需要转变思路:我们尽可能多(最多可数个)地从集合A和集合B开始隔离出一对一匹配的元素对(x, y)(x\in A, y\in B). 然后从集合A和集合B中剔除已经匹配的元素得到新的集合A_1, B_1,我们将发现集合A_1, B_1保留了集合A和集合B的一些共性进而可以使得这个过程可以不断进行下去,最后我们希望集合B确实是被穷尽了的(事实证明这并不可行,原因在对此不完整证明1.的分析中讲. 如果数学直觉好的话可以看出这是显然的.. 于是接下来的工作就变得简单了. 现在就来做此事.

(这个思路与前面的思路(即一个接一个地穷尽)区别在于我们将借助选择公理帮助我们每次一对一匹配多个元素,进而希望可以绕过前面思路的局限.)

 

 

我们将递归定义一集合对序列(A, B), (A_1, B_1), (A_2, B_2), ...,即(A_n, B_n)_{n=0}^\infty.

 

首先基始定义A_0:=A, B_0:=B. 于是我们看到不存在从A_0B_0的单射.

 

接下来我们将定义A_{1}, B_{1}. 任取A_0B_0的函数f_0:A_0\rightarrow B_0,我们知f_0不是单射.

定义B_{1}:=\{y\in B_0 : \forall x\in A_0\text{ we have }f_0(x)\neq y\}. 即我们将函数f_0:A_0\rightarrow B_0的值域中未被映射到的元素筛选出来.(这里的动机是:如果存在A到B的满射那么习题将是容易证明的. 于是我们必须尝试找到这样一个A到B的满射,虽然直觉告诉我们应该是存在这样的满射的,但在我们真正找到它之前都还只是直觉.)

于是我们看到集合B_{0}^{temp}:=B_0\backslash B_{1}中的每个元素y_{t}\in B_{0}^{temp}均存在一个x_{t}\in A_0使得f_0(x_{t})=y_{t}. 于是由选择公理我们可以为每个元素y_{temp}\in B_{0}^{temp}选择一个x_{temp}\in A_0使得f_0(x_{temp})=y_{temp},即存在选择函数C_{0}:B_{0}^{temp}\rightarrow A_0使得对每个元素y_{temp}\in B_{0}^{temp}f_0(C_{0}(y_{temp}))=y_{temp}.             由于已经定义C_{0},故我们可以把函数C_{0}:B_{0}^{temp}\rightarrow A_0的值域限定为\{C_{0}(y) : y\in B_{0}^{temp}\}而不构成循环论证,即存在函数C_{0}:B_{0}^{temp}\rightarrow \{C_{0}(y) : y\in B_{0}^{temp}\}使得对每个元素y_{temp}\in B_{0}^{temp}f_0(C_{0}(y_{temp}))=y_{temp}. 显然函数C_{0}:B_{0}^{temp}\rightarrow \{C_{0}(y) : y\in B_{0}^{temp}\}是满射. 我们假设函数C_{0}:B_{0}^{temp}\rightarrow \{C_{0}(y) : y\in B_{0}^{temp}\}不是单射,即存在y_1, y_2\in B_{0}^{temp}使得y_1\neq y_2C_{0}(y_1)=C_{0}(y_2). 由于我们已经知道“对每个元素y_{temp}\in B_{0}^{temp}f_0(C_{0}(y_{temp}))=y_{temp}”于是我们看到f_0(C_{0}(y_1))=y_1, f_0(C_{0}(y_2))=y_2,进而由C_{0}(y_1)=C_{0}(y_2)知道f_0(C_{0}(y_1))=f_0(C_{0}(y_2)),即y_1=y_2,这与y_1\neq y_2相矛盾,故我们的假设不成立,于是函数C_{0}:B_{0}^{temp}\rightarrow \{C_{0}(y) : y\in B_{0}^{temp}\}是单射. 综上函数C_{0}:B_{0}^{temp}\rightarrow \{C_{0}(y) : y\in B_{0}^{temp}\}是双射,至此我们终于在集合对A_0, B_0隔离出一批一对一匹配的元素对(x, y)(x\in A_0, y\in B_0).

接下来就是构建A_{1}. 我们已经将函数f_0:A_0\rightarrow B_0的值域中未被映射到的元素筛选出来形成集合B_{1},现在我们目的是要尽力找到一个A到B的满射,于是我们应该将A_0中已经在双射C_{0}:B_{0}^{temp}\rightarrow \{C_{0}(y) : y\in B_{0}^{temp}\}使用到的元素剔除掉,进而使得我们能继续使用相同的技巧(继续使用此技巧当然是有前提的)成批隔离出A和B之间的一对一匹配的元素对. 于是我们定义A_{1}:=A_0\backslash \{C_{0}(y) : y\in B_{0}^{temp}\}.

于是我们转向考虑A_{1}, B_{1}是否可以使用相同的技巧,具体来说就是考虑是否存在A_{1}B_{1}的单射,我们希望是不存在此单射.             反证法:假设存在A_{1}B_{1}的单射F_1. 我们考虑由C_0F_1拼凑起来的函数F:A\rightarrow B:对任意x\in A,如果x\in\{C_{0}(y) : y\in B_{0}^{temp}\}\subseteq A_0我们定义F(x):=C_{0}^{-1}(x)(由于已证C_{0}是双射,使用其逆函数没有问题);如果x\in A_1,我们定义F(x):=F_1(x). 由于A=(A_0\backslash \{C_{0}(y) : y\in B_{0}^{temp}\})\cup\{C_{0}(y) : y\in B_{0}^{temp}\}\emptyset=(A_0\backslash \{C_{0}(y) : y\in B_{0}^{temp}\})\cap\{C_{0}(y) : y\in B_{0}^{temp}\}我们容易知函数F:A\rightarrow B是定义成功了的. 现在我们来证明F:A\rightarrow B是单射:对任意x_1, x_2\in A,由“A=(A_0\backslash \{C_{0}(y) : y\in B_{0}^{temp}\})\cup\{C_{0}(y) : y\in B_{0}^{temp}\}\emptyset=(A_0\backslash \{C_{0}(y) : y\in B_{0}^{temp}\})\cap\{C_{0}(y) : y\in B_{0}^{temp}\}”我们可以分四种情况讨论——1.x_1, x_2\in\{C_{0}(y) : y\in B_{0}^{temp}\},那么F(x_1)\neq F(x_2)是由C_{0}是双射保证的;2.x_1, x_2\in A_1=(A_0\backslash \{C_{0}(y) : y\in B_{0}^{temp}\}),那么F(x_1)\neq F(x_2)是由F_1是单射保证的;3.x_1\in\{C_{0}(y) : y\in B_{0}^{temp}\}x_2\in A_1=(A_0\backslash \{C_{0}(y) : y\in B_{0}^{temp}\}),我们从函数值域可以看到F(x_1)\in B_{0}^{temp}=B_0\backslash B_{1}, F(x_2)\in B_1,进而我们看到只能有F(x_1)\neq F(x_2);4.x_2\in\{C_{0}(y) : y\in B_{0}^{temp}\}x_1\in A_1=(A_0\backslash \{C_{0}(y) : y\in B_{0}^{temp}\})的情形类情形3.   至此我们终于证明了F:A\rightarrow B是单射,这与我们题设“不存在从A_0B_0的单射.”相矛盾,故我们看到我们的假设不成立,进而不存在A_{1}B_{1}的单射.

综上,我们看到:对自然数0,我们根据对(A_n, B_n)_{n=0}^0使用选择公理定义出了(A_1, B_1)并且知不存在A_{1}B_{1}的单射.

 

归纳假设已经按上述同样的方式一步一步(这是确实可行的,因为我们前面已经讨论了如何一步一步地穷尽自然数集)定义好(A_n, B_n)_{n=0}^N(N\in\mathbb{N}),于是我们也能看到不存在A_nB_n(n\in\mathbb{N}, n\leqslant N)的单射.

接下来我们将定义A_{n+1}, B_{n+1}. 任取A_nB_n的函数f_n:A_n\rightarrow B_n,由归纳假设我们知f_n不是单射.

定义B_{n+1}:=\{y\in B_n : \forall x\in A_n\text{ we have }f_n(x)\neq y\}. 即我们将函数f_n:A_n\rightarrow B_n的值域中未被映射到的元素筛选出来.

于是我们看到集合B_{n}^{temp}:=B_n\backslash B_{n+1}中的每个元素y_{t}\in B_{n}^{temp}均存在一个x_{t}\in A_n使得f_n(x_{t})=y_{t}. 于是由选择公理我们可以为每个元素y_{temp}\in B_{n}^{temp}选择一个x_{temp}\in A_n使得f_n(x_{temp})=y_{temp},即存在选择函数C_{n}:B_{n}^{temp}\rightarrow A_n使得对每个元素y_{temp}\in B_{n}^{temp}f_n(C_{n}(y_{temp}))=y_{temp}.             由于已经定义C_{n},故我们可以把函数C_{n}:B_{n}^{temp}\rightarrow A_n的值域限定为\{C_{n}(y) : y\in B_{n}^{temp}\}而不构成循环论证,即存在函数C_{n}:B_{n}^{temp}\rightarrow \{C_{n}(y) : y\in B_{n}^{temp}\}使得对每个元素y_{temp}\in B_{n}^{temp}f_n(C_{n}(y_{temp}))=y_{temp}. 显然函数C_{n}:B_{n}^{temp}\rightarrow \{C_{n}(y) : y\in B_{n}^{temp}\}是满射. 我们假设函数C_{n}:B_{n}^{temp}\rightarrow \{C_{n}(y) : y\in B_{n}^{temp}\}不是单射,即存在y_1, y_2\in B_{n}^{temp}使得y_1\neq y_2C_{n}(y_1)=C_{n}(y_2). 由于我们已经知道“对每个元素y_{temp}\in B_{n}^{temp}f_n(C_{n}(y_{temp}))=y_{temp}”于是我们看到f_n(C_{n}(y_1))=y_1, f_n(C_{n}(y_2))=y_2,进而由C_{n}(y_1)=C_{n}(y_2)知道f_n(C_{n}(y_1))=f_n(C_{n}(y_2)),即y_1=y_2,这与y_1\neq y_2相矛盾,故我们的假设不成立,于是函数C_{n}:B_{n}^{temp}\rightarrow \{C_{n}(y) : y\in B_{n}^{temp}\}是单射. 综上函数C_{n}:B_{n}^{temp}\rightarrow \{C_{n}(y) : y\in B_{n}^{temp}\}是双射,至此我们终于在集合对A_n, B_n隔离出一批一对一匹配的元素对(x, y)(x\in A_n, y\in B_n).

接下来就是构建A_{n+1}. 我们已经将函数f_n:A_n\rightarrow B_n的值域中未被映射到的元素筛选出来形成集合B_{n+1},现在我们要尽力找到一个A到B的满射,于是我们应该将A_n中已经在双射C_{n}:B_{n}^{temp}\rightarrow \{C_{n}(y) : y\in B_{n}^{temp}\}使用到的元素剔除掉,进而使得我们能继续使用相同的技巧(继续使用此技巧当然是有前提的)成批隔离出A和B之间的一对一匹配的元素对. 于是我们定义A_{n+1}:=A_n\backslash \{C_{n}(y) : y\in B_{n}^{temp}\}.

于是我们转向考虑A_{n+1}, B_{n+1}是否可以使用相同的技巧,具体来说就是考虑是否存在A_{n+1}B_{n+1}的单射,我们希望是不存在此单射.             反证法:假设存在A_{n+1}B_{n+1}的单射F_{n+1}. 我们考虑由C_0, C_1, ..., C_n(其是形成(A_n, B_n)_{n=0}^N(N\in\mathbb{N})的过程中定义的双射)和F_{n+1}类似拼凑起来的函数F:A\rightarrow B,类似的论述(论述是繁琐但思路是简单的,这里不再展开,留给读者自验,参见下图《递归定义中各集合以及函数之间的关系》)我们将证明F:A\rightarrow B是单射,这与我们题设“不存在从A_0B_0的单射.”相矛盾,故我们看到我们的假设不成立,进而不存在A_{n+1}B_{n+1}的单射.

《递归定义中各集合以及函数之间的关系》

(   此图是为理清图片上面一段F:A\rightarrow B是单射的证明.

  • 第一列从上到下是A_0, ... , A_{n+1}.
  • 第二列从上到下是B_0, ... , B_{n+1},中间的\cup表示的是B_{0}\supseteq B_{1}\supseteq B_{2}\supseteq ... \supseteq B_{n}\supseteq B_{n+1},括号内的f_0表示的是B_1f_0选取有关(其余类推).
  • 第三列从上到下是双射函数C_0, ... , C_{n+1}.
  • 第四列的S_0表示的是C_0的象(即\{C_{0}(y) : y\in B_0\backslash B_{1}\}),S_1, S_2, ... ,S_n, S_{n+1}依此类推.   )

至此,我们看到:对自然数N,我们根据(A_n, B_n)_{n=0}^N使用选择公理定义出了(A_{n+1}, B_{n+1})并且知不存在A_{n+1}B_{n+1}的单射.

 

由强归纳原理,我们确实是完成了归纳定义集合对序列(A_n, B_n)_{n=0}^\infty,并且知不存在A_{n}B_{n}的单射.

 

 

由上面的归纳定义过程我们将看到两个链:

A\supseteq A_1\supseteq ... \supseteq A_n \supseteq ...

以及

B\supseteq B_1\supseteq ... \supseteq B_n \supseteq ...

对于上面两链任何一个链,容易多重归纳证明其链上元素组成的集合都是全序集. 我们假设两链均有最大元,记A\supseteq A_1\supseteq ... \supseteq A_n \supseteq ... \supseteq\emptyset的最大元为A_m以及记B\supseteq B_1\supseteq ... \supseteq B_n \supseteq ... \supseteq\emptyset的最大元为B_q(m, q\in\mathbb{N}).

我们逐个分析当链取到最大元的时候发生了什么.

  1. 首先分析A\supseteq A_1\supseteq ... \supseteq A_n \supseteq ... \supseteq\emptyset取到最大元A_m发生了什么. 我们已经说明“容易多重归纳证明其链上元素组成的集合都是全序集”,于是当自然数n\geqslant m时我们总有A_n=A_m. 由上图《递归定义中各集合以及函数之间的关系》我们很快就可以得到(不嫌繁琐亦可逐个递归层级分析得到):对一切自然数n\geqslant mA_n=A_0\backslash(S_0\cup S_1\cup ... \cup S_{n-1})=A_0\backslash(S_0\cup S_1\cup ... \cup S_{m-1})=A_m,即A_0\backslash(S_0\cup S_1\cup S_{m-1}\cup ... \cup S_{n-1})=A_0\backslash(S_0\cup S_1\cup ... \cup S_{m-1}). 再由《递归定义中各集合以及函数之间的关系》观察到S_k(k\in\mathbb{N})均在A_0中,进而说明对一切自然数n\geqslant mS_{m}, ... , S_{n-1}均为空集,而由S_k(k\in\mathbb{N})表示的是C_k的象我们进一步看到C_{m}, ... , C_{n-1}均为空函数,再由递归定义过程中C_k(k\in\mathbb{N})定义我们知其定义域B_m\backslash B_{m+1}, ... ,B_{n-1}\backslash B_n均为空集,再由链B\supseteq B_1\supseteq ... \supseteq B_n \supseteq ... \supseteq\emptyset我们知道有B_m=B_{m+1}=...=B_{n-1}=B_n. 由于是对一切自然数n\geqslant mB_m=B_{m+1}=...=B_{n-1}=B_n,我们就发现B_m就是B\supseteq B_1\supseteq ... \supseteq B_n \supseteq ... \supseteq\emptyset的最大元B_q,即B_m=B_q.             综上,这说明了在序列(A_n, B_n)_{n=0}^\infty中,当A_n取到其最大元的时候B_n也已取到了最大元.
  2. 再来分析B\supseteq B_1\supseteq ... \supseteq B_n \supseteq ... \supseteq\emptyset取到最大元B_q发生了什么. 类似的分析我们将得到:当自然数n\geqslant q时我们总有B_n=B_q. 由递归定义中对B_k(k\in\mathbb{N})的定义我们和“当自然数n\geqslant q时我们总有B_n=B_q.”进一步知:对自然数q+1\geqslant q时我们有B_{q+1}=\{y\in B_q : \forall x\in A_q\text{ we have }f_q(x)\neq y\}=B_q,即对一切y\in B_q我们总有陈述“对一切x\in A_qf_q(x)\neq y”成立.             而由前面归纳定义我们知道函数f_q:A_q\rightarrow B_q为从A_qB_q的非单射函数,故A_q不可能为空集(因为空函数是单射). 于是我们可以取一个元素x_r\in A_q,进而由函数定义我们知道:“存在y_r\in B_q使得有f_q(x_r)=y_r”成立.”,故我们知道“对一切y\in B_q我们总有陈述“对一切x\in A_qf_q(x)\neq y”成立.”只能是空真的成立的,即论域B_q是空集【到这一步我们终于从上面递归构造中看清:“不存在A到B的单射”是如何蕴涵着“A中元素还未用尽时B中元素就已经用尽”这样的思想.】.             综上,在序列(A_n, B_n)_{n=0}^\infty中,当B_n取到其最大元B_q的时候B_q=\emptyset.

进一步的分析我们容易发现当B_n取到最大元B_q的时候A_n也恰好取到最大元A_m,于是其实我们只需假设:链B\supseteq B_1\supseteq ... \supseteq B_n \supseteq ...有最大元.

(至此证明不下去了)

 

 

 

对不完整证明1.的分析:我们发现链B\supseteq B_1\supseteq ... \supseteq B_n \supseteq ...不一定能取到最大元(于是根本不可能使用Zorn引理),也即B中元素不一定可以按照上述思路取完. 一个例子是当上述递归定义中的f_0, f_1, ..., f_n, ...的象均为单元素集时,B中元素是被一个接着一个取的,这意味着B为无限集时B中元素是取不完的.

而这个证明思路的适用范围也是小的可怜,其只对B为有限集的情形有效. 究其原因是:此证明思路极度依赖f_0, f_1, ..., f_n, ...的选取,我们希望f_0, f_1, ..., f_n, ...的象越大越好,但我们至多也只能是依据依序选择公理说明f_0, f_1, ..., f_n, ...的象可以是可数集, 故B为不可数集的情形上述思路行不通. 而即使f_0, f_1, ..., f_n, ...的象可以是可数集,对B为可数集时此证明思路也行不通. 一个具体的反例就是设A:=\mathbb{R},设B:=\{\{1-\frac{1}{n}+k : n\in\mathbb{N}^+\} : k\in\mathbb{Z}\},此时每个相邻整数之间(如0和1)都有B中可数个元素介于此相邻整数(比如\{1-\frac{1}{n} : n\in\mathbb{N}^+\}\subseteq [0, 1)),于是我们可以巧妙选取f_0, f_1, ..., f_n, ...而使得永远都取不完B中元素.


错误证明思路2.:

我们沿着提示来尝试证明. 当A或者B为有限集时命题是容易证明的,故下面只考虑A和B均为无限集的情形.

 

我们假设0:不存在B到A的单射.

 

考虑集合\{X\subseteq B : \exists f:X\rightarrow A\text{ is injective}\}(如果其有最大元,我们可以证明最大元为B. 但简单分析我们知道无法使用Zorn引理证明其有最大元,因为全序的上界构造不出来.). 由于空函数是单射,于是我们看到\emptyset\in\{X\subseteq B : \exists f:X\rightarrow A\text{ is injective}\}.

对任意S\in\{X\subseteq B : \exists f:X\rightarrow A\text{ is injective}\},由假设0有S\neq B,进而S\subsetneq B,即存在b\in B使得b\notin S. 我们大假设不存在S\cup\{b\}到A的单射. 于是我们看到存在S到A的单射f且不存在S\cup\{b\}到A的单射. 我们小假设S到A的单射f不是满射,即存在a\in A使得对一切x\in Sf(x)\neq a. 于是我们定义函数f':S\cup\{b\}\rightarrow A,如果x\in Sf'(x):=f(x);如果x=bf'(x):=a. 我们容易验证函数f’的定义是成功的,并且容易证明函数f':S\cup\{b\}\rightarrow A是单射,这与我们的大假设相矛盾. 于是在大假设成立的前提下小假设不成立,即S到A的单射f是满射,进而我们得到:S到A的函数f是双射. 进一步知道存在A到S的单射f^{-1},由于S\subseteq B,于是我们可以把函数f^{-1}的值域扩大到B而保持其单射性,也即我们找到了A到B的单射,这与我们的题设“不存在A到B的单射”相矛盾. 于是大假设不成立,即存在S\cup\{b\}到A的单射.

综上,我们证明了:对任意S\in\{X\subseteq B : \exists f:X\rightarrow A\text{ is injective}\},如果S\neq B,那么对任意b\in B\backslash S\neq\emptyset我们有存在S\cup\{b\}到A的单射.

 

我们考虑集合\{X\subseteq B : \exists f:X\rightarrow A\text{ is injective}\}\subseteq组成的偏序集是否有最大元. 我们假设其有最大元X_m. 由于我们已经假设0“不存在B到A的单射”于是我们有X_m\neq B. 由前面证明了“对任意S\in\{X\subseteq B : \exists f:X\rightarrow A\text{ is injective}\},如果S\neq B,那么对任意b\in B\backslash S\neq\emptyset我们有存在S\cup\{b\}到A的单射.”易知我们有X_m\subsetneq X_m\cup\{b\}\in\{X\subseteq B : \exists f:X\rightarrow A\text{ is injective}\}(b\in B\backslash S),这与X_m是集合\{X\subseteq B : \exists f:X\rightarrow A\text{ is injective}\}的最大元相矛盾,故假设不成立,即集合\{X\subseteq B : \exists f:X\rightarrow A\text{ is injective}\}\subseteq组成的偏序集没有最大元.

 

我们再考虑集合\{X\subseteq B : \forall f:X\rightarrow A\text{ is not injective}\}\supseteq组成的偏序集是否有最大元.

我们假设:集合\{X\subseteq B : \forall f:X\rightarrow A\text{ is not injective}\}\supseteq组成的偏序集有最大元X_n. 由于空函数为单射,于是有\emptyset\notin\{X\subseteq B : \forall f:X\rightarrow A\text{ is not injective}\},进而X_n\neq\emptyset,即存在b'\in X_n. 于是由于X_n是集合\{X\subseteq B : \forall f:X\rightarrow A\text{ is not injective}\}\supseteq组成的偏序集组成的最大元,于是我们看到存在X_n\backslash\{b'\}到A的单射. 至此我们看到:存在X_n\backslash\{b'\}到A的单射且不存在X_n到A的单射. 而前面我们已经证明了“对任意S\in\{X\subseteq B : \exists f:X\rightarrow A\text{ is injective}\},如果S\neq B,那么对任意b\in B\backslash S\neq\emptyset我们有存在S\cup\{b\}到A的单射.”,结合“存在X_n\backslash\{b'\}到A的单射”、“X_n\backslash\{b'\}\neq B”以及“b'\in X_n\backslash(\{X_n\backslash\{b'\}\})\subseteq B\backslash(\{X_n\backslash\{b'\}\})”我们容易证明存在X_n到A的单射. 这明显与“X_n是集合\{X\subseteq B : \forall f:X\rightarrow A\text{ is not injective}\}\supseteq组成的偏序集组成的最大元”相矛盾,故我们有假设不成立,即集合\{X\subseteq B : \forall f:X\rightarrow A\text{ is not injective}\}\supseteq组成的偏序集没有最大元.

 

我们容易知道2^B=\{X\subseteq B : \exists f:X\rightarrow A\text{ is injective}\}\cup\{X\subseteq B : \forall f:X\rightarrow A\text{ is not injective}\}.

(至此证明不下去了)

 

 

 

对错误证明思路2.的分析:我原本的思路是设X_1, X_2\subseteq B,且设存在X_1到A的单射和不存在X_2到A的单射. 由前面“不完整证明1.”的经验,我们知道X_1X_2之间“元素个数”相差不可数个. 观察到存在\emptyset到A的单射且不存在B到A的单射且\emptyset\cap B=\emptyset, \emptyset\cup B=B;往空集\emptyset添加某个元素b以及从B中删去元素b,我们发现仍有存在\{b\}到A的单射且不存在B\backslash\{b\}到A的单射且\{b\}\cap B\backslash\{b\}=\emptyset, \{b\}\cup B\backslash\{b\}=B,由此“有限的”对称性于是我大胆假设——“可以把集合B分成两个不相交的等势子集X_1, X_2使得存在X_1到A的单射和不存在X_2到A的单射,进而导出矛盾.”             这里有两个难点——1.如何将任意无限集合分为两个不相交的等势子集X_1, X_2,我不知道这是否是一个开放问题;2.如何证明存在X_1到A的单射和不存在X_2到A的单射.

但是我们容易举出此思路的一个可能反例:不存在\mathbb{R}\backslash\{0\}\mathbb{N}的单射,而\{x\in\mathbb{R} : x>0\}, \{x\in\mathbb{R} : x<0\}是将\mathbb{R}\backslash\{0\}分为不交两部分的等势的集合,而易知不存在\{x\in\mathbb{R} : x>0\}\mathbb{N}的单射且不存在\{x\in\mathbb{R} : x<0\}\mathbb{N}的单射. 之所以其是一个“可能的”反例,是将\mathbb{R}\backslash\{0\}分为两不交等势的两部分不止上述一种方式,这里仅抛砖引玉说明此思路的证明难度(引理8.5.14对此思路无帮助).


错误证明思路3.:

由幂集公理(公理3.10)我们可以考虑所有定义域为B以及值域为A的函数组成的集合A^B.

我们定义一个A^B上的一个关系\leqslant:对任意f, g\in A^Bf\leqslant g当且仅当

f=g或(f(B)\subsetneq g(B),且对一切y\in f(B)我们有\emptyset\neq\{x\in B : g(x)=y\}\subseteq\{x\in B : f(x)=y\}).

定义此关系的动机是:假设从B到A的函数f不是单射,即存在x_1, x_2\in B使得x_1\neq x_2f(x_1)=f(x_2)=y_r\in A. 我们将为元素y_r\in A保留一个映射到它的定义域中元素(比如x_1),也即上述关系定义中出现“\emptyset\neq”的意义. 然后对于其它同样映射到元素y_r\in A的定义域中元素,我们将其映射到A中未映射到的元素(这是可行的,因为不存在A到B的单射,从习题3.6.8我们知道不存在B到A的满射,进而任何B到A的函数都不能用完A中元素.),这个操作过程必然使得函数的象变大(即关系定义中“f(B)\subsetneq g(B)”含义)以及一定满足条件“对一切y\in f(B)\{x\in B : g(x)=y\}\subseteq\{x\in B : f(x)=y\}”.

于是我们不断重复此操作就使得函数越来越“接近”单射.

而关系定义中“f=g”纯粹是为了满足偏序定义.

我们接下来证明上述定义的关系\leqslant确实使得A^B为偏序.

  1. 自反性:由于对一切f\in A^Bf=f,于是有f\leqslant f
  2. 反对称性:设f, g\in A^Bf\leqslant g, g\leqslant f. 于是有陈述“(f=g或(f(B)\subsetneq g(B),且对一切y\in f(B)我们有\emptyset\neq\{x\in B : g(x)=y\}\subseteq\{x\in B : f(x)=y\})且(g=f或(g(B)\subsetneq f(B),且对一切y\in g(B)我们有\emptyset\neq\{x\in B : f(x)=y\}\subseteq\{x\in B : g(x)=y\})))”,将其展开仔细讨论我们将发现总有f=g
  3. 传递性:设f, g, h\in A^Bf\leqslant g, g\leqslant h. 类似于2.反对称性将复合命题陈述展开讨论我们将发现总有f\leqslant h.

于是(A^B, \leqslant)确实是一个偏序集.

 

 

接下来我们来证明“f\in A^B是单射”的一个等价命题.

f\in A^B是单射. 我们假设存在g\in A^B使得f<g. 由f<g和上述关系的定义我们知有“f(B)\subsetneq g(B),且对一切y\in f(B)我们有\emptyset\neq\{x\in B : g(x)=y\}\subseteq\{x\in B : f(x)=y\}”. 由f(B)\subsetneq g(B)g(B)\backslash f(B)\neq\emptyset,即存在y_0\in g(B)\backslash f(B),即存在x_0\in B使得g(x_0)=y_0\in g(B)\backslash f(B). 同时由于f\in A^B是单射我们知\{x\in B : f(x)=f(x_0)\}是单元素集\{x_0\},进而由上述关系的定义知\{x\in B : g(x)=f(x_0)\}也是单元素集\{x_0\},进而有g(x_0)=f(x_0). 至此我们看到f(x_0)=g(x_0)=y_0,但f(x_0)=y_0是一个矛盾,因为f(x_0)\in f(B)y_0\in g(B)\backslash f(B). 这个矛盾说明我们的假设“存在g\in A^B使得f<g.”不成立. 于是我们证明了:f\in A^B是单射\Longrightarrow不存在g\in A^B使得f<g. 进而A^B中单射也是A^B的最大元.

在来假设f\in A^B是单射. 即存在x_1, x_2\in B使得x_1\neq x_2f(x_1)=f(x_2)=y_r\in A. 由于不存在A到B的单射,由习题3.6.8我们知道不存在B到A的满射,进而函数f不能用完A中元素,即A\backslash f(B)\neq\emptyset,即存在y_1\in A\backslash f(B). 我们定义新函数g:B\rightarrow A如下:如果x=x_1g(x):=y_1;否则g(x):=f(x). 我们容易验证有f<g. 这就证明了:f\in A^B是单射\Longrightarrow存在g\in A^B使得f<g. 进而如果f\in A^B不是单射则其不是A^B的最大元.

综上,我们证明了:f\in A^B是单射\LongleftrightarrowfA^B的最大元.(还可以考虑引理8.5.14给出A^B的无严格上界良序集的最大元与存在B到A的单射的关系,这里的证明由于不涉及到就不展开了.)

 

 

我们还是用Zorn引理来进行证明.

由前面论证我们已经知道(A^B, \leqslant)确实是一个非空偏序集. 设F是A^B的一个全序(或考虑为良序)子集.

 

当F是空集或单元素集时F显然有上界,故我们只需考虑F含有两个或两个以上的元素.

现在我们来定义另一个函数f_{sup}:B\rightarrow A如下.

我们考虑集合\bigcup\{f(B) : f\in F\},也即F中所有函数的象的并. 任取F中一个元素记作f_b

  • 如果f_b是F的最大元,那么我们知道此时集合F仍有上界(也即定义f_{sup}:=f_b,此时f_{sup}就是F的上界.).
  • 故我们只需考虑f_b不是F的最大元的情形,也即存在g_b\in F使得f_b<g_b,进而由\leqslant定义知有f_b(B)\subsetneq g_b(B). 故有f_b(B)\subsetneq \bigcup\{f(B) : f\in F\}.             而对一切y\in\bigcup\{f(B) : f\in F\},即有存在某f_y\in F使得y\in f_y(B),我们容易知\displaystyle\bigcap_{f\in F}\{x\in B : f(x)=y\}\subseteq\{x\in B : f_y(x)=y\}.             如果\displaystyle\bigcap_{f\in F}\{x\in B : f(x)=y\}不为空集,于是我们可以选取一个\displaystyle x_y\in\bigcap_{f\in F}\{x\in B : f(x)=y\}来定义f_{sup}(x_y):=y. 于是我们使\bigcup\{f(B) : f\in F\}中每个元素都被映射到了. 而对于B中未在上面操作中使用到的元素可以任意映射到同一个A中未映射到的元素(即不属于\bigcup\{f(B) : f\in F\},由不存在A到B的单射知这确实是可行的)而完成f_{sup}:B\rightarrow A的定义,进而验证f_{sup}是定义成功的且确实是F的上界,进而由Zorn引理完成证明.

(至此证明不下去了)

 

 

 

对错误证明思路3.的分析:关键就是“\displaystyle\bigcap_{f\in F}\{x\in B : f(x)=y\}不为空集”不一定成立. 比如我们考虑一个集族P:={{0, 1, 2, 3, 4, 5, …}、{1, 2, 3, 4, 5, …}、{2, 3, 4, 5, …}、{3, 4, 5, …}、{4, 5, …}、{5, …}、…},其是从自然数集起不断剔除其最小元过程中形成的一系列集合. 显然对任意p_1, p_2\in P都有p_1, p_2非空且有“p_1\subseteq p_2p_2\subseteq p_1”,但是\bigcap P=\emptyset.

但是我们容易证明这样的命题:设P是非空有限集且P中元素均为非空集合,而对一切p_1, p_2\in P有“p_1\subseteq p_2p_2\subseteq p_1”. 那么我们有\bigcap P\neq\emptyset.(证明:用归纳法对P的基数进行归纳)


习题8.5.15的引申:习题8.5.15和引理8.5.14其实有很多相似之处. 比如习题8.5.15要求可以按不完整证明1.中游戏穷尽集合A或集合B,而引理8.5.14要求穷尽严格上界;两者都涉及到无穷步等等. 我们应该可以将习题8.5.15的证明改成类似引理8.5.14的形式,但应该不如使用Zorn引理简便和容易理解,故这里就不展开了.

By the way, 使用Zorn引理的难点在于——1.把某个涉及到无穷步骤的问题转化为关于某个偏序集的最大元的存在问题,并且这个偏序有这样的特点:对于偏序集中满足不是最大元的元素i我们总是容易找到偏序集中另一个元素j使得i<j;2.通常在找全序Y的上界过程中使用到“并公理”.


 

 

 

 

 

8.5.16证明:(提示:此题借助哈斯图有助于我们的理解)

 

首先第一个问题就是集合X的一切偏序是否可以构成一个集合?

回顾集X的偏序的定义,我们知道其是集合X上满足定义8.5.1三条性质的某个二元关系.

而对于X上的二元关系\leqslant_X ,我们可以把所有使得关系x\leqslant_X y成立的x, y\in X替代成有序对(x, y)而形成一个集合R:=\{(x, y) : x, y\in X\text{ and }x\leqslant_X y\}(此集合严格形式是\{(a, b)\in\{\{(x, y) : x\in X\} : y\in X\} : a\leqslant_X b\},容易证明两集合形式表示的是同一个集合,故我们用更容易理解的具有概括形式的前者.). 进而我们容易证明对一切x,y\in Xx\leqslant_X y当且仅当(x, y)\in R. 于是对一切x,y\in X我们考虑x\leqslant_X y成不成立只需等价的考虑(x, y)\in R是否成立,即R(虽然R的构建用到了二元关系\leqslant,但我们认为一旦构建完R那么R的表示形式是不太重要的)完全描述了二元关系\leqslant_X. 这就说明集合X上的所有二元关系可以看作幂集2^{X\times X}的一个元素(这也是集合论中一个集合X上二元关系的定义. 关于两个集合X和Y之间的二元关系也有类似定义.).

进而X的一个偏序可以看作满足定义8.5.1要求的三条性质(自反、反对称和传递性)的2^{X\times X}的一个元素. 故X的一切偏序所构成的集合P确实是明确定义了的.

 

值得注意的是,由上我们将集合X上的二元关系看作一个集合R,于是二元关系的相等即考虑的是集合的相等. 设\leqslant_1, \leqslant_2均为集合X上的二元关系,进而由“二元关系的相等即考虑的是集合的相等”此观念可以证明:对一切x, y\in Xx\leqslant_1 y\leftrightarrow x\leqslant_2 y当且仅当\leqslant_1=\leqslant_2. 也即我们找到了判断两二元关系是否相等的等价命题(故可以合理的把此等价命题当作集合X上二元关系相等的定义). 这是二元关系相等的集合论解释,如果我们把二元关系从性质(或说命题)角度解释,两个二元关系相等其实说的就是两命题等价.

 

 

 

现在来证明\preceq把P当作偏序集.

  1. (反身性)对任意元素\leqslant\in P:由于对任何x, y\in X有,若x\leqslant yx\leqslant y. 故我们看到有\leqslant\preceq \leqslant.
  2. (反对称性)对任意元素\leqslant, \leqslant'\in P,若有\leqslant\preceq\leqslant', \leqslant'\preceq\leqslant:则对任意x, y\in X,有“(x\leqslant y)\Longrightarrow(x\leqslant' y)”且“(x\leqslant' y)\Longrightarrow(x\leqslant y)”. 进而对任意x, y\in X(x\leqslant y)\Longleftrightarrow(x\leqslant' y). 由上二元关系相等的讨论我们看到有\leqslant=\leqslant'.
  3. (传递性)对任意元素\leqslant, \leqslant', \leqslant''\in P,若有\leqslant\preceq\leqslant', \leqslant'\preceq\leqslant'':则对任意x, y\in X,有“(x\leqslant y)\Longrightarrow(x\leqslant' y)”且“(x\leqslant' y)\Longrightarrow(x\leqslant'' y)”,进而我们有(x\leqslant y)\Longrightarrow(x\leqslant'' y). 故有\leqslant\preceq\leqslant''.

综上,序关系\preceq使得P为偏序集.

 

 

 

回顾偏序集的定义8.5.1,其中的反对称性表述已经默认了对X中的元素已经有一个相等关系=(其当然遵循相等要求的四条公理). 也即我们有了X上的相等关系(相等关系可以看作等价关系+代入公理)后才能定义X上的偏序.

陈述“对于任意集合X我们都可以定义其上的一个相等关系”在某种意义下是正确的. 首先要明确的是我们是在讨论数学,进而讨论的一切对象均是数学对象,即集合X中元素均为数学对象. 要进一步把其讨论清楚要费好多口舌,这里只初略讲讲我的理解(其实是关于=水很深,我把握不住:-(,不同层次的理论对其有不同解释和定义.).

1.如果X中元素为同一类型的数学对象:1.1若此类型数学对象按公理化定义理解(比如自然数的Peano公理定义、实数的公理化定义等),那么X上的相等不是定义出来的而是表示俩对象是同一个东西毫无差别的(即对任意x, y\in X如果x=yx, y是同一的数学对象的不同记号形式. 举个例子:设x=1, y=1,1按Peano公理定义来理解,那么我们只不过是用两个不同符号x, y来代表1这个公理化的数学对象.),进而相等要求的四条公理是不证自明的(而实际上我们通常是这样理解的,比如在集合论的框架下我们不能区分两个具有相同元素的集合有什么不同进而规定了外延公理). 进而我们考虑集合X上的二元关系\mathcal{R},满足等价关系的二元关系记作~,由此相等也是一个等价关系. 进而我们可以扩展“相等”的含义而使其具有外延,具体来说就是可以把满足等价关系的二元关系~看成是一个新的相等关系(依据二元关系定义的相等),代入公理(严格来说是对其等价类)仍然成立(具体的例子有模运算).             1.2若此类型数学对象按从另一些数学对象构造出来的定义理解(比如实数的柯西序列等价类定义、实数的戴德金分割定义等),那么X中元素按此类型对象理解时X上的相等需要是等价关系并且满足此类型对象公理化要求的所有性质.     举个简单的例子,我们可以公理化的定义整数集\mathbb{Z},此时相等要求的四条公理是不证自明的;而如果我们将整数集构造性的定义为\mathbb{N}\times\mathbb{N}(详见§4.1下注)且假定X是整数集,那么我们考虑X中元素时其不应该是自然数构成的一个个有序对,而是依整数相等定义中的等价关系形成的等价类,此时相等要求的四条公理是不证自明的.

2.如果X中元素不为同一类型的数学对象:通常来说我们不会考虑其中元素相不相等(就像我们不会考虑一个自然数和一个函数是否相等),但从“一切数学对象均是集合”这个观点来看,对同一类型的对象统一其集合形式后我们可以将其中元素相等考虑为集合间的相等. 而集合的相等显然满足相等要求的四条公理(因为两个相等的集合是同一的).

总的来说,X上的相等与对X中元素理解密切相关,但都满足相等要求的四条公理.

 

P恰有一个最小元,其就是相等关系=(1.确切来说是关于X中元素的相等(比如X是自然数集、整数集等等这样常见的例子);2.从万物起源于集合论观点来看,即集合间的相等(比如X中含有实数、复数、四元数、矩阵、方程、不等式等等不同种类的数学对象这样奇怪的人为构造的例子). 不管从哪种理解,只要领会到这意味着“对X中任意两个元素我们都能判断其是否相等”即可). 首先容易从相等遵循的等价关系验证=\in P. 我们假设存在元素\leqslant\in P使得\leqslant\prec =,即对任何x, y\in X有“(x\leqslant y)\Longrightarrow(x=y)”且\leqslant\neq=. 同时对任何x, y\in X,如果x=y,进而由(x, y)=(x, x)结合相等要求的代入公理(进一步讲是因为我们默认对任何数学对象x考察某个性质P(x)时都是无关于x的具体模型的(这有助于我们抽象的处理对象))知此时有(x\leqslant y)\Longleftarrow(x=y). 综上对任意x, y\in X均有(x\leqslant y)\Longleftrightarrow(x=y),由二元关系相等知有\leqslant = =,这与前面证明的\leqslant\neq=相矛盾,故假设不成立. 即P有一个最小元=.

我们再假设二:P还有一个不是=关系的最小元\leqslant'\in P. 即\leqslant'\neq=且不存在\leqslant\in P使得\leqslant\prec\leqslant'. 而对任意x, y\in X,若有关系“x=y”,同理容易知道有关系“x\leqslant' y”. 这说明有=\preceq \leqslant'. 而我们知道了\leqslant'\neq=,故由=\preceq \leqslant'进一步有=\prec \leqslant',这又与“不存在\leqslant\in P使得\leqslant\prec\leqslant'”相矛盾. 这个矛盾说明假设二不成立. 故P恰有一个最小元.

 

 

 

现在来证明P的最大元正是X的全序.

我们已经说过集合上的偏序可以看作一个二元关系,而集合X上的二元关系可以用2^{X\times X}中的元素表示. 进而从二元关系的集合论表示我们看到P\subseteq 2^{X\times X}.

由上解释:设\leqslant, \leqslant'\in P. 如果\leqslant\preceq\leqslant',即对任何x, y\in X(x\leqslant y)\rightarrow(x\leqslant' y),由二元关系的集合论解释我们知道这意味着((x, y)\in\leqslant)\rightarrow((x, y)\in\leqslant'). 于是我们看到\leqslant\subseteq\leqslant'.       同理我们可证若\leqslant\subseteq\leqslant'\leqslant\preceq\leqslant'.       综上我们看到\displaystyle(\leqslant\preceq\leqslant')\Longleftrightarrow(\leqslant\subseteq\leqslant'). 进而有\preceq=\subseteq. 这就说明把集合P解释成2^{X\times X}子集时,\preceq就是集合上的包含关系.

下面的证明将采用P、\preceq的集合论解释.

先来证明一个引理如下:

Lemma 8.5.16:对任意p\in P,如果存在a, b\in X使得a\neq b且((a, b)\in p(b, a)\in p都成立或都不成立)那么X不可能在序p下成为全序.

证明:设p\in P,设存在a, b\in X使得a\neq b且((a, b)\in p(b, a)\in p都成立或都不成立). 进而我们知道p使得X为偏序集,故在a\neq b由反对称性不可能(a, b)\in p(b, a)\in p都成立,于是只能为(a, b)\in p(b, a)\in p都不成立. 这就说明了X在序p下不是全序集.

 

现在来证明:存在p\in P使得(X, p)为全序集\LongrightarrowpP的最大元.

设存在p\in P使得(X, p)为全序集. 由Lemma 8.5.16知对任意x, y\in X如果x\neq y那么(x, y)\in p(y, x)\in p有且恰有一个成立.       我们假设p不是P的最大元. 进而存在p'\in P使得p\subsetneq p',即存在a, b\in X使得(a, b)\notin p(a, b)\in p',再由偏序中自反性我们知道有a\neq b,再由(a, b)\notin pp为全序我们看到(b, a)\in p,由p\subsetneq p'看到(b, a)\in p'. 综上,对偏序p'我们得到a\neq b(a, b), (b, a)\in p',这明显与p'是偏序相矛盾,这个矛盾说明我们的假设不成立,故pP的最大元.

这就证明了——存在p\in P使得(X, p)为全序集\LongrightarrowpP的最大元.

 

 

现在来证明:pP的最大元\Longrightarrow存在p\in P使得(X, p)为全序集.

p\in P使得(X, p)为全序集. 于是存在元素a, b\in X使得(a, b), (b, a)\notin p,进而知道a\neq b. 定义集合A_1:=\{ x : (x, y)\in\{(x_1, y_1)\in P : y_1=a\}\}, A_2:=\{ y : (x, y)\in\{(x_1, y_1)\in P : x_1=b\}\}.(定义A_1, A_2的动机是:对不是全序的偏序p\in P添加前面确定的a, b形成的有序对(a, b)(a\neq b)后形成的新集自动满足自反性,只要不再添加元素(b, a)那么反对称性也自动满足,剩下的就是将传递性确定的元素也添加进来即可. 这样最终的集合也应该是一个偏序集.)

p自身的反身性我们容易证明(a, b)\in A_1\times A_2(其实还可以证明(b, a)\notin A_1\times A_2),于是我们看到p\subsetneq p\cup A_1\times A_2.

 

现在我们来证明p\cup A_1\times A_2\in P,即证明其也为X的偏序.

自反性:由于p使得X为偏序集,进而对一切x\in X(x, x)\in p,进而(x, x)\in p\cup A_1\times A_2.

反对称性:设(m, n), (n, m)\in p\cup A_1\times A_2. 我们分四种情形讨论. 1.当(m, n), (n, m)\in p时,由p使得X为偏序集知有m=n.   2.当(m, n)\in p(n, m)\in A_1\times A_2时,从A_1, A_2定义容易知有(n, a), (b, m)\in p. 结合(b, m), (m, n)\in pp为偏序知有(b, n)\in p,同理进一步结合(n, a)\in p我们看到(b, a)\in p. 这个矛盾说明此情形不会出现.   3.同理2.可证情形“当(m, n)\in A_1\times A_2(n, m)\in p”不会出现.   4.当(m, n), (n, m)\in A_1\times A_2时,同理容易知道有(n, a), (b, m), (m, a), (b, n)\in p,由(n, a), (b, n)\in pp为偏序知有(b, a)\in p,这矛盾说明此情形不会出现.             综上,我们证明了如果(m, n), (n, m)\in p\cup A_1\times A_2那么(m, n), (n, m)\in p,进而有m=n.

传递性:设(m_1, m_2), (m_2, m_3)\in p\cup A_1\times A_2. 我们分四种情形讨论. 1.当(m_1, m_2), (m_2, m_3)\in p时,有(m_1, m_3)\in p\subseteq p\cup A_1\times A_2.   2.当(m_1, m_2)\in p(m_2, m_3)\in A_1\times A_2时,同理容易知(m_2, a), (b, m_3)\in p,结合(m_1, m_2)\in p知有(m_1, a)\in p,于是看到(m_1, a), (b, m_3)\in p,进而有m_1\in A_1, m_3\in A_2,进而(m_1, m_3)\in A_1\times A_2\subseteq p\cup A_1\times A_2.   3.当(m_1, m_2)\in A_1\times A_2(m_2, m_3)\in p时同理2.知(m_1, m_3)\in p\cup A_1\times A_2.   4.当(m_1, m_2), (m_2, m_3)\in A_1\times A_2时,容易知有(m_1, a), (b, m_2), (m_2, a), (b, m_3)\in p,进而有(b, a)\in p,此矛盾说明这种情形不会出现.             综上,我们证明了如果(m_1, m_2), (m_2, m_3)\in p\cup A_1\times A_2(m_1, m_3)\in p\cup A_1\times A_2.

这就证明了——p\in P不使得(X, p)为全序集\Longrightarrow存在p\cup A_1\times A_2\in P使得p\subsetneq p\cup A_1\times A_2\Longrightarrowp不是P的最大元.

由逆否命题即证明了——如果pP的最大元\Longrightarrow存在p\in P使得(X, p)为全序集.

 

 

综上,我们证明了:pP的最大元当且仅当p使得X成为全序.

 

 

 

现在我们来证明给定X的任何偏序\leqslant都存在全序\leqslant'使得\leqslant\leqslant'粗糙.(沿用P、\preceq的集合论解释)

p\in P. 由引理8.5.14我们知道存在一个良序集W\subseteq P其以p为最小元且没有严格上界.

 

设Y是上面集合W的全序子集. 我们考虑集合\bigcup Y.

当Y是空集时,有\bigcup Y为空集. 由于我们已证P有一个最小元=,进而看到\emptyset=\bigcup Y\subseteq =. 这就证明了Y为空集时其有上界=.

于是我们只需要考虑Y非空,进而\bigcup Y非空. 接下我们证明\bigcup Y\in P,即\bigcup Y是X的一个偏序. 1.(自反性)对任意x\in X,由于Y非空,即存在r\in Y使得X为偏序,进而有(x, x)\in r,进而看到(x, x)\in\bigcup Y.             2.(反对称性)对任意x, y\in X,如果(x, y), (y, x)\in \bigcup Y,说明存在r_1, r_2\in Y使得(x, y)\in r_1, (y, x)\in r_2. 再由于Y为全序我们知有r_1\subseteq r_2或者r_2\subseteq r_1,不失一般性我们假设为r_1\subseteq r_2. 进而我们看到(x, y)\in r_1\subseteq r_2,即(x, y)\in r_2. 至此我们看到(x, y), (y, x)\in r_2,由r_2使得X为偏序集我们知道x=y.             3.(传递性)对任意x, y, z\in X,如果(x, y), (y, z)\in \bigcup Y,说明存在r_1, r_2\in Y使得(x, y)\in r_1, (y, z)\in r_2. 再由于Y为全序我们知有r_1\subseteq r_2或者r_2\subseteq r_1,不失一般性我们假设为r_1\subseteq r_2. 进而我们看到(x, y)\in r_1\subseteq r_2,即(x, y)\in r_2. 至此我们看到(x, y), (y, z)\in r_2,由r_2使得X为偏序集我们知道(x, z)\in r_2.             综上,我们看到\bigcup Y使得X为偏序,即\bigcup Y\in P. 进而也找到了非空集合Y的上界\bigcup Y.

综上,我们知道对W的任意全序子集Y都有上界. 故由Zorn引理知道W有一个最大元w\in W\subseteq P.

 

我们假设上面说明的W的最大元w\in P不使得X为全序,由前面证明“P的最大元正是X的全序”过程我们知道存在一个w\cup A_1\times A_2\in P使得w\subsetneq w\cup A_1\times A_2. 而由于W无严格上界故有w\cup A_1\times A_2\in W,这与w是W的最大元相矛盾,故假设不成立,W的最大元w\in P使得X为全序.

 

 

 

 

 

8.5.17证明:(2023.12.10补充——这是一个伪证,原因是证明过程中使用到了“选择公理”. 也就是说我们并不是“Zorn引理\Longrightarrow习题8.4.2的结论”而是“Zorn引理+选择公理\Longrightarrow习题8.4.2的结论”. 但“选择公理”与“习题8.4.2的结论”是等价的,进而“Zorn引理+选择公理\Longrightarrow习题8.4.2的结论”可以理解成“Zorn引理+习题8.4.2的结论\Longrightarrow习题8.4.2的结论”. 至此我们可以看到这个证明没有多大意义,其相当于用结论证明结论,证了个寂寞(但对这个证明我们还有一个补救的方法:先使用Zorn引理直接证明选择公理(换句话说证明“Zorn引理\rightarrow选择公理”为真,而不是根据“Zorn引理\rightarrow选择公理”为真. 符号\Longrightarrow与符号\rightarrow的涵义(含义、真实意义等诸如此类的表达)是有些许差别的,我在这里费些口舌稍微讨论一下. 符号\rightarrow是真值函数联结词,其可以将两个命题联结起来构成一个新的(复合)命题,并且新命题的真值只由那两个命题的真值(真假)来决定. 这就是说我们在考虑(证明)“Zorn引理\rightarrow选择公理”真假时是从“Zorn引理”和“选择公理”的真值来入手,并不一定需要涉及到“Zorn引理”真值和“选择公理”真值之间的关系. 而符号\Longrightarrow是逻辑蕴含(蕴涵),其涵义更像是在说:可以由在符号\Longrightarrow前面的那个命题按一定推理规则推导出在符号\Longrightarrow后面的那个命题(也即我们通常意指的“数学推理”). 这就是说我们在考虑(证明)“Zorn引理\Longrightarrow选择公理”真假时是从“Zorn引理”真值和“选择公理”真值之间的关系来入手,只要我们在只假定“Zorn引理”为真前提下能推理出“选择公理”为真那么我们就可以说“Zorn引理\Longrightarrow选择公理”成立(为真)、或者就仅仅是说“Zorn引理\Longrightarrow选择公理”.),也即论证“Zorn引理\Longrightarrow选择公理”. 一旦我们论证了“Zorn引理\Longrightarrow选择公理”:其一我们可以结合书上的论证“选择公理\Longrightarrow引理8.5.14\LongrightarrowZorn引理”看到“Zorn引理\Longleftrightarrow选择公理”;其二我们可以从“Zorn引理+选择公理\Longrightarrow习题8.4.2的结论”(根据“Zorn引理\Longrightarrow选择公理”,而不是根据“Zorn引理\rightarrow选择公理”)得到“Zorn引理\Longrightarrow习题8.4.2的结论”,也即我们论证了“Zorn引理(而不是Zorn引理+Zorn引理\rightarrow选择公理)\LongrightarrowZorn引理+选择公理\Longrightarrow习题8.4.2的结论”.) 但此证明中的思考思路以及沿此思路产生的一些讨论仍有价值,故保留.)

习题8.4.2的结论——设I是集合且对每个\alpha\in IX_\alpha是不空的集合. 并且假设对所有的集合X_\alpha彼此不相交. 那么存在一个集合Y使得对于一切\alpha\in I\#(Y\cap X_\alpha)=1.

我们考虑集合\displaystyle S:=\{I'\in 2^I : \exists Y_{I'}\text{ such that }\forall \alpha\in I'\text{ we have }(\#(Y_{I'}\cap X_\alpha)=1)\text{, and }Y_{I'}\subseteq\bigcup_{\alpha\in I'}X_\alpha\}.

我们容易证明\emptyset\in S和对任意\alpha\in I\{\alpha\}\in S,即我们知道S\neq\emptyset.

我们定义集合S的动机是:虽然我们不能对集合I直接观察到习题8.4.2的结论,但是我们从有限选择容易知道对I的有限子集习题8.4.2的结论成立. 并且我们容易发现如果对I'\subsetneq I有习题8.4.2的结论成立,那么我们可以往I’添加一个I\backslash I'中的元素而证明对I'\cup\{i\}(i\in I\backslash I')习题8.4.2的结论仍成立. 于是引出了下面的二元关系定义.

我们规定S上的一个二元关系:对一切J_1, J_2\in S,我们说J_1\leqslant J_2当且仅当

J_1\subseteq J_2,且对一切\alpha\in J_1Y_{J_1}\cap X_{\alpha}=Y_{J_2}\cap X_{\alpha}

(集合Y_{J_1}使得“\displaystyle\forall \alpha\in J_1\text{ we have }(\#(Y_{J_1}\cap X_\alpha)=1)\text{, and }Y_{J_1}\subseteq\bigcup_{\alpha\in J_1}X_\alpha”,由于J_1\in S我们知这样的集合是存在的. 对J_2也有同样的说明. 接下来的证明对形如Y_J的集合不再说明此事.(2023.12.10补充——注意:此处我们需要引入选择公理来对一切J\in S选取出一个(符合要求的)Y_J,这导致了接下来的论述是正确的但不能达成我们的目的(Zorn引理\Longrightarrow习题8.4.2的结论),进而整个证明可以看作是伪证.))

如果读者阅读过前面习题8.5.15的解答,就会发现习题8.5.15解答中定义的二元关系和现在定义的二元关系形式是如此相像. 原因就是这样形式的二元关系容易使用“并公理”,进而可以利用Zorn引理,详见习题8.5.15解答的最末尾对Zorn引理使用的总结.

 

 

现在来证明\leqslant使得集合S为偏序集.

1.(自反性)设J\in S:首先我们有J\subseteq J. 其次,对一切\alpha\in JY_J\cap X_\alpha=Y_J\cap X_\alpha. 于是我们看到J\leqslant J.

2.(反对称性)设J_1, J_2\in SJ_1\leqslant J_2, J_2\leqslant J_1:由\leqslant的定义知即有J_1\subseteq J_2J_2\subseteq J_1. 于是J_1=J_2.

3.(传递性)设J_1, J_2, J_3\in SJ_1\leqslant J_2, J_2\leqslant J_3:由\leqslant的定义知即有“J_1\subseteq J_2且对一切\alpha\in J_1Y_{J_1}\cap X_{\alpha}=Y_{J_2}\cap X_{\alpha},和J_2\subseteq J_3且对一切\alpha\in J_2Y_{J_2}\cap X_{\alpha}=Y_{J_3}\cap X_{\alpha}.”,简单的谓词演算我们就有陈述“J_1\subseteq J_3,且对一切\alpha\in J_1Y_{J_1}\cap X_{\alpha}=Y_{J_3}\cap X_{\alpha}”为真. 于是我们看到J_1\leqslant J_3.

综上,我们证明了\leqslant使得集合S为偏序集. 于是我们知道(S, \leqslant)为非空偏序集.

 

 

设A为S的任一全序子集. 我们接下来将证明\bigcup A\subseteq I为A的上界.

A=\emptyset时,我们容易证明\bigcup A=\emptyset\emptyset\in S\emptyset\leqslant\emptyset. 于是我们找到了A的上界\emptyset. 于是我们只需再考虑A非空的情形.

 

A非空.

对任意K\in A,由于K是实实在在存在的(即论域A非空),于是我们考虑\displaystyle \bigcup_{J\in A\backslash\{K\}}Y_J是合理的. 而我们容易证明\displaystyle \bigcup_{J\in A}Y_J=(\bigcup_{J\in A\backslash\{K\}}Y_J)\cup Y_K.             而对任意\alpha\in K:对任意\displaystyle x\in(\bigcup_{J\in A\backslash\{K\}}Y_J)\cap X_\alpha,知对某J'\in A\backslash\{K\}x\in Y_{J'}\cap X_\alpha. 由于A为全序,故有J'\leqslant KK\leqslant J'.   1.当K\leqslant J'时我们容易证明Y_{J'}\cap X_\alpha=Y_K\cap X_\alpha.   2.当J'\leqslant K时有——“若还有\alpha\in J'则也容易证明Y_{J'}\cap X_\alpha=Y_K\cap X_\alpha;  否则我们有\alpha\in K\backslash J'. 观察到J'\in S以及由集合S定义知道有\displaystyle Y_{J'}\subseteq\bigcup_{\beta\in J'}X_\beta. 而由于\alpha\in K\backslash J'(即\alphaJ'中元素不同,进而知X_\alpha\cap X_\beta=\emptyset(\beta\in J'))故我们看到\displaystyle(\bigcup_{\beta\in J'}X_\beta)\cap X_\alpha=\emptyset,进而由\displaystyle Y_{J'}\subseteq\bigcup_{\beta\in J'}X_\beta\displaystyle Y_{J'}\cap X_\alpha=\emptyset(容易注意到这是一个矛盾,进而说明“当J'\leqslant K时不可能出现\alpha\in K\backslash J'.”. 当然我们可以不理此明显的矛盾而继续推理,我们下面就是这么做的. 让我们可以忽略此矛盾而继续推理的理由是:相对于整个推理过程,在其中某一步骤得到矛盾并不能否定我们整个推理过程的严谨、正确性;出现矛盾只能说明在得到矛盾之前的某一推理链中的步骤讨论的某数学对象是“不存在”的(在上面的证明中那个不存在的数学对象即为\alpha\in K\backslash J'),这使得涉及到此数学对象的论述论证是空洞无效的进而可以省略(类似于从“空真的”蕴含命题不会得到我们需要的信息). 简单来说:在证明中(不管是有意还是无意)被忽略的“矛盾”不会影响整个证明的正确性,只会影响所证命题的效用性. 比如这里对“引理1”的证明是正确无误的,进而“引理1”是正确的. 但对“K\in AJ'\in\{J\in A\backslash\{K\} : J\leqslant K\}\alpha\in K\backslash J'”的情形不能根据“引理1”得到\displaystyle (\bigcup_{J\in A\backslash\{K\}}Y_J)\cap X_\alpha\subseteq Y_K\cap X_\alpha(故也不能根据\displaystyle (\bigcup_{J\in A\backslash\{K\}}Y_J)\cap X_\alpha\subseteq Y_K\cap X_\alpha进一步地得到Y_{J'}\cap X_\alpha\subseteq Y_K\cap X_\alpha),原因正是前面已经说过的: 在“K\in AJ'\in\{J\in A\backslash\{K\} : J\leqslant K\}”前提下K\backslash J'为空集,进而不可能有\alpha\in K\backslash J'. 换句话说,“引理1”在情形“K\in AJ'\in\{J\in A\backslash\{K\} : J\leqslant K\}\alpha\in K\backslash J'”是无效的、失效的等等,因为此情形根本不会出现(故证明中对此情形的论述论证是空洞无效的进而可以省略). 这就是逻辑的力量:“逻辑”能帮助你在解决问题(证明命题)的过程中考虑到所有可能情形,虽然某些情形也许根本不会出现. 进而它能让你的解决办法(证明)是周全的(并且它在某种程度上能帮助你发现错误进而尽量保证你的解决办法(证明)是正确的). 但凡事都有两面性,通过上面的简单例子我们可以类比联想意识到知识可能是正确但无效用的”,比如不符合我们所处的这个宇宙物理规律的某些数学知识是正确的但没有实际用处(现实不满足这些数学知识的使用条件,也即这些数学知识构造的模型不符合现实). 换句话说,⌈知识是无价的⌋可以有两种理解:1.知识对现实世界有实际效用,产生了巨大的价值效益,此时“无价”意指知识给我们带来了不可估量的价值效益;2.知识对现实世界没有太多实际效用,只是知识分子的圈地自萌自娱自乐,此时“无价”意指知识不能给我们带来什么价值效益. 既然“知识可能是正确但无效用的”,对于知识的效用性我们又不能保证没有上帝之手掌控改变宇宙物理规律(使得知识的效用性发生变化),也不能保证知识在发现的当时就找到用处等等 ,所以我们对待知识的态度最好是:知识属于全人类共有,知识产权不再存有. 至此我们可以看到知识对个人、小团体等等确实是⌈无价⌋的了,知识再也不能直接对个人带来(狭义上的)价值效益,但这并没有否定依据知识而展开的劳动之中产生的价值. ⌈实践是检验真理的唯一标准⌋,在劳动实践中产生、检验知识,有效用的知识又反哺于劳动实践. 开放的知识获取体系与劳动实践是相辅相成正向反馈的,封闭的知识获取体系最终只能导致劳动实践是各立山头各自为敌. 这就像你初入社会经过一段时间的摸爬滚打能胜任某岗位后,对后来的新人(可能的竞争者)你不愿意教,怕饿死师傅. 但也许有一天你会厌烦你这重复无聊的工作想跳槽换新的岗位,此时你需要面对的情景就是原来你不愿帮的新人面对过的(我们本质上过着同一种生活,我们自己的所有经历在别人身上都已发生过类似的(比如出生、死亡、上学、逃课、出轨、背叛等等),太阳底下并无新鲜事. 人与人之间的信任就如同一根根线,牵引着我们跳出生活的舞步.). 当然上面的讨论过于理想化,只是属于我自己的幻想时间意淫自嗨. 但我想《圣经》中的“智慧树”故事也许想表达的大概是这么个差不多的意思吧(我没看过《圣经》,对“智慧树”的故事也只是道听途说式的了解.).),此时有\emptyset=Y_{J'}\cap X_\alpha\subseteq Y_K\cap X_\alpha”.     结合1.和2.我们知道总有Y_{J'}\cap X_\alpha\subseteq Y_K\cap X_\alpha. 故我们看到x\in Y_K\cap X_\alpha. 综上我们证明了\displaystyle (\bigcup_{J\in A\backslash\{K\}}Y_J)\cap X_\alpha\subseteq Y_K\cap X_\alpha.

综上,我们证明了引理1:对任意K\in A,对任意\alpha\in K都有\displaystyle (\bigcup_{J\in A\backslash\{K\}}Y_J)\cap X_\alpha\subseteq Y_K\cap X_\alpha.

现在来证明\bigcup A\in S. 1.容易证明\bigcup A\subseteq I.     2.考虑集合\displaystyle\bigcup_{J\in A}Y_J. 对一切\alpha\in\bigcup A,知对某K'\in A使得\alpha\in K'\in S,进而由集合S定义知存在Y_{K'}使得对一切\beta\in K'\#(Y_{K'}\cap X_\beta)=1,特别地我们看到\#(Y_{K'}\cap X_\alpha)=1. 由引理1(等式的第二个等号到第三个等号间变换用到)我们看到\displaystyle\#((\bigcup_{J\in A}Y_J)\cap X_\alpha)\\=\#(((\bigcup_{J\in A\backslash\{K'\}}Y_J)\cup Y_{K'})\cap X_\alpha)\\=\#(((\bigcup_{J\in A\backslash\{K'\}}Y_J)\cap X_\alpha)\cup (Y_{K'}\cap X_\alpha))\\=\#(Y_{K'}\cap X_\alpha)=1.     3.显然有\displaystyle\bigcup_{J\in A}Y_J\subseteq\bigcup_{J\in A}Y_J.             综合1.和2.和3.我们看到\bigcup A\in S. 于是我们可以考虑\bigcup A是否为A的上界.

现在来考虑\bigcup A是否为A的上界. 对任意K\in A:显然有K\subseteq\bigcup A. 2.而对一切\alpha\in K由引理1知有\displaystyle(\bigcup_{J\in A}Y_J)\cap X_\alpha=Y_K\cap X_\alpha. 这就看到K\leqslant\bigcup A.

 

综上,我们看到\bigcup A\subseteq I为A的上界.

至此,我们看到S的任一全序子集A均有上界\bigcup A.

 

 

由Zorn引理我们知道S存在一个最大元J_{max}\in S. 结合解答最初的讨论知我们下一步需要证明J_{max}=I.

反证. 假设J_{max}\neq I. 由于J_{max}\subseteq I于是我们可以取到一个元素i\in I\backslash J_{max}.     1.于是我们看到J_{max}\cup\{i\}\subseteq I.     2.我们可以从X_i(因为i\in I)中取出一个元素x_i定义Y_i:=Y_{J_{max}}\cup\{x_i\}. 由于对一切\alpha, \beta\in I有如果\alpha\neq\betaX_\alpha\cap X_\beta=\emptyset:故对一切\alpha\in J_{max}\#(Y_i\cap X_\alpha)=\#((Y_{J_{max}}\cup\{x_i\})\cap X_\alpha)=\#((Y_{J_{max}}\cap X_\alpha)\cup(\{x_i\}\cap X_\alpha))=\#((Y_{J_{max}}\cap X_\alpha)\cup\emptyset)=\#(Y_{J_{max}}\cap X_\alpha)=1;对\alpha\in\{i\}\#(Y_i\cap X_\alpha)=\#((Y_{J_{max}}\cup\{x_i\})\cap X_\alpha)=\#((Y_{J_{max}}\cap X_\alpha)\cup(\{x_i\}\cap X_\alpha))=\#(\emptyset\cup(\{x_i\}\cap X_\alpha))=\#(\{x_i\}\cap X_\alpha)=1(其中证明Y_{J_{max}}\cap X_\alpha=\emptyset过程使用到了事实\displaystyle Y_{J_{max}}\subseteq\bigcup_{\beta\in J_{max}}X_\beta). 结合起来就有对一切\alpha\in J_{max}\cup\{i\}\#(Y_i\cap X_\alpha)=1.     3.容易证明\displaystyle Y_i\subseteq\bigcup_{J\in J_{max}\cup\{i\}}Y_J.             综上这就证明了(J_{max}\cup\{i\})\in S.

现在来证明J_{max}\leqslant J_{max}\cup\{i\}. 1.显然有J_{max}\subseteq J_{max}\cup\{i\}. 2.对一切\alpha\in J_{max}Y_i\cap X_\alpha=(Y_{J_{max}}\cup\{i\})\cap X_\alpha=(Y_{J_{max}}\cap X_\alpha)\cup(\{i\}\cap X_\alpha)=(Y_{J_{max}}\cap X_\alpha)\cup\emptyset=Y_{J_{max}}\cap X_\alpha. 结合1.与2.看到J_{max}\leqslant J_{max}\cup\{i\}.

由于J_{max}\neq J_{max}\cup\{i\},我们看到J_{max}<J_{max}\cup\{i\}. 这说明J_{max}\in S不是S的最大元,这个矛盾说明假设不成立,故J_{max}=I.

 

 

于是我们使用Zorn引理证明了习题8.4.2的结论.

于是我们看到:选择公理\Longrightarrow引理8.5.14\LongrightarrowZorn引理\Longrightarrow习题8.4.2的结论\Longleftrightarrow选择公理.

这就说明了Zorn引理\Longleftrightarrow选择公理.(或许还有其他方法使得用习题8.4.2的结论直接证明Zorn引理而绕开选择公理,这里就不展开了.)


我们当然也可以按照书上的提示进行证明. 根据提示我们考虑集合\Omega:=\{Y\in2^{(\bigcup_{\alpha\in I}X_\alpha)} : \forall\alpha\in I\text{ we have }\#(Y\cap X_\alpha)\leqslant 1\}.

我们容易知道\emptyset\in\Omega,并且\Omega上的包含关系\subseteq使得其为偏序集.

 

设A是\Omega的任一全序子集. 现在我们来证明\bigcup A是其上界.

首先我们要证明\bigcup A\in\Omega. 1.容易证明\displaystyle\bigcup A\subseteq\bigcup_{\alpha\in I}X_\alpha.       2.我们假设存在\beta\in I使得\#((\bigcup A)\cap X_\beta)\leqslant 1不成立,这说明(\bigcup A)\cap X_\beta中至少含有两个不同元素x_1, x_2(x_1\neq x_2),进而我们知道对某Y_1, Y_2\in Ax_1\in Y_1\cap X_\beta, x_2\in Y_2\cap X_\beta. 由于A为全序,于是我们看到Y_1\cap X_\beta\subseteq Y_2\cap X_\beta或者Y_2\cap X_\beta\subseteq Y_1\cap X_\beta,进而看到x_1, x_2\in Y_2\cap X_\beta或者x_1, x_2\in Y_1\cap X_\beta,而由Y_1, Y_2\in A\subseteq\Omega以及\Omega定义可以知道\#(Y_1\cap X_\beta)=\#(Y_2\cap X_\beta)=1,这说明无论如何都有x_1=x_2. 这是一个矛盾,说明假设不成立,于是对于一切\alpha\in I都有\#((\bigcup A)\cap X_\alpha)\leqslant 1.       综上我们看到\bigcup A\in\Omega.

进而我们看到\bigcup A\in\Omega且对一切Y\in AY\subseteq\bigcup A. 这就证明了\bigcup A是A的上界.

 

由Zorn引理知道\Omega有一个最大元Y_m.

 

由于Y_m\in\Omega,于是对于一切\alpha\in I都有\#(Y_m\cap X_\alpha)\leqslant 1. 假设存在\beta\in I使得\#(Y_m\cap X_\beta)=0,我们从X_\beta中取出一个元素x_\beta(x_\beta\in X_\beta). 我们将证明Y_m\cup\{x_\beta\}\in\Omega而导出矛盾. 1.容易证明Y_m\cup\{x_\beta\}\subseteq\bigcup_{\alpha\in I}X_\alpha.       2.而对一切\alpha\in I,有\#((Y_m\cup\{x_\beta\})\cap X_\alpha)=\#((Y_m\cap X_\alpha)\cup(\{x_\beta\}\cap X_\alpha))=\#((Y_m\cap X_\alpha)\cup\emptyset)=\#(Y_m\cap X_\alpha)\leqslant 1. 这就证明了(\bigcup A)\cup\{x_\beta\}\in\Omega,但是此时有Y_m\subsetneq Y_m\cup\{x_\beta\},这与Y_m\Omega最大元相矛盾,故假设不成立,即:对于一切\alpha\in I都有\#(Y_m\cap X_\alpha)=1.

 

 

类似的说明知道Zorn引理\Longleftrightarrow选择公理.


一个错误思路分析:考虑S:=\{Y\in2^{(\bigcup_{\alpha\in I}X_\alpha)} : \forall\alpha\in I\text{ we have }\#(Y\cap X_\alpha)\neq 0\},定义S上的二元关系对一切A, B\in S我们说A\leqslant B   当且仅当   对一切\alpha\in IA\cap X_\alpha\supseteq B\cap X_\alpha.

此证明思路将遇到和习题8.5.15错误证明思路3.类似的困难,故说明我们要利用上Zorn引理就需要二元关系可以做“加法”(使用并公理)而不是做“减法”(使用集合的交).

习题8.5.16解答以及习题8.5.17第二个解答好像暗示了只要我们考虑的集合X选取的合理,那么对X使用Zorn引理时要考虑的偏序关系就是包含关系\subseteq(且这样的路径论述是最简洁明了的. 这里就不做过多讨论了.


 

 

 

 

 

8.5.18证明:由于有限集具有可一个接一个取完其中元素的可穷性质,故Hausdorff最大性原理对有限集是显然成立的(我们可以写下一个证明操作步骤,但太简单了故省略.). 但这没有完全证明习题.

现在进行正式证明.

 

设X是一个关于关系\leqslant的偏序集,记X的全体全序子集组成的集族为A,于是(A, \subseteq)是非空偏序集. 对A的每个关于关系\subseteq的全序子集Y:1.容易证明对任意y\in Yy\subseteq \bigcup Y;2.再由Y为关于关系\subseteq的全序子集,我们容易证明\bigcup Y也为关于关系\leqslant的全序子集,进而看到\bigcup Y\in A.             结合1.和2.看到\bigcup Y为Y的上界,于是由Zorn引理知道A存在最大元. 这就证明了:Zorn引理\LongrightarrowHausdorff最大性原理.

 

现在假定Hausdorff最大性原理成立,设X是非空偏序集,并且X的每个全序子集都有上界. 前面这句话也就是在说存在X的全序子集Y依\subseteq关系是最大的且Y有一个上界s_Y,于是我们看到s_Y\in Y(否则将有Y\cup\{s_Y\}为全序且Y\subsetneq Y\cup\{s_Y\}),于是看到Y有最大元s_Y. 再由反证法和Hausdorff最大性原理知s_Y也为X的最大元. 这就证明了:Hausdorff最大性原理\LongrightarrowZorn引理.

 

于是根据习题8.5.17,这两个命题都是逻辑上与选择公理等价的.

 

 

 

 

 

8.5.19证明:\preceq\Omega的偏序.

1.自反性:由(Y, \leqslant)=(Y, \leqslant)可知.

2.反对称性:设(Y, \leqslant)\preceq(Y', \leqslant')(Y', \leqslant')\preceq(Y, \leqslant). 当(Y, \leqslant)=(Y', \leqslant')时显然有(Y, \leqslant)=(Y', \leqslant');当(Y, \leqslant)(Y', \leqslant')互为前段时易知有Y\subsetneq Y'Y'\subsetneq Y(这是一个矛盾而说明不会出现此情形,但我们可以不理会此矛盾继续推理下去),进而知Y=Y'. 再由前段定义中“对任意y, y'\in Yy\leqslant y'当且仅当y\leqslant' y'”知\leqslant=\leqslant',此时也有(Y, \leqslant)=(Y', \leqslant').

综上,有(Y, \leqslant)=(Y', \leqslant').

3.传递性:仿照验证反对称性的简单讨论知传递性成立(需要仔细验证的只有(Y, \leqslant)\prec(Y', \leqslant')\prec(Y'', \leqslant'')的情形,只要注意到Y=\{y\in Y' : y<'x\}=\{y\in \{y'\in Y'' : y'<''x'\} : y<'x\}=\{y\in Y'' : y<''x, y<''x'\}(x\in Y', x'\in Y'')x, x'\in Y''两者由于Y''为良序故可小值\min\{x, x'\}进而Y=\{y\in Y'' : y<''x, y<''x'\}=\{y\in Y'' : y<''\min\{x, x'\}\}.

 

 

 

\Omega恰有一个最小元(\emptyset, \leqslant_\emptyset).

因为陈述“存在x\in\emptyset使得Y=\{y\in\emptyset : y<_\emptyset x\}”恒假,故找不到(\emptyset, \leqslant_\emptyset)的前段,进而(\emptyset, \leqslant_\emptyset)\Omega的最小元.(或者因为(\emptyset, \leqslant_\emptyset)是任意非空Y的前段;或者因为对于非空Y有Y\subsetneq\emptyset不成立.)

 

 

 

\Omega的最大元都是X的良序.

(Y, \leqslant)\in\OmegaY\neq X,说明存在一个元素x\in X使得x\notin Y. 下面我们将说明此时(Y, \leqslant)不是\Omega的最大元.

现在来考虑集合Y\cup\{x\},我们希望在其上定义一个良序关系\leqslant'使得(Y, \leqslant)\prec(Y\cup\{x\}, \leqslant'). 一个很简单的思路就是强行规定元素x为集合Y\cup\{x\}的最大元,严格表述即定义Y\cup\{x\}上的一个二元关系\leqslant'\ :=\ \leqslant\cup\{(x, x)\}\cup\{(y, x) : y\in Y\}(二元关系按集合角度解释).

 

现在来证明(Y\cup\{x\}, \leqslant')是一个偏序集.

1.自反性. 对任意a\in Y\cup\{x\}:若a\in Y(a, a)\in\leqslant\subseteq\leqslant';若a\in\{x\}(a, a)=(x, x)\in\leqslant'. 综上\leqslant'是自反的.

2.反对称性. 对任意a, b\in Y\cup\{x\},若有(a, b), (b, a)\in\leqslant':当(a, b)\in\leqslant时讨论易知只能(b, a)\in\leqslant,进而由\leqslant为良序知有a=b;当(a, b)\in\{(x, x)\}时知a=b=x;当(a, b)\in\{(y, x) : y\in Y\}时说明a\in Yb=x,进而发现(b, a)\notin\leqslant',这个矛盾说明在说明“(a, b), (b, a)\in\leqslant'”的前提下不会出现此情形.

3.传递性. 对任意a, b, c\in Y\cup\{x\},若有(a, b), (b, c)\in\leqslant':即有(a, b), (b, c)\in\leqslant\cup\{(x, x)\}\cup\{(y, x) : y\in Y\}. 同时注意到(a, b)的第二个分量和(b, c)的第一个分量均为元素b,说明——

  • 3.1:当(a, b)\in\leqslant时必有b\in Y,进而有(b, c)\in\leqslant\cup\{(y, x) : y\in Y\},进而容易知(a, c)\in\leqslant\cup\{(y, x) : y\in Y\}\subseteq\leqslant'
  • 3.2:当(a, b)\in\{(x, x)\}时有a=b=x. 再由(b, c)\in\leqslant\cup\{(x, x)\}\cup\{(y, x) : y\in Y\}知即(x, c)\in\leqslant\cup\{(x, x)\}\cup\{(y, x) : y\in Y\},进一步知道(x, c)\in\{(x, x)\}. 综上a=b=c=x,故有(a, c)=(x, x)\in\leqslant'
  • 3.3:当(a, b)\in\{(y, x) : y\in Y\}时显然有b=x,同理易知(b, c)\in\{(x, x)\},于是c=x. 此时(a, c)=(a, x)\in\{(y, x) : y\in Y\}\subseteq\leqslant'.

综上(Y\cup\{x\}, \leqslant')是一个偏序集.

 

同理简单讨论容易证明(Y\cup\{x\}, \leqslant')是一个全序集.

同理简单讨论容易证明(Y\cup\{x\}, \leqslant')是一个良序集.

 

综上,若Y\neq X(Y, \leqslant)\prec(Y\cup\{x\}, \leqslant'),即(Y, \leqslant)不是\Omega的最大元. 反过来说\Omega的最大元均为X的良序.(一个显而易见的事实是:X的良序是\Omega的最大元. 于是我们看到(S, \leqslant_S)\Omega的最大元”和“(S, \leqslant_S)是X的良序”是等价的.)

 

 

 

现在来证明:Zorn引理\Longrightarrow良序原理.

由于(\emptyset, \leqslant_\emptyset)\in\Omega\Omega非空. 设A是\Omega的任一全序子集,现在我们来证明(\bigcup\{Y : (Y, \leqslant)\in A\}, \bigcup\{\leqslant : (Y, \leqslant)\in A\})是A的上界.(\bigcup\{\leqslant : (Y, \leqslant)\in A\}是从集合角度理解的二元关系,详见习题8.5.16的解答.) 为了书写方便,我定义\leqslant_{\bigcup}:=\bigcup\{\leqslant : (Y, \leqslant)\in A\},并在必要的时候才将\leqslant_{\bigcup}还原为其最初含义.

 

首先要证明:(\bigcup\{Y : (Y, \leqslant)\in A\}, \leqslant_{\bigcup})\in\Omega.

容易证明\bigcup\{Y : (Y, \leqslant)\in A\}\subseteq X. 容易证明(\bigcup\{Y : (Y, \leqslant)\in A\}, \leqslant_{\bigcup})是偏序. 进而容易证明(\bigcup\{Y : (Y, \leqslant)\in A\}, \leqslant_{\bigcup})是全序.

接下来要证明(\bigcup\{Y : (Y, \leqslant)\in A\}, \leqslant_{\bigcup})是良序.

以下引用文段为不完整证明,可跳过不看.

设S为\bigcup\{Y : (Y, \leqslant)\in A\}的任一非空子集. 我们假设不存在一个(Y_S, \leqslant_S)\in\Omega使得S\subseteq Y_S,换句话说即对任意(Y', \leqslant')\in\Omega均存在s\in S使得s\notin Y'.

由于S非空则存在s_0\in S\subseteq\bigcup\{Y : (Y, \leqslant)\in A\},于是我们看到存在(Y_0, \leqslant_0)\in A使得s_0\in Y_0. 根据上一段的假设我们知:对(Y_0, \leqslant_0)\in A\subseteq\Omega存在s_1\in S\subseteq\bigcup\{Y : (Y, \leqslant)\in A\}使得s_1\notin Y_0,于是我们看到存在(Y_1, \leqslant_1)\in A\subseteq\Omega使得s_1\in Y_1. 根据我们的假设此操作可以无终结地进行下去(即此操作步骤可以是可数无穷的),于是我们看到

...Y_3\ni s_3\notin Y_2\ni s_2\notin Y_1\ni s_1\notin Y_0\ni s_0             [8.5.19.1]

(s_0, s_1, s_2, s_3... \in S, (Y_0, \leqslant_0), (Y_1, \leqslant_1), (Y_2, \leqslant_2), (Y_3, \leqslant_3)... \in A\subseteq\Omega. s_0, s_1, s_2, s_3..., (Y_0, \leqslant_0), (Y_1, \leqslant_1), (Y_2, \leqslant_2), (Y_3, \leqslant_3)...是根据我们的假设说明存在的. 这里有一个易被忽略但在证明逻辑上很重要的细节:我们至少需要依序选择公理来选出(Y_0, \leqslant_0), (Y_1, \leqslant_1), (Y_2, \leqslant_2), (Y_3, \leqslant_3)...(s_0, s_1, s_2, s_3...的选择则只需要在每一步骤中使用引理3.1.6单个选取),但在习题8.5.17已经证明选择公理(其蕴涵依序选择公理)等价于Zorn引理(证明等价过程并未用到良序原理),所以这里不构成循环论证.)

由于(Y_0, \leqslant_0), (Y_1, \leqslant_1), (Y_2, \leqslant_2), (Y_3, \leqslant_3)... \in A且A为全序,于是从公式[8.5.19.1]我们容易发现Y_0前段于Y_1前段于Y_2前段于Y_3…(Y_0前段于Y_1意为:Y_0Y_1的前段,其余类同. )

也即(Y_0, \leqslant_0)\prec(Y_1, \leqslant_1)\prec(Y_2, \leqslant_2)\prec(Y_3, \leqslant_3)...             [8.5.19.2]

从链[8.5.19.2](即(Y_0, \leqslant_0)\prec(Y_1, \leqslant_1)\prec(Y_2, \leqslant_2)\prec(Y_3, \leqslant_3)...)我们可以看到链Y_0\subsetneq Y_1\subsetneq Y_2\subsetneq Y_3...是不会有终结的. 这就说明:当集合S或集合A为有限集时我们的假设是不成立的(因为我们容易从公式[8.5.19.1]和公式[8.5.19.2]知道s_0, s_1, s_2, s_3... \in S, (Y_0, \leqslant_0), (Y_1, \leqslant_1), (Y_2, \leqslant_2), (Y_3, \leqslant_3)... \in A中对不同自然数i, j\in\mathbb{N}s_i\neq s_jY_i\neq Y_j. 或者直接因为当集合S或集合A为有限集时我们可以通过普通的归纳法证明S中的元素均在A中某个良序集中.). 但是这是不完整的证明,我可以举出一个简单的反例:考虑X是自然数集X:=\mathbb{N}以及其上的标准序(于是X的任何子集均是良序的),集合A定义为A:=\{\{0\}, \{0, 1\}, \{0, 1, 2\}, \{0, 1, 2, 3\}, ... \}. 于是我们容易发现\bigcup\{Y : (Y, \leqslant)\in A\}=\{0, 1, 2, 3, ... \}=\mathbb{N},于是我们选取集合S就是\bigcup\{Y : (Y, \leqslant)\in A\}即定义S:=\mathbb{N}. 此时我们只要选取s_0:=0, s_1:=1, s_2:=2, s_3:=3, ...以及Y_0:=\{0\}, Y_1:=\{0, 1\}, Y_2:=\{0, 1, 2\}, Y_3:=\{0, 1, 2, 3\}, ...就会发现公式[8.5.19.1]和公式[8.5.19.2]确实是无矛盾成立的,进而不能推出矛盾来说明假设不成立. 究其原因,是因为我们的假设蕴涵“不存在X上的良序”(因为X上的良序使得假设恒为假. 更进一步地,只要我们考虑集合S=X,比如正在举出的反例,就能看到“不存在X上的良序”蕴涵假设.

由于知道了:假设蕴涵“不存在X上的良序”,于是我们就不可能从假设成立来帮助我们来证明“存在X上的良序”,这是因为我们的逻辑演绎保证了我们从真命题只能得到真命题.

于是这个假设不能帮助我们完成证明,我们需要新的证明路径. 虽然我们确信我们的假设确实是假的(在承认选择公理后确实如此,这也是此题的目的.),但逻辑上我们不能借助我们的假设来来证明我们的假设为假.

回顾习题8.5.11,如果我们能将其推广到“无穷并”的话,那么我们想要的结论“(\bigcup\{Y : (Y, \leqslant)\in A\}, \leqslant_{\bigcup})是良序”是显而易见的了. 可惜的是习题8.5.11不能被推广到“无穷并”. 一个显而易见的反例是:考虑实数序列(\frac{1}{n})_{n=1}^\infty,此序列单调递减收敛到0但永远取值不到0,进而\{\frac{1}{n} : n\in\mathbb{N}^+\}无最小元. 由此,集合\{\{\frac{1}{n}\} : n\in\mathbb{N}^+\}中元素均为单元素集故均为良序集,此时\bigcup\{\{\frac{1}{n}\} : n\in\mathbb{N}^+\}不是良序集但是全序集.

幸运的是,我们还有其它办法. 设S为\bigcup\{Y : (Y, \leqslant)\in A\}的任一非空子集. 我们大假设S不是序\leqslant_{\bigcup}下的良序集,即存在一个S的非空子集S'\subseteq S无最小元. 由于S'非空,于是我们可以取一个元素s_0\in S'. 从依序选择公理可以得到一个由S'中元素构成严格递减的可数无穷序列...s_3<_{\bigcup}s_2<_{\bigcup}s_1<_{\bigcup}s_0.(选择公理(其蕴涵依序选择公理)等价于Zorn引理(证明等价过程并未用到良序原理),所以这里不构成循环论证.)

观察到s_0\in S'\subseteq S\subseteq\bigcup\{Y : (Y, \leqslant)\in A\},即s_0\in \bigcup\{Y : (Y, \leqslant)\in A\},故存在(Y_{s_0}, \leqslant_{s_0})\in A使得s_0\in Y_{s_0}.

现在分类讨论. 如果(Y_{s_0}, \leqslant_{s_0})为A的最大元(依\preceq关系):由于A为全序,进而容易证明对一切(Y, \leqslant)\in A均有Y\subseteq Y_{s_0},进而\bigcup\{Y : (Y, \leqslant)\in A\}\subseteq Y_{s_0}. 进而我们看到\{s_i : i\in\mathbb{N}\}\subseteq S'\subseteq S\subseteq\bigcup\{Y : (Y, \leqslant)\in A\}\subseteq Y_{s_0}. 并且此时容易证明\leqslant_{\bigcup}\subseteq\leqslant_{s_0},进而从...s_3<_{\bigcup}s_2<_{\bigcup}s_1<_{\bigcup}s_0可以得到...s_3<_{s_0}s_2<_{s_0}s_1<_{s_0}s_0. 于是良序集Y_{s_0}含有一个严格递减的可数无穷序列(s_i)_{i=0}^\infty,这个矛盾说明(Y_{s_0}, \leqslant_{s_0})不可能为A的最大元. 也就是说存在(Y_{up}, \leqslant_{up})\in A使得(Y_{s_0}, \leqslant_{s_0})\prec(Y_{up}, \leqslant_{up}),即(Y_{s_0}, \leqslant_{s_0})(Y_{up}, \leqslant_{up})的前段,即存在x_{up}\in Y_{up}使得Y_{s_0}=\{y\in Y_{up} : y<_{up} x_{up}\}且对一切y, y'\in Y_{s_0}y\leqslant_{s_0} y'当且仅当y\leqslant_{up} y'.

接下来要做的就是证明我们有\{s_i : i\in\mathbb{N}\}\subseteq Y_{up}...s_3<_{up}s_2<_{up}s_1<_{up}s_0.

(Y, \leqslant)\in A(Y_{up}, \leqslant_{up})\prec(Y, \leqslant). 设元素x\in Y\backslash Y_{up}. 于是我们看到x\in Y\backslash Y_{up}\subseteq Y\backslash Y_{s_0}\\=Y\backslash \{y\in Y_{up} : y<_{up} x_{up}\}\\=Y\backslash \{y\in Y_{up} : y< x_{up}\}\\=(Y\backslash Y_{up})\cup\{y\in Y : x_{up}\leqslant y\}\\=(Y\backslash \{y\in Y : y<z\})\cup\{y\in Y : x_{up}\leqslant y\}(z\in Y)\\=\{y\in Y : z\leqslant y\}\cup\{y\in Y : x_{up}\leqslant y\}(z\in Y)\\=\{y\in Y : \min\{z, x_{up}\}\leqslant y\}(z\in Y)\\=\{y\in Y : x_{up}\leqslant y\}(z\in Y)(由x_{up}\in Y_{up}=\{y\in Y : y<z\}我们可以看到x_{up}<z.). 也就是说:对一切(Y, \leqslant)\in A,如果(Y_{up}, \leqslant_{up})\prec(Y, \leqslant)那么对一切x\in Y\backslash Y_{up}x_{up}\leqslant x,也即有x_{up}\leqslant_{\bigcup} x. 而由于对一切i\in\mathbb{N}s_i\leqslant_{\bigcup} s_0<_{up} x_{up},也即对一切i\in\mathbb{N}s_i\leqslant_{\bigcup} s_0<_{\bigcup} x_{up}. 于是乎有:对一切(Y, \leqslant)\in A,如果(Y_{up}, \leqslant_{up})\prec(Y, \leqslant)那么对一切i\in\mathbb{N}s_i\notin Y\backslash Y_{up}.             进而对一切i\in\mathbb{N}:由于s_i\in S'\subseteq S\subseteq\bigcup\{Y : (Y, \leqslant)\in A\},说明存在(Y_i, \leqslant_i)\in A使得s_i\in Y_i. 当(Y_{up}, \leqslant_{up})\prec(Y_i, \leqslant_i)时由已证明的“对一切(Y, \leqslant)\in A,如果(Y_{up}, \leqslant_{up})\prec(Y, \leqslant)那么对一切i\in\mathbb{N}s_i\notin Y\backslash Y_{up}”易知s_i\in Y_{up}. 当(Y_i, \leqslant_i)\preceq(Y_{up}, \leqslant_{up})时显然有s_i\in Y_{up}. 综上,这就证明了\{s_i : i\in\mathbb{N}\}\subseteq Y_{up}.

我们朝我们的目标迈进了一步,现在就是要证明从...s_3<_{\bigcup}s_2<_{\bigcup}s_1<_{\bigcup}s_0可得到...s_3<_{up}s_2<_{up}s_1<_{up}s_0. 显而易见的是根据\leqslant_{\bigcup}定义可以从...s_3<_{up}s_2<_{up}s_1<_{up}s_0可得到...s_3<_{\bigcup}s_2<_{\bigcup}s_1<_{\bigcup}s_0,现在我们要证明其反方向. 两种论证方式. 第一种反证法:假设...s_3<_{up}s_2<_{up}s_1<_{up}s_0不成立,即其不是严格递减序列,于是存在i, j\in\mathbb{N}使得j>is_i\leqslant_{up} s_j(由于\{s_i : i\in\mathbb{N}\}\subseteq Y_{up}Y_{up}为良序),进而由\leqslant_{\bigcup}定义知道有:存在i, j\in\mathbb{N}使得j>is_i\leqslant_{\bigcup} s_j,这明显与我们已知到的...s_3<_{\bigcup}s_2<_{\bigcup}s_1<_{\bigcup}s_0相矛盾,故假设不成立,于是...s_3<_{up}s_2<_{up}s_1<_{up}s_0成立.             第二种直接证法:设i, j\in\mathbb{N}j>i. 由...s_3<_{\bigcup}s_2<_{\bigcup}s_1<_{\bigcup}s_0是严格单调递减可知有s_j<_{\bigcup}s_i,再由\leqslant_{\bigcup}定义知道有存在某个(Y, \leqslant)\in A使得s_j<s_i. 但是由于有(Y, \leqslant), (Y_{up}, \leqslant_{up})\in A且A为全序,由序\preceq定义(即对于可以判断\preceq关系的两偶(Y, \leqslant), (Y', \leqslant')其中的\leqslant, \leqslant'是保持序结构的. 也许这个观察可以早点提出来使得证明更简略一点.)知道恒有s_j<_{up} s_i. 这就完成了证明.

至此我们看到\{s_i : i\in\mathbb{N}\}\subseteq Y_{up}...s_3<_{up}s_2<_{up}s_1<_{up}s_0,这与Y_{up}是良序相矛盾,于是我们的大假设“S不是序\leqslant_{\bigcup}下的良序集”不成立,于是S是良序故其有最小元y_S\in S.

至此\bigcup\{Y : (Y, \leqslant)\in A\}的任一非空子集均有最小元.

至此我们可以说(\bigcup\{Y : (Y, \leqslant)\in A\}, \leqslant_{\bigcup})是良序. 这就证明了(\bigcup\{Y : (Y, \leqslant)\in A\}, \leqslant_{\bigcup})\in\Omega.

 

现在我们终于可以考虑(\bigcup\{Y : (Y, \leqslant)\in A\}, \bigcup\{\leqslant : (Y, \leqslant)\in A\})是否是A的上界了.

(Y_0, \leqslant_0)\in A. 为了讨论方便,我们先证明\leqslant_0, \leqslant_{\bigcup}是保持序结构的.

对任意y, y'\in Y_0:若y\leqslant_0 y'则由\leqslant_{\bigcup}定义容易证明y\leqslant_{\bigcup} y';若y\leqslant_{\bigcup} y'同由\leqslant_{\bigcup}定义知存在(Y', \leqslant')\in A使得y\leqslant' y',再由A为全序的和(Y_0, \leqslant_0), (Y', \leqslant')\in A可证得y\leqslant_0 y'.

于是我们看到\leqslant_0, \leqslant_{\bigcup}是在集合Y_0上是相等的,故不妨直接使用\leqslant来代表\leqslant_0, \leqslant_{\bigcup},具体\leqslant代表哪个要根据上下文具体讨论的集合是Y_0还是\bigcup\{Y : (Y, \leqslant)\in A\}来判断(由于Y_0在集合A中的任意性,故对任意(Y, \leqslant)\in A我们将不再区分\leqslant, \leqslant_{\bigcup},下面的等式推导8.5.19.3将不再说明此事.).

由上我们可以考虑(Y_0, \leqslant)是否有一个上界(\bigcup\{Y : (Y, \leqslant)\in A\}, \leqslant).

分类讨论. 若\bigcup\{Y : (Y, \leqslant)\in A\}\backslash Y_0为空集:则说明\bigcup\{Y : (Y, \leqslant)\in A\}\subseteq Y_0. 同时我们易知Y_0\subseteq \bigcup\{Y : (Y, \leqslant)\in A\},于是看到\bigcup\{Y : (Y, \leqslant)\in A\}=Y_0. 于是我们看到(Y_0, \leqslant)\preceq(\bigcup\{Y : (Y, \leqslant)\in A\}, \leqslant),也即(Y_0, \leqslant_0)\preceq(\bigcup\{Y : (Y, \leqslant)\in A\}, \leqslant_{\bigcup}).

\bigcup\{Y : (Y, \leqslant)\in A\}\backslash Y_0非空:由(\bigcup\{Y : (Y, \leqslant)\in A\}, \leqslant)为良序知\bigcup\{Y : (Y, \leqslant)\in A\}\backslash Y_0为良序,故可取其最小元记为y_{min}. 于是我们得到一阶命题:对一切y\in\bigcup\{Y : (Y, \leqslant)\in A\}\backslash Y_0y_{min}\leqslant y,也即对一切y\in\bigcup\{Y : (Y, \leqslant)\in A\}有若y\notin Y_0y_{min}\leqslant y. 于是我们容易看到对一切y'\in\{y\in\bigcup\{Y : (Y, \leqslant)\in A\} : y<y_{min}\}y'\in Y_0. 这就证明了\{y\in\bigcup\{Y : (Y, \leqslant)\in A\} : y<y_{min}\}\subseteq Y_0.             现在我们来证明Y_0\subseteq\{y\in\bigcup\{Y : (Y, \leqslant)\in A\} : y<y_{min}\}. 显然的是我们只需要证明:对一切y\in Y_0均有y< y_{min}即可. 现在开始论证:因为从y_{min}\in\bigcup\{Y : (Y, \leqslant)\in A\}\backslash Y_0知存在某个(Y_{min}, \leqslant_{min})\in A\backslash\{(Y_0, \leqslant_0)\}使得y_{min}\in Y_{min},且y_{min}\notin Y_0. 由于A是全序的,故可以看到有“(Y_{min}, \leqslant_{min})\prec(Y_0, \leqslant_0)或者(Y_0, \leqslant_0)\prec(Y_{min}, \leqslant_{min})”. 但是当(Y_{min}, \leqslant_{min})\prec(Y_0, \leqslant_0)时可以看到Y_{min}\subseteq Y_0,进而看到y_{min}\in Y_0,这个矛盾说明这是不可能的,故只能有(Y_0, \leqslant_0)\prec(Y_{min}, \leqslant_{min}). 同时我们看到y_{min}\\=\min(\bigcup\{Y : (Y, \leqslant)\in A\}\backslash Y_0)\\=\min(\bigcup\{Y\backslash Y_0 : (Y, \leqslant)\in A\})\\=\min(\bigcup\{Y\backslash Y_0 : (Y, \leqslant)\in A, (Y_0, \leqslant_0)\prec(Y, \leqslant)\})\\=\min(\{\min(Y\backslash Y_0) : (Y, \leqslant)\in A, (Y_0, \leqslant_0)\prec(Y, \leqslant)\})\\=\min(\{\min(Y\backslash \{y\in Y : y<x_Y\}) : (Y, \leqslant)\in A, (Y_0, \leqslant_0)\prec(Y, \leqslant)\})(x_Y\in Y)\\=\min(\{\min(\{y\in Y : x_Y\leqslant y\}) : (Y, \leqslant)\in A, (Y_0, \leqslant_0)\prec(Y, \leqslant)\})(x_Y\in Y)\\=\min(\{x_Y : (Y, \leqslant)\in A, (Y_0, \leqslant_0)\prec(Y, \leqslant)\})(x_Y\in Y).[8.5.19.3,推理过程中要注意到每个x_Y是存在且是唯一的(这个很容易证明)] 而对一切(Y, \leqslant)\in A如果(Y_0, \leqslant_0)\prec(Y, \leqslant)我们已经知有Y_0=\{y\in Y : y<x_Y\}(x_Y\in Y),进而对一切y\in Y_0对一切(Y, \leqslant)\in A如果(Y_0, \leqslant_0)\prec(Y, \leqslant)那么有y<x_Y,进而可以看到\displaystyle Y_0\subseteq\{y\in\bigcup\{Y' : (Y', \leqslant')\in A\} : y<\min(\{x_Y : (Y, \leqslant)\in A, (Y_0, \leqslant_0)\prec(Y, \leqslant)\})\}(x_Y\in Y),也即Y_0\subseteq\{y\in\bigcup\{Y' : (Y', \leqslant')\in A\} : y<y_{min}\}.             综上于是看到Y_0=\{y\in\bigcup\{Y' : (Y', \leqslant')\in A\} : y<y_{min}\}. 于是在“\bigcup\{Y : (Y, \leqslant)\in A\}\backslash Y_0非空”的前提下我们也有(Y_0, \leqslant)\prec(\bigcup\{Y : (Y, \leqslant)\in A\}, \leqslant),也即(Y_0, \leqslant_0)\preceq(\bigcup\{Y : (Y, \leqslant)\in A\}, \leqslant_{\bigcup}).

于是我们终于看到(\bigcup\{Y : (Y, \leqslant)\in A\}, \bigcup\{\leqslant : (Y, \leqslant)\in A\})是A的上界了.

其实在证明“Y_0\subseteq\{y\in\bigcup\{Y : (Y, \leqslant)\in A\} : y<y_{min}\}”的情形下反证法论证更容易简便. 只不过我想尝试一下直接证明到底有多繁琐,嘻嘻. 反证法如下:假设存在y_0\in Y_0使得y_{min}\leqslant y_0. 类似直接证明前半部分的论证我们知道(Y_0, \leqslant_0)\prec (Y_{min}, \leqslant_{min})(y_{min}\in Y_{min}\backslash Y_0),于是我们看到y_0\in Y_0=\{y\in Y_{min} : y<_{min} x_{Y_{min}}\}(x_{Y_{min}}\in Y_{min}),即有y_0<_{min} x_{Y_{min}}. 同时由于y_{min}\in Y_{min}\backslash Y_0我们看到x_{Y_{min}}\leqslant_{min} y_{min},结合假设“y_{min}\leqslant y_0”我们看到x_{Y_{min}}\leqslant_{min} y_0.             综上我们看到x_{Y_{min}}\leqslant_{min} y_0y_0<_{min} x_{Y_{min}},这个矛盾说明我们的假设不成立,于是对一切y\in Y_0均有y<y_{min},进而看到Y_0\subseteq\{y\in\bigcup\{Y' : (Y', \leqslant')\in A\} : y<y_{min}\}.

 

 

综上,由Zorn引理知\Omega有最大元,其最大元就是X的良序.

 

 

 

现在来证明:良序原理\Longrightarrow选择公理.

已知I为集合且对任意\alpha\in IX_\alpha\neq\emptyset.

I=\emptyset容易知\displaystyle\prod_{\alpha\in I}=\{()\}. 也即空函数\displaystyle():\emptyset\rightarrow\emptyset\in\prod_{\alpha\in I}.

I\neq\emptyset,容易知\displaystyle\bigcup_{\alpha\in I}X_\alpha非空. 由良序原理知道存在一个良序\displaystyle(\bigcup_{\alpha\in I}X_\alpha, \leqslant). 由\displaystyle X_\alpha\subseteq\bigcup_{\alpha\in I}X_\alphaX_\alpha非空可知X_\alpha为非空良序集(以\leqslant为序),故可取其最小元x_\alpha\in X_\alpha. 于是我们找到了(X_\alpha)_{\alpha\in I}的选择函数(即取每个集合的最小元),故选择公理成立.

 

 

 

至此,我们知道选择公理、Zorn引理和良序原理彼此都是等价的.

2023.12.7补充: 一点题外话. 正如§8.4中所说的那样,我们是否应该接受“选择公理”这件事受到数学、逻辑学、哲学等领域的关注. 如果我们选择接受“选择公理”,那么这就相当于我们接受了“良序原理”. 现在考虑实数集\mathbb{R}上的良序,我们知道“存在”\mathbb{R}上的良序(\mathbb{R}, \leqslant_{well-ordering}),但是我们却不能找到\mathbb{R}上的一个明显的良序(这里“明显的”意指:对任意非空集合X\subseteq\mathbb{R},我们可以由集合X的具体表示形式(比如\{0, 1\}, \{i\in\mathbb{N} : 0\leqslant i\leqslant 1\}, \{x\in\mathbb{R} : x^2-x=0\}就是同一个集合的不同表示形式)所蕴含的信息根据此良序得到X的具体的、有确定数值的、可计算的、可构造的、按某种步骤可知晓的等等类似表述的最小元(当然是在此良序意义下).). 本质上这是因为实数集\mathbb{R}是不可数集. 回顾习题8.5.16的解答,我们说“实数集\mathbb{R}是不可数集”是在通常的相等关系=视角下,也即只有在实直线上的每个点都是两两互异的观念下才有“实数集\mathbb{R}是不可数集”. 但正如习题8.5.16的解答中我对相等关系的讨论,我们可以扩展“相等”的含义而使其具有外延,也即把等价关系~看成是一个新的相等关系. 我们可以证明一个集合X上的等价关系可以由集合X的一个互不相交分类P(\bigcup P=X, \forall p_1, p_2\in P\text{ we have }p_1\neq p_2\rightarrow p_1\cap p_2=\emptyset)来刻画,比如通常的相等关系=(其也是一个等价关系)可以由集族\{\{x\} : x\in X\}来刻画. 于是在这样的视角下,对\mathbb{R}考虑集族\{\mathbb{R}\},这就是说我们认为实数集中的元素都是(依等价关系外延上)相等的,换句话说实直线上的每个点就只是点而已(本质上没有什么区别或不同). 也即我们对\mathbb{R}考虑二元关系\leqslant_{Nothing}x\leqslant_{Nothing} y当且仅当x\in\mathbb{R}\leftrightarrow y\in\mathbb{R}(或者更简单的x\in\mathbb{R}\text{ and }y\in\mathbb{R}),容易验证\leqslant_{Nothing}\mathbb{R}上的一个等价关系. 既然我们现在拥有了\mathbb{R}上的一个新的等价关系\leqslant_{Nothing}(区别于通常的相等关系=),进一步地我们可以定义新实数:形如“\cdot x”的对象叫作新实数,其中x\in\mathbb{R}. 我们说两个新实数看作是相等的\cdot x=\cdot y当且仅当x\leqslant_{Nothing} y(新实数\cdot x(x\in\mathbb{R})的集合论解释是\cdot x:=\{y\in\mathbb{R} : x\leqslant_{Nothing}y\}). 记全体新实数组成的集合为\Join:=\{\cdot x : x\in\mathbb{R}\}=\{\{y\in\mathbb{R} : x\leqslant_{Nothing}y\} : x\in\mathbb{R}\}=\{\mathbb{R} : x\in\mathbb{R}\}=\{\mathbb{R}\}(使用\Join这个符号的灵感来源于符号\infty). 由于容易看到对任意的两个新实数\cdot x, \cdot y\in\Join都有\cdot x=\cdot y,于是从相等关系要求的“代入公理”的角度看集合\Join是个单元素集,其只包含唯一的一个元素,我们不妨记此元素为\cdot,进而可以看到\Join=\{\cdot\}. 当然现在我们的\Join还没有多大的意思,比如我们还没有对其中的新实数考虑任何运算. 我们可以采用偷懒的做法,先不对新实数定义新的运算,而是考虑对实数成立的那些运算律是否对新实数还成立. 答案是依然成立,因为本质上只不过是将实数x换成了新实数\cdot x,也即实数集\mathbb{R}可以同构地嵌入到新实数集\Join中;但同时答案从“应用”角度说是无意义的,因为任何从“代入公理”的角度看实数的那些运算律对新实数应用后得到的结果只有\cdot. 于是对实数集\mathbb{R}的直观“实直线”,我们有两种极端的理解:实直线上的每个点两两之间都是互异的VS实直线上的每个点就只是点而已(本质上没有什么区别或不同). 从前一种理解我们需要用自然数去“度量”实数,只有这样我们才能完整地认识实数,于是我们不断地做着计算来捕获越来越多的实数:自然数、整数、有理数、代数数、超越数…等等. 可是算的到头吗?通过计算真的能完整认识实数吗?从后一种理解我们本质上说无法认识实数. 我们可以对一个点“\cdot”说什么呢?点是什么、什么是点?点存在在现实中吗?本质上说,<\text{     }, \cdot>, <\text{     }, \emptyset(\{\})>, <\text{     }, 0>想要表达的意思是一样的——不存在,我们只不过是使用\cdot, \emptyset(\{\}), 0等等信息来内涵、表达、传递\text{"     "}. 就像我们在玩一个思维游戏:想象你是线段[0, 1]上的一点. 我刚开始可能是一个接一个地标记点想抓到你;到后来我借助自然数集来一次操作就标记可数个点想抓到你;最后我想到了一个绝妙的点子,直接在线段[0, 1]上覆盖一条更长的线段[-1, 1]来抓到你. 但是我真的抓到你了吗?你都是线段[0, 1]上的一个点了,那么你也就是线段[-1, 1]上的一个点,这也就是说你可以从线段[-1, 1]上“漏走”. 换句话说我们真的能抓到一个点吗?我们所处的三维空间哪里不可以看作一个点呢?哪里对点来说不是空空如也畅通无阻呢?更何况区区的线段[0, 1]. 看空了、看破了,就明白“点”是抓不住的、不可度量的,就像人心是不可测的.

 

 

 

 

 

8.5.20证明:勘误:对集族\Omega还应该假设其不含空集\emptyset.

\Omega为有限集时我们容易用普通的归纳法证明结论成立. 于是我们只需要考虑\Omega为无限集的情形.

此结论的直观是这样的:我们不断取出\Omega中元素如果满足“\Omega'中元素都不相交”就添加进\Omega'中形成新的\Omega'(\Omega'的起始为\emptyset),直到我们遍历了\Omega中的元素. 这样得到的最终\Omega'集合也是其中元素彼此不相交的,并且\Omega中每个不在\Omega'的元素至少与\Omega'的一个元素相交(假设不然,说明存在S\in\Omega\backslash\Omega'使得S与\Omega'中元素均不相交,但是我们已经遍历了\Omega中的元素,故绝不会出现此情况,假设不成立.).

这样的直观操作在\Omega是无穷集时是0.涉及到无穷步骤的,因为我们要遍历完\Omega. 于是我们希望借助Zorn引理来跨越这样的无穷步骤.

同时我们容易观察到这样的一个1.事实:只要我们还未遍历完\Omega中元素,我们就能在原\Omega'的基础上找到新的\Omega'. 这个事实对应习题8.5.15解答的最末尾对Zorn引理使用的总结“对于偏序集中满足不是最大元的元素i我们总是容易找到偏序集中另一个元素j使得i<j”,至此我们知道我们要考虑的偏序集中元素是什么了,其就是在此直观操作中形成的一系列\Omega'集合. 具体来说我们应该考虑的集合是\{\Omega'\in 2^\Omega : \forall A, B\in\Omega'\text{ we have }A\neq B\rightarrow A\cap B=\emptyset\}.

我们现在就是要为集合\{\Omega'\in 2^\Omega : \forall A, B\in\Omega'\text{ we have }A\neq B\rightarrow A\cap B=\emptyset\}找到一个偏序. 根据上面的1.事实,我们知道新\Omega'是包含旧\Omega'的,进而我们知道我们应该定义的关系是:对一切\Omega_1, \Omega_2\in\{\Omega'\in 2^\Omega : \forall A, B\in\Omega'\text{ we have }A\neq B\rightarrow A\cap B=\emptyset\},我们说\Omega_1\leqslant\Omega_2当且仅当\Omega_1\subseteq\Omega_2. 换句话说我们考虑的是(\{\Omega'\in 2^\Omega : \forall A, B\in\Omega'\text{ we have }A\neq B\rightarrow A\cap B=\emptyset\}, \subseteq)[根据习题8.5.17最后引用部分的说明,关系恰好为\subseteq时使用Zorn引理是最方便的. 但也如习题8.5.17的第一个解答,这不是使用Zorn引理所必需的.].

为了判断我们是否走在正确的道路上,我们需要验证几点:2.(\{\Omega'\in 2^\Omega : \forall A, B\in\Omega'\text{ we have }A\neq B\rightarrow A\cap B=\emptyset\}, \subseteq)是一个偏序;若其为偏序则3.其最大元就是我们要证明的结论.             对第2点我们知道这是显然的(例8.5.2也有提及).             对第3点,反证法. 假设对此偏序集的最大元S存在C\in\Omega使得对一切A\in SC\cap A=\emptyset. 进而我们看到S\cup\{C\}\in\{\Omega'\in 2^\Omega : \forall A, B\in\Omega'\text{ we have }A\neq B\rightarrow A\cap B=\emptyset\}S\subsetneq S\cup\{C\}(由于\Omega不含空集(但\Omega自身可以是空集),故C不是空集且2^\Omega中元素不含空集(但2^\Omega中元素可以是空集),进而\{\Omega'\in 2^\Omega : \forall A, B\in\Omega'\text{ we have }A\neq B\rightarrow A\cap B=\emptyset\}的最大元S不含空集,即S中的元素不是空集.),这个矛盾帮助我们完成证明.

于是我们确信我们走在正确的方向上,接下来就是借助Zorn引理证明偏序(\{\Omega'\in 2^\Omega : \forall A, B\in\Omega'\text{ we have }A\neq B\rightarrow A\cap B=\emptyset\}, \subseteq)有最大元.

有一个平凡的情形是\Omega=\emptyset,此时\Omega'=\emptyset是符合要求的. 也即我们发现\emptyset\in\{\Omega'\in 2^\Omega : \forall A, B\in\Omega'\text{ we have }A\neq B\rightarrow A\cap B=\emptyset\},于是\{\Omega'\in 2^\Omega : \forall A, B\in\Omega'\text{ we have }A\neq B\rightarrow A\cap B=\emptyset\}非空.

设D为\{\Omega'\in 2^\Omega : \forall A, B\in\Omega'\text{ we have }A\neq B\rightarrow A\cap B=\emptyset\}的全序子集. 接下来我们将证明\bigcup D为D的上界.             1.显然的是对一切集合d\in Dd\subseteq\bigcup D;             2.对任意x\in\bigcup D有:存在d_x\in D使得x\in d_x. 而d_x\in D\subseteq\{\Omega'\in 2^\Omega : \forall A, B\in\Omega'\text{ we have }A\neq B\rightarrow A\cap B=\emptyset\},于是我们看到d_x\in 2^\Omega,即d_x\subseteq\Omega,进而x\in d_x\subseteq\Omega. 综上我们看到\bigcup D\subseteq\Omega,即\bigcup D\in 2^\Omega.             3.而对任意x_1, x_2\in\bigcup D,如果x_1\neq x_2:由x_1, x_2\in\bigcup D知存在d_1, d_2\in D使得x_1\in d_1, x_2\in d_2,由于D为全序故知d_1, d_2之间有一个包含另一个,不妨假定d_1\subseteq d_2,进而看到x_1, x_2\in d_2,再由d_2\in\{\Omega'\in 2^\Omega : \forall A, B\in\Omega'\text{ we have }A\neq B\rightarrow A\cap B=\emptyset\}结合x_1\neq x_2我们看到x_1\cap x_2=\emptyset.             综合2.和3.可知\bigcup D\in\{\Omega'\in 2^\Omega : \forall A, B\in\Omega'\text{ we have }A\neq B\rightarrow A\cap B=\emptyset\}. 再结合1.我们知道\bigcup D为D的上界.

由Zorn引理可知集合(\{\Omega'\in 2^\Omega : \forall A, B\in\Omega'\text{ we have }A\neq B\rightarrow A\cap B=\emptyset\}, \subseteq)确实有最大元. 其最大元满足题目要求.

 

 

 

现在来证明题目的结论蕴含习题8.4.2的结论.

题目结论:设X是集合,并设\Omega\subseteq 2^X是X的一个不含空集的子集族(即\emptyset\notin\Omega),那么存在一个子族\Omega'\subseteq\Omega使得\Omega'中的元素是两两不相交的且\Omega中的每个元素至少与\Omega'中的一个元素相交.

从选择公理思考习题8.4.2的结论是十分自然的,前面我们已经说明题目结论的直观是怎样的,如果考虑集合\displaystyle X:=\bigcup_{\alpha\in I}X_\alpha\Omega:=\{X_\alpha : \alpha\in I\}显然我们只能得到一个不满足习题8.4.2结论要求的集族\Omega'=\Omega(除去某些平凡的例子,如\Omega=\emptyset,或者对一切\alpha\in IX_\alpha为单元素集等.).

观察习题8.4.2结论要求的形式,我们自然而然想到可以考虑集合\displaystyle X:=\bigcup_{\alpha\in I}X_\alpha\displaystyle\Omega:=\{\{x\} : x\in\bigcup_{\alpha\in I}X_\alpha\},此时容易知\Omega'=\Omega. 问题出在对每个\alpha\in I我们取出X_\alpha中的一个元素\{x\}(x\in X_\alpha)后不能阻止继续取出X_\alpha中的元素. 继续观察题目结论的直观,其能排除掉具有共同元素的集合出现在\Omega'中,于是我们可以耍一些小花招:对每个\alpha\in I,考虑\{\{x\} : x\in X_\alpha\},我们可以为\{\{x\} : x\in X_\alpha\}中的所有\{x\}添加同一个标记而利用上题目结论直观帮助我们对每个\alpha\in I只取出X_\alpha中的一个元素. 具体来说,我们可以考虑:\displaystyle\Omega:=\{\{\alpha, x\} : x\in\bigcup_{\alpha\in I}X_\alpha\}(\alpha为使得x\in X_\alpha,由于对不同的\beta_1, \beta_2\in IX_{\beta_1}\cap X_{\beta_2}=\emptyset于是我们知道\alpha是唯一的,不会出现不良定义.),对于X具体是什么我们可以暂时不考虑因为我们总可以根据我们的\Omega拼凑出来. 于是我们可以知道题目的提示是怎样思考得来的了,虽然题目提示在\Omega的具体形式上和我提出的略有不同,但思考的解决方式是一致的. 如果按照我所构造的集合\displaystyle\Omega:=\{\{\alpha, x\} : x\in\bigcup_{\alpha\in I}X_\alpha\},在最后从\Omega'的每个元素\{\alpha, x\}提取出我们需要的x进而组成习题8.4.2要求的集合Y时,我们遇到了一个困难就是我们无法区分\{\alpha, x\}中到底哪个是\alpha而哪个是x,于是为了区分\{\alpha, x\}中元素我们将其改造成\{(0, \alpha), (1, x)\}形式.

我啰啰嗦嗦写下具体的思考过程,主要是因为考虑到严格的证明可能会隐藏真正的points. 而其实严格的证明只是思考数学的最后一个步骤,其主要作用是从逻辑上排除掉(所有)可能的错误或者发现未考虑到的情形而确保你的解决方法是正确周全的. 更甚者,严格证明可以写的非常形式化,让读的人可以跟随其证明步骤验证证明是正确无误的但可能永远get不到其思考切入点. 好一点的作者会提及思考切入点、具体思路或者直观理解. 学会思考远比写下一个证明重要,证明只不过是你思考的严格表述,至于证明的细枝末节你自己应该可以胸有成竹地写下来. 也就是说写证明这件事与学骑自行车、学游泳没有本质区别,在经过大量的训练后总是可以学好的;至于你的思考正不正确就要通过写下一个证明或者参考别人的证明思路来判断.

现在我们来写下严格的证明.

依提示我们考虑\Omega:=\{\{(0, \alpha), (1, x_\alpha)\} : \alpha\in I, x_\alpha\in X_\alpha\}(当然\Omega的严格表示是\Omega:=\bigcup\{\{\{(0, \alpha), (1, x)\} : x\in X_\alpha\} : \alpha\in I\},前者是由万有分类公理得来的概括形式,至于这里为什么可以使用万有分类公理公理3.8详见《陶哲轩实分析》(中文第一版)——§3.4解答中对习题3.4.6的评论. 当然我们可以证明\bigcup\{\{\{(0, \alpha), (1, x)\} : x\in X_\alpha\} : \alpha\in I\}和前面的讨论我给出的\displaystyle\{\{(0, \alpha), (1, x)\} : x\in\bigcup_{\alpha\in I}X_\alpha\}(x\in X_\alpha)是相等的,严格证明就不妨采用提示中的形式了.)

由题目8.5.20的结论我们知:存在\Omega'\subseteq\Omega使得\Omega'中元素彼此均不相交且\Omega中每个元素都至少与\Omega'的一个元素相交. 进而用反证法容易证明“对任意\alpha\in I存在x\in X_\alpha使得\{(0, \alpha), (1, x)\}\in\Omega'”,进而容易证明“对任意\alpha\in I恰存在一个x\in X_\alpha使得\{(0, \alpha), (1, x)\}\in\Omega'”.

我们定义集合Y:=\{x : \{(0, \alpha), (1, x)\}\in\Omega'\},接下来就是证明集合Y就是习题8.4.2要求的集合.

对任意\beta\in I,我们已经知“对任意\alpha\in I恰存在一个x\in X_\alpha使得\{(0, \alpha), (1, x)\}\in\Omega'”,于是恰存在一个x_\beta\in X_\beta使得\{(0, \beta), (1, x_\beta)\}\in\Omega'. 进而我们看到x_\beta\in Y,于是Y\cap X_\beta\neq\emptyset. 反证法简单论证我们将看到\#(Y\cap X_\beta)=1. 这就完成了证明.

 

 

 

 

 

 

 

文内补充

1.全序集的任何子集都是全序的.

显然.

 

 

2.良序集的每个子集还是良序的.

显然.

 

 

3.注8.5.11的“为什么?”.

因为对于真蕴涵关系来说,前件为真(不管是实质真还是空真,此处的情况为空真)时后件必为真.

 

 

4.定义8.5.12中“为什么这是等价的?”.

显然.

 

 

5.X的子集\{x_0\}显然是好的.

显然.

 

 

6.Y_\infty也以x_0为其最小元.

反证法容易证明,或者直接证明也可以.

 

 

7.此事对于每个使得A\cap Y'非空的好集合Y'都成立.(详见勘误,修改表述原因是对非空集合才会考虑其最小元. 此修改不会影响接下来证明,即书中接下来的论证无需修改就是有效的.)

显然. 因为:当Y\subseteq Y'A\cap Y'=A\cap((Y'\cap Y)\cup(Y'\backslash Y))=\{A\cap Y\}\cup(\{Y'\backslash Y\}\cap A).             当Y'\subseteq YA\cap Y=A\cap((Y\cap Y')\cup(Y\backslash Y'))=\{A\cap Y'\}\cup(\{Y\backslash Y'\}\cap A).

 

 

8.x_0\displaystyle Y_\infty\cup\{s(Y_\infty)\}的最小元.

显然.

 

 

9.选择公理紧密联系于序集理论.

 

 

10.定义8.5.1(偏序集)中的反对称性已经默认在X上有一个相等“=”关系. 从反对称性可以看到x<y, y<x不能同时成立. 同时从偏序集定义可以看到“如果有a<b, b<ca<c.”.

 

 

11.最大元和最小元都是相对的. 某个元素在某个序下是某个集合的最大元,那么在此集合的另一个序下可以变成最小元,比如\leqslant\geqslant.

 

 

12.偏序集可以有多个最大元和多个最小元.

 

 

13.命题8.5.10应该看作“归纳原理的集合版本”. 良序集自动服从强归纳原理.

 

 

14.从定义8.5.12容易得到:有上界但无严格上界的集合必有最大元,其一个(同时容易证明是唯一的)最大元就是前面提到的上界. 详见习题8.5.14的讨论.

 

 

15.引理8.5.14中“它没有严格上界”应该说明:严格上界应严格限定于X中.

 

 

16.引理8.5.14直观中步骤“从Y:=\{x_0\}开始不断添加严格上界进Y中”重复有限次后得到的Y仍是以x_0为最小元的良序的理由——由习题8.5.11保证.

 

 

17.给定任何两个好集合Y和Y’,Y’\Y和Y\Y’中至少有一个为空(原文为“不空”,此处应该勘误.).

反证. 假设Y’\Y和Y\Y’均非空,于是存在x'\in Y'\backslash Y, x\in Y\backslash Y',根据习题8.5.13的结论我们看到x'<x, x<x',这是一个矛盾.

 

 

18.引理8.5.15(Zorn引理)也应该说明:a.上界严格限定于X中.

b.实际上引理8.5.15的陈述“不空的”可以省略进而Zorn引理变成“设X是一个偏序集. 如果X的每个全序子集Y都有上界那么X至少含有一个最大元.”,只要注意到X为空集时蕴含式命题“如果X的每个全序子集Y都有上界那么X至少含有一个最大元.”是空真的成立的. 但是在实践中我们总是需要X非空来保证我们可以使用引理8.5.15来得到一个最大元;在X为空集时修改后的Zorn引理变成一个空真的蕴含命题,即此时修改后的Zorn引理为真但我们却得不到X的一个最大元(因为我们可以从对全序集空集\emptyset有上界知道X非空).

 

 

19.设(X, \leqslant_X)为偏序集.

当X为有限集时对(X, \leqslant_X)可以使用哈斯图完全刻画.

当X为无穷集时,我们不能画出其哈斯图,但形如哈斯图的想象仍是行得通的. 也即——

19.1.(X, \leqslant_X)为偏序集时:X中元素可以依序\leqslant_X排成一条条链(每条链是最大的全序,其中“最大”的含义详见习题8.5.18的Hausdorff最大原理),全体的链就完全刻画了(X, \leqslant_X)

19.2.进而(X, \leqslant_X)为全序集时:表明我们只有一条链. 于是习题8.5.16的最后一问其实说的就是“我们总可以将多条链“(保持序结构)接”成一条链”;

19.3.进而(X, \leqslant_X)为良序序集时:表明我们唯一的链有唯一端点(起始)使得从此端点依序增长,并且所有由此链中元素组成的保持序结构的子链也有唯一端点使得从此端点依序增长.

 

 

20.第19.点对偏序集补充的直观可以用于以下命题——引理8.5.14、引理8.5.15、习题8.5.16结论(见19.2.).

《陶哲轩实分析》(中文第一版)——§8.4解答

习题8.4

8.4.1证明:由选择公理知\displaystyle\prod_{x\in X}Y_x非空,即存在\displaystyle g\in\prod_{x\in X}Y_x使得对一切x\in Xg(x)\in Y_x. 于是我们可以定义f:X\rightarrow Y, f(x):=g(x). 故选择公理\Longrightarrow命题8.4.7.

如果命题8.4.7成立,设I是集合并且对每个\alpha\in IX_\alpha为非空集合. 我们记\displaystyle Y:=\bigcup_{\alpha\in I}X_\alpha. 定义关于对象\alpha\in I和对象y\in Y的性质P(\alpha, y)为:y\in X_\alpha. 那么对每个\alpha\in I,由于X_\alpha非空,则存在y\in X_\alpha\subseteq Y使P(\alpha, y)成立. 由命题8.4.7知存在函数f:I\rightarrow Y,对一切\alpha\in IP(\alpha, f(\alpha))成立,即f(\alpha)\in X_\alpha成立,进而\displaystyle f\in\prod_{\alpha\in I}X_\alpha. 故命题8.4.7\Longrightarrow选择公理.

综上,选择公理\Longleftrightarrow命题8.4.7.

 

8.4.2证明:由选择公理知存在\displaystyle f\in\prod_{\alpha\in I}X_\alpha. 我们定义Y:=\{f(\alpha) : \alpha\in I\}. 对于一切\alpha\in If(\alpha)\subseteq Y并且f(\alpha)\subseteq X_\alpha,故Y\cap X_\alpha\neq\emptyset. 而对任何a\in Y\cap X_\alpha,有对某\alpha'\in Ia=f(\alpha')a\in X_\alpha,而我们有a=f(\alpha')\in X_{\alpha'},即a\in X_{\alpha'}a\in X_\alpha. 由于“如果\alpha\neq\alpha'X_\alpha\cap X_{\alpha'}=\emptyset”,故有\alpha'=\alpha,进而a=f(\alpha). 综上,Y\cap X_\alpha为单元素集\{f(\alpha)\},故\#(Y\cap X_\alpha)=1. 故选择公理\Longrightarrow存在集合Y使得对一切\alpha\in I\#(Y\cap X_\alpha)=1.

如果上述命题对任意I以及不空的不相交的集合X_\alpha(\alpha\in I)都成立,我们设I是集合,并且对每个\alpha\in IX_\alpha非空. 定义集合X'_\alpha:=\{\alpha\}\times X_\alpha. 容易证明对一切不同的\alpha_1,\alpha_2\in IX'_{\alpha_1}\cap X'_{\alpha_2}=\emptyset. 进而由上述命题知存在一个集合Y使得对一切\alpha\in I\#(Y\cap X'_\alpha)=1. 于是定义函数\displaystyle f:I\rightarrow\bigcup_{\alpha\in I}X_\alpha, f(\alpha):=g(Y\cap X'_\alpha)(其中g为取二元组的第二分量的函数). 于是有\displaystyle f\in\prod_{\alpha\in I}X_\alpha. 综上,选择公理\Longleftrightarrow存在集合Y使得对一切\alpha\in I\#(Y\cap X_\alpha)=1.

 

8.4.3证明:对每个\alpha\in A,定义X_\alpha:=g^{-1}(\{\alpha\})=\{b\in B: g(b)=\alpha\}. 由于g为满射,则X_\alpha非空. 由选择公理知存在\displaystyle f\in\prod_{\alpha\in A}X_\alpha. 此时对任意\alpha_1,\alpha_2\in A,如果\alpha_1\neq \alpha_2,由于f(\alpha_1)\in X_{\alpha_1},即有g(f(\alpha_1))=\alpha_1,同理我们可以知g(f(\alpha_2))=\alpha_2,由于\alpha_1\neq \alpha_2,即g(f(\alpha_1))\neq g(f(\alpha_2)),则f(\alpha_1)\neq f(\alpha_2),故f为单射. 而\displaystyle\bigcup_{\alpha\in A}X_\alpha\subseteq B,则f也为从A到B的单射. 综上,选择公理\Longrightarrow上述命题.

如果上述命题对任意集合A、B以及满射函数g:B\rightarrow A成立,我们设I是集合并且对每个\alpha\in IX_\alpha非空并且所有的集合X_\alpha都不相交. 对任意\alpha\in I,我们考虑从集合X_\alpha\{\alpha\}的函数f_\alpha(x):=\alpha,由于X_\alpha非空,故f为满射函数,进而知存在单射函数g_\alpha:\{\alpha\}\rightarrow X_\alpha. 综上,对每个\alpha\in I,都存在单射函数g_\alpha:\{\alpha\}\rightarrow X_\alpha(注意,这并没有用到选择公理,因为我们不是从集合族X_\alpha(\alpha\in I)通过选择公理从每个集合中选出一个代表元素). 由此我们可以构建集合Y:=\{g_\alpha(\alpha) : \alpha\in I\}. 对一切\alpha\in I,显然存在g_\alpha(\alpha)\in Y\cap X_\alpha. 我们假设仍然存在x\in Y\cap X_\alpha,进而对某\alpha'\in Ix=g_{\alpha'}(\alpha'),进而有x\in X_{\alpha'}. 而我们已经知道x\in Y\cap X_\alpha,进而x\in X_\alpha,于是x\in X_\alpha\cap X_{\alpha'},由于集合族X_\beta(\beta\in I)都不相交,故只能\alpha=\alpha'. 于是我们有x=g_\alpha(\alpha),这就证明了Y\cap X_a为单元素集,即\#(Y\cap X_a)=1. 再由习题8.4.2我们知道选择公理成立.

综上,命题得证.

 

 

文内补充

1.选择公理是不可解决的,即其不能被集合论的其他公理所证明或证否(前提假设是其他集合公理是相容的,这一点无法在集合论内所证实,原因是哥德尔不完备定理). 进而有:使用选择公理证明的结果绝不会与不使用选择公理证明的结果相矛盾,否则我们就证明了选择公理与集合论的其他公理是不相容的. 所以我们可以把“选择公理”看作是分析学中一个方便的、安全的、节省劳力的工具.

 

2.节8.4第一段最后一个括号里面的——“可解决(decidable)”问题的应用应该说明是指在ZF集合论框架内可解决.

 

3.公理8.1已经考虑了I为空集的情形.

 

4.选择公理有许多不同的版本,有的蕴涵另一些. 比如书上的选择公理蕴涵可数选择公理和依序选择公理. 有时候选择合适的选择公理版本可以简化证明. 比书上的选择公理强的还有全局选择公理等.

 

5.考虑习题3.5.2,定义8.4.1的定义不是很严谨. 但我们可以仿照习题3.5.2的解决办法来解决此问题.

《陶哲轩实分析》(中文第一版)——§8.3解答

习题8.3

8.3.1证明:由习题3.4.6我们知2^X=\{f^{-1}(\{1\}) : f\in\{0 ,1\}^X\},进而由命题3.6.14(d)知\#(2^X)=\#(\{f^{-1}(\{1\}) : f\in\{0 ,1\}^X\})=\#(\{0 ,1\}^X),再由命题3.6.14(f)知\#(2^X)=\#(\{0 ,1\}^X)=2^{\#(X)}=2^n.

 

 

 

8.3.2证明:此题目的主要是介绍了洋葱函数(Onion function). 此习题题干需要改正以及进一步的说明才能读懂下面证明,具体详见本书勘误页.

由题干和归纳法我们容易证明对一切自然数n\geqslant 0D_{n+1}=\{\underbrace{f(f(...f}_{n+1}(x)...)) : x\in D_0\}. 我们假设存在m,n \in\mathbb{N}使得m\neq nD_m\cap D_n\neq\emptyset. 由D_0的定义我们知道m=0n=0是不可能使得D_m\cap D_n\neq\emptyset的,故我们知m,n\geqslant 1,进而m-1,n-1\geqslant 0. 不失一般性,我们假设n>m. 由于D_m\cap D_n\neq\emptyset,即存在a\in D_ma\in D_n,由D_{i+1}=\{\underbrace{f(f(...f}_{i+1}(x)...)) : x\in D_0\}(i\geqslant 0)我们知存在x_m,x_n\in D_0使得\underbrace{f(f(...f}_{m-1}(x_m)...))=\underbrace{f(f(...f}_{n-1}(x_n)...))=a,由f为单射我们知道有x_m=\underbrace{f(f(...f}_{n-m}(x_n)...)),而我们有x_m\in D_0\underbrace{f(f(...f}_{n-m}(x_n)...))\in A,故等式x_m=\underbrace{f(f(...f}_{n-m}(x_n)...))不可能成立,这个矛盾帮助我们反证完成:对一切m,n \in\mathbb{N}如果m\neq nD_m\cap D_n=\emptyset.

我们容易分类讨论验证g是单射. 易证\displaystyle\bigcup_{n=1}^\infty D_n\subseteq A. 对任意y\in A\backslash\bigcup_{n=1}^\infty D_n,显然有y\in A使得g(y)=y;而对y\in B\backslash(A\backslash\bigcup_{n=1}^\infty D_n)=(B\backslash A)\cup(B\cap\bigcup_{n=1}^\infty D_n)=\bigcup_{n=0}^\infty D_n,进而由第一段的证明知恰存在一个自然数n使得y\in D_n,进而显然存在f(y)\in\bigcup_{n=1}^\infty D_n\subseteq A使得g(f(y))=f^{-1}(f(y))=y. 综上,对任意y\in B总存在x\in A使得g(x)=y,故g是满射.

实际上我们需要先验证函数g:A\rightarrow B是定义成功的. 从书上g:A\rightarrow B定义以及A\subseteq B我们知道当x\notin\bigcup_{n=1}^\infty D_n时有g(x)=x\in A\subseteq B,于是我们只需要验证另一种情形函数值也属于集合B就能说明函数g:A\rightarrow B是定义成功的了. 现在考虑x_r\in\bigcup_{n=1}^\infty D_n,进而知对某p\in\mathbb{N}^+x_r\in D_p,也即x_r\in f(D_{p-1})((p-1)\in\mathbb{N}),由于此时g(x_r)=f^{-1}(x_r)而f为双射,于是我们容易看到g(x_r)\in D_{p-1},再从D_i(i\in\mathbb{N})定义我们容易知道D_{p-1}\subseteq B,进而g(x_r)\in B,这就验证了函数g:A\rightarrow B确实是定义成功的.

 

而实际上题干中“f:C\rightarrow A是双射”这个条件比较强,我们不需要这么强的条件也是可以证明习题8.3.2的结论的(同时只有这样才能在习题8.3.3中运用上习题8.3.2的结论). 具体来说就是将题干中“f:C\rightarrow A是双射”修改成“f:C\rightarrow A是单射”.             于是我们可以看到习题8.3.2结论的第一部分“诸集合D_0, D_1, D_2, ...是互不相交的”仍然是成立的,因为原论证无需修改就可证明;       需要修改的只是习题8.3.2结论的第二部分“g:A\rightarrow B是双射”的论证. 注意此时公式g(x):=f^{-1}(x)的涵义已经发生变化:在修改前g(x):=f^{-1}(x)中逆函数f^{-1}存在性由“f:C\rightarrow A是双射”保证,而修改后逆函数f^{-1}表示的是双射函数f:C\rightarrow f(C)的逆函数)(这是“f:C\rightarrow A是单射”可以保证的).   a.进而类似的论述我们可以证明函数g:A\rightarrow B确实是定义成功的(只需要注意到当x_r\in\bigcup_{n=1}^\infty D_nx_r\in f(D_{p-1})((p-1)\in\mathbb{N})\subseteq f(C)D_{p-1}\subseteq B,于是我们可以看到g(x_r)=f^{-1}(x_r)\in D_{p-1}\subseteq B).   b.完全一样的思考过程我们容易验证g是单射.   c.类似原论述过程我们可以证明g:A\rightarrow B是满射(只需要将原证明中“f(y)\in\bigcup_{n=1}^\infty D_n\subseteq A”改成“f(y)\in\bigcup_{n=1}^\infty D_n\subseteq f(C)”).

综合a.、b.和c.我们看到g:A\rightarrow B确实是双射,这就完成了证明.

此习题的直观日后再加以补充.

 

 

 

8.3.3证明:参考Schröder-Bernstein定理的维基百科,我们有如下解答:

由题知存在单射f:A\rightarrow B, g:B\rightarrow A. 我们令C_0:=A\backslash g(B),并令C_{n+1}:=g(f(C_n)),记\displaystyle C:=\bigcup_{n=0}^\infty C_n. 我们定义函数h:A\rightarrow B,如果a\in Ch(a):=f(a);如果a\notin Ch(a):=g^{-1}(a)(g^{-1}为g的值域限制到g(B)后的逆映射). 现在我们来验证此函数h是定义成功的:显然的是我们有C\subseteq A,故当a\in C时h(a)是定义成功的;如果a\in A\backslash C,进而有a\notin C_0,进而由C_0定义知有a\in g(B),于是h(a)=g^{-1}(a)(g^{-1}:g(B)\rightarrow B, g^{-1}(x))是定义成功的.

我们容易由f, g单射性以及C_n(n\in\mathbb{N})的定义分类讨论验证h的单射性. 现在来证明其满射性:对任意b\in B,如果b\in f(C),那么存在a\in C使得b=f(a),因此此时h(a)=f(a)=b;如果b\notin f(C),即对所有a\in cb\neq f(a),我们考虑g(b)\in g(B),进而g(b)\notin C_0,我们容易用反证法和归纳得g(b)\notin C_n(n\in\mathbb{N}),进而g(b)\notin C,此时h(g(b))=g^{-1}(g(b))=b. 这就证明了h的满射性.

此习题的直观日后再加以补充.

 

 

 

8.3.4证明:显然我们有双射f:X\rightarrow\{\{x\} : x\in X\}, f(x):=\{x\}. 而\{\{x\} : x\in X\}\subseteq 2^X. 于是f为X到2^X的单射. 再由Cantor定理(定理8.3.1)知X与2^X无相同基数. 综上,X的基数严格小于2^X的基数.

由题我们知道存在单射函数g_1:A\rightarrow B, g_2:B\rightarrow C. 进而g_2\circ g_1:A\rightarrow C也是单射. 我们假设存在A到C的双射g_3,进而存在C到A的单射g_3^{-1},进而存在C到B的单射g_1\circ g_3^{-1},再由习题8.3.3中Schröder-Bernstein定理知B和C具有相同基数,这个矛盾帮助我们完成证明.

 

 

 

8.3.5证明:显然X不能为有限集和可数集. 而如果X为不可数集,则2^X为不可数集. 这就完成了证明.

《陶哲轩实分析》(中文第一版)——§10.5解答

 

习题10.5

10.5.1证明:已知g'(x_0)\neq 0,进而|g'(x_0)|>0. 由于g在x_0处可微,由命题10.1.7知:对实数\frac{1}{2}|g'(x_0)|>0,存在实数\delta>0,对一切x\in X有如果|x-x_0|\leqslant\delta|g(x)-(g(x_0)+g'(x_0)(x-x_0))|=|g(x)-g'(x_0)(x-x_0)|\leqslant\frac{1}{2}|g'(x_0)||x-x_0|. 而对一切x\in(X\cap(x_0-\delta, x_0+\delta))\backslash\{x_0\}显然有x\in X|x-x_0|\leqslant\deltax\neq x_0,进而有|g(x)-g'(x_0)(x-x_0)|\leqslant\frac{1}{2}|g'(x_0)||x-x_0|x\neq x_0,进而有\frac{1}{2}|g'(x_0)||x-x_0|\leqslant|g(x)|\leqslant\frac{3}{2}|g'(x_0)||x-x_0|x\neq x_0,进而|g(x)|\geqslant\frac{1}{2}|g'(x_0)||x-x_0|>0,进而g(x)\neq 0. 综上,对一切x\in(X\cap(x_0-\delta, x_0+\delta))\backslash\{x_0\}\frac{f(x)}{g(x)}是定义成功的.

由于x_0是X的极限点,即x_0X\backslash\{x_0\}的附着点. 对每个实数\varepsilon>0,我们取\varepsilon':=min\{\varepsilon, \frac{\delta}{2}\}>0,由于x_0X\backslash\{x_0\}的附着点,故存在x'\in X\backslash\{x_0\}使得|x'-x_0|\leqslant\varepsilon'\leqslant\frac{\delta}{2}<\delta,进而有x'\in(x_0-\delta, x_0+\delta),故存在x'\in(X\backslash\{x_0\})\cap(x_0-\delta, x_0+\delta)=(X\cap(x_0-\delta, x_0+\delta))\backslash\{x_0\}使|x'-x_0|\leqslant\varepsilon'\leqslant\varepsilon. 综上,x_0(X\cap(x_0-\delta, x_0+\delta))\backslash\{x_0\}的附着点,于是我们可以考虑函数极限\displaystyle\lim_{x\rightarrow x_0; x\in(X\cap(x_0-\delta, x_0+\delta))\backslash\{x_0\}}\frac{f(x)}{g(x)}是否存在.

由f、g在x_0处在X上可微和习题10.1.1知f、g在x_0处在X\cap(x_0-\delta, x_0+\delta)上可微,即\displaystyle\lim_{x\rightarrow x_0; x\in(X\cap(x_0-\delta, x_0+\delta))\backslash\{x_0\}}\frac{f(x)-f(x_0)}{x-x_0}=\lim_{x\rightarrow x_0; x\in(X\cap(x_0-\delta, x_0+\delta))\backslash\{x_0\}}\frac{f(x)}{x-x_0}=f'(x_0)\displaystyle\lim_{x\rightarrow x_0; x\in(X\cap(x_0-\delta, x_0+\delta))\backslash\{x_0\}}\frac{g(x)-g(x_0)}{x-x_0}=\lim_{x\rightarrow x_0; x\in(X\cap(x_0-\delta, x_0+\delta))\backslash\{x_0\}}\frac{g(x)}{x-x_0}=g'(x_0). 进而由命题9.3.14最后一条法则有\displaystyle\lim_{x\rightarrow x_0; x\in(X\cap(x_0-\delta, x_0+\delta))\backslash\{x_0\}}\frac{x-x_0}{g(x)-g(x_0)}=\frac{\displaystyle\lim_{x\rightarrow x_0; x\in(X\cap(x_0-\delta, x_0+\delta))\backslash\{x_0\}}1}{\displaystyle\lim_{x\rightarrow x_0; x\in(X\cap(x_0-\delta, x_0+\delta))\backslash\{x_0\}}\frac{g(x)}{x-x_0}}=\frac{1}{g'(x_0)}. 进而\displaystyle\lim_{x\rightarrow x_0; x\in(X\cap(x_0-\delta, x_0+\delta))\backslash\{x_0\}}\frac{f(x)}{g(x)}=\lim_{x\rightarrow x_0; x\in(X\cap(x_0-\delta, x_0+\delta))\backslash\{x_0\}}\frac{f(x)}{x-x_0}\cdot\frac{x-x_0}{g(x)}=\lim_{x\rightarrow x_0; x\in(X\cap(x_0-\delta, x_0+\delta))\backslash\{x_0\}}\frac{f(x)}{x-x_0}\cdot\lim_{x\rightarrow x_0; x\in(X\cap(x_0-\delta, x_0+\delta))\backslash\{x_0\}}\frac{x-x_0}{g(x)}=f'(x_0)\cdot\frac{1}{g'(x_0)}=\frac{f'(x_0)}{g'(x_0)}. 这就完成了证明.

 

10.5.2解释:定义函数f:\mathbb{R}\backslash\{0\}\rightarrow\mathbb{R}, f(x):=x^2\sin(x^{-4})和函数g:\mathbb{R}\rightarrow\mathbb{R}, g(x):=x. 由于f在0处无定义,进而在0处不可微,故命题10.5.1不适用. 同理命题10.5.2也不适用.

 

 

文内补充

1.命题10.5.1的适用条件.

命题10.5.1使用时看似条件许多,其实就只有三点.

  • f(x_0)=g(x_0)=0
  • f、g在x_0处在X上可微;\Longrightarrowx_0是X的极限点\Longrightarrowx_0(X\cap(x_0-\delta, x_0+\delta))\backslash\{x_0\}的附着点(\delta>0为任意实数);
  • g'(x_0)\neq 0;+第一点+第二点\Longrightarrow存在实数\delta'>0使得对一切(X\cap(x_0-\delta', x_0+\delta'))\backslash\{x_0\}g(x)\neq 0,进而\frac{f(x)}{g(x)}在此集合上有定义.

值得一提的是,如果我们还知道对一切x\in X\backslash\{x_0\}g(x)\neq 0,由命题9.3.18极限是局部的知有\displaystyle\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{f(x)}{g(x)}=\lim_{x\rightarrow x_0; x\in(X\cap(x_0-\delta', x_0+\delta'))\backslash\{x_0\}}\frac{f(x)}{g(x)},这是我们经常见到的情况.

 

2.注意命题10.5.2与命题10.5.1的区别.

如果对命题10.5.2的前提套用命题10.5.1,我们可以得出结论:\displaystyle\lim_{x\rightarrow a; x\in(a, min\{b, a+\delta\})}\frac{f(x)}{g(x)}=\frac{f'(a)}{g'(a)}(\delta>0). 如果我们还知道对一切x\in(a, b]g(x)\neq 0,我们进一步可知\displaystyle\lim_{x\rightarrow a; x\in(a, b]}\frac{f(x)}{g(x)}=\frac{f'(a)}{g'(a)}.

 

而命题10.5.2的使用条件更苛刻:

  • 函数定义域为非退化实数闭区间;(命题10.5.1没有)
  • f(a)=g(a)=0
  • f、g在整个闭区间定义域上可微;(命题10.5.1只要求在一点可微)
  • g的导函数在整个闭区间定义域上不等于0;(命题10.5.1只要求在一点不等于0)
  • \displaystyle\lim_{x\rightarrow a; x\in(a, b]}\frac{f'(x)}{g'(x)}存在.(命题10.5.1没有)

最后的结论也与命题10.5.2不相同,结论为\displaystyle\lim_{x\rightarrow a; x\in(a, b]}\frac{f(x)}{g(x)}=\lim_{x\rightarrow a; x\in(a, b]}\frac{f'(x)}{g'(x)}.

 

最后,综合命题10.5.1和命题10.5.2我们知道:设a<b是实数,f:[a, b]\rightarrow\mathbb{R}g:[a, b]\rightarrow\mathbb{R}都是[a, b]上的可微函数. 假设f(a)=g(a)=0,g’在[a, b]上不取0值,并且\displaystyle\lim_{x\rightarrow a; x\in(a, b]}\frac{f'(x)}{g'(x)}存在.

我们有结论——\displaystyle\lim_{x\rightarrow a; x\in(a, b]}\frac{f(x)}{g(x)}=\lim_{x\rightarrow a; x\in(a, b]}\frac{f'(x)}{g'(x)}=\frac{f'(a)}{g'(a)}.

于是我们发现函数\frac{f'}{g'}:[a, b]\rightarrow\mathbb{R}x=a处连续.

 

3.注10.5.3的进一步说明.

命题10.5.2变形一:设a<b是实数,f:[a, b]\rightarrow\mathbb{R}g:[a, b]\rightarrow\mathbb{R}都是[a, b]上的可微函数. 假设f(b)=g(b)=0,g’在[a, b]上不取0值,并且\displaystyle\lim_{x\rightarrow a; x\in[a, b)}\frac{f'(x)}{g'(x)}存在.

我们有结论——\displaystyle\lim_{x\rightarrow b; x\in[a, b)}\frac{f(x)}{g(x)}=\lim_{x\rightarrow b; x\in[a, b)}\frac{f'(x)}{g'(x)}=\frac{f'(b)}{g'(b)}.

其证明由命题10.5.2类似的证明和命题10.5.1知.

 

命题10.5.2变形二:设a<c<b是实数,f:[a, b]\rightarrow\mathbb{R}g:[a, b]\rightarrow\mathbb{R}都是[a, b]上的可微函数. 假设f(c)=g(c)=0,g’在[a, b]上不取0值,并且\displaystyle\lim_{x\rightarrow c; x\in[a, b]\backslash\{c\}}\frac{f'(x)}{g'(x)}存在(或者等价的\displaystyle\lim_{x\rightarrow c; x\in[a, c)}\frac{f'(x)}{g'(x)}\displaystyle\lim_{x\rightarrow c; x\in(c, b]}\frac{f'(x)}{g'(x)}都存在且相等).

我们有结论——\displaystyle\lim_{x\rightarrow c; x\in[a, b]\backslash\{c\}}\frac{f(x)}{g(x)}=\lim_{x\rightarrow c; x\in[a, b]\backslash\{c\}}\frac{f'(x)}{g'(x)}=\frac{f'(c)}{g'(c)}.

证明:我们可以从两个闭区间[a, c]、[c, b]入手. 第一个区间使用上面的命题10.5.2变形一并且第二个区间使用命题10.5.2,我们可以得到\displaystyle\lim_{x\rightarrow c; x\in[a, c)}\frac{f(x)}{g(x)}=\lim_{x\rightarrow c; x\in[a, c)}\frac{f'(x)}{g'(x)}=\lim_{x\rightarrow c; x\in[a, b]\backslash\{c\}}\frac{f'(x)}{g'(x)}=\frac{f'(c)}{g'(c)}\displaystyle\lim_{x\rightarrow c; x\in(c, b]}\frac{f(x)}{g(x)}=\lim_{x\rightarrow c; x\in(c, b]}\frac{f'(x)}{g'(x)}=\lim_{x\rightarrow c; x\in[a, b]\backslash\{c\}}\frac{f'(x)}{g'(x)}=\frac{f'(c)}{g'(c)}. 再由命题9.5.3类似的论证我们知道\displaystyle\lim_{x\rightarrow c; x\in[a, b]\backslash\{c\}}\frac{f(x)}{g(x)}=\lim_{x\rightarrow c; x\in[a, b]\backslash\{c\}}\frac{f'(x)}{g'(x)}=\frac{f'(c)}{g'(c)}. 这就完成了证明.

 

4.命题10.5.2的进一步说明.

回顾命题10.5.2的证明,我们发现其并不要求g'(a)\neq 0,只要求g'在(a, b]不取零值就可以了. 故命题10.5.2的题干“g’在[a, b]不取零值”可以改为“g’在(a, b]不取零值”. 同时也要注意的是,这样做后命题10.5.1不再适用,就不能得出\displaystyle\lim_{x\rightarrow a; x\in(a, b]}\frac{f'(x)}{g'(x)}=\frac{f'(a)}{g'(a)}(函数\frac{f'}{g'}:[a, b]\rightarrow\mathbb{R}x=a处连续).

《陶哲轩实分析》(中文第一版)——§10.4解答

习题10.4

10.4.1证明:(a)考虑函数f:[0, +\infty)\rightarrow\mathbb{R}, f(x):=x^n. 对任意实数a>0,考虑函数f|_{[0, a]}:[0, a]\rightarrow\mathbb{R},对任意x,y\in[0, a],如果x<y,由命题5.6.3知有x^n<y^n,进而f|_{[0, a]}在[0, a]上严格单调增. 再由命题9.4.9或命题9.4.11(使用命题9.4.11需补充在x=0处的连续性)容易证明f|_{[0, a]}在[0, a]上连续. 综上由命题9.8.3知f|_{[0, a]}[0, a][f|_{[0, a]}(0), f|_{[0, a]}(a)]=[f(0), f(a)]=[0, a^n]的双射,并且其逆映射h_a:[0, a^n]\rightarrow[0, a]也是连续且严格单调增的,下面我们来确定h_a的显式表达式:对任意x\in[0, a^n],即0\leqslant x\leqslant a^n,由引理5.6.9以及0^{\frac{1}{n}}=0(n\in\mathbb{N}^+)知有0\leqslant x^\frac{1}{n}\leqslant a,进而可以写x=(x^{\frac{1}{n}})^n=f|_{[0, a]}(x^\frac{1}{n}),进而h_a(x)=h_a(f|_{[0, a]}(x^\frac{1}{n}))=h_a\circ f|_{[0, a]}(x^\frac{1}{n})=x^\frac{1}{n}.(或者由f|_{[0, a]}[0, a][0, a^n]的双射知对每个x\in[0, a^n],恰存在一个y\in[0, a]使得y^n=x成立,即有y=x^\frac{1}{n},进而h_a(x)=x^\frac{1}{n}.)

我们假设g不在(0, +\infty)上连续,则存在x_0\in(0, +\infty)使得g在x_0处不连续. 由上论证知f|_{[0, (x_0)^\frac{1}{n}]}严格增且连续,进而h_{(x_0)^\frac{1}{n}}:[0, x_0]\rightarrow[0, (x_0)^\frac{1}{n}]连续,即有\displaystyle\lim_{x\rightarrow x_0; x\in[0, x_0]}h_{(x_0)^\frac{1}{n}}(x)=h_{(x_0)^\frac{1}{n}}(x_0)=(x_0)^\frac{1}{n}=g(x_0). 由命题9.3.18知存在实数r>0使\displaystyle\lim_{x\rightarrow x_0; x\in[0, x_0]\cap(x_0-r, x_0+r)}h_{(x_0)^\frac{1}{n}}(x)=\lim_{x\rightarrow x_0; x\in[0, x_0]}h_{(x_0)^\frac{1}{n}}(x)=g(x_0). 同理我们可证\displaystyle\lim_{x\rightarrow x_0; x\in[0, x_0+r]}h_{(x_0+r)^\frac{1}{n}}(x)=h_{(x_0+r)^\frac{1}{n}}(x_0)=(x_0)^\frac{1}{n}=g(x_0). 现在来证明g在x_0处连续:对任意实数\varepsilon>0,存在上面给出的实数r,对每个x\in(0, +\infty),如果|x-x_0|<r,进而有x\in[0, x_0+r],由于已知\displaystyle\lim_{x\rightarrow x_0; x\in[0, x_0+r]}h_{(x_0+r)^\frac{1}{n}}(x)=h_{(x_0+r)^\frac{1}{n}}(x_0)=(x_0)^\frac{1}{n}=g(x_0),进而存在实数r'>0,对每个x'\in[0, x_0+r],如果|x'-x_0|<r'|(x')^\frac{1}{n}-g(x_0)|\leqslant\varepsilon. 我们取\delta:=min\{r, r'\},如果|x-x_0|<\delta,进而有x\in[0, x_0+r]|x-x_0|<r',进而|g(x)-g(x_0)|\leqslant\varepsilon. 综上,有\displaystyle\lim_{x\rightarrow x_0; x\in(0, +\infty)}g(x)=g(x_0). 这个矛盾帮助我们完成证明,故假设不成立,即g在(0, +\infty)上连续.

值得一提的小细节,如果我们在0处定义g(0):=0=0^\frac{1}{n},那么g仍然是在[0, +\infty)连续的. 证明很容易由命题9.4.7(b)得到.

 

(b)沿用(a)中函数f的定义,类似的论证我们知f|_{(0, +\infty)}严格增,进而是单射. 对任意y\in(0, +\infty),有y^\frac{1}{n}\in(0, +\infty),此时f|_{(0, +\infty)}(y^\frac{1}{n})=(y^\frac{1}{n})^n=y,故f|_{(0, +\infty)}的值域限制到(0, +\infty)后是双射,进而类似的论证知其逆映射为h_{\infty}:(0, +\infty)\rightarrow(0, +\infty), h_{\infty}(x)=x^\frac{1}{n},即为题设的函数g. 由习题10.1.5和习题10.1.1知f|_{(0, +\infty)}(0, +\infty)上可微,并且对任意x\in (0, +\infty)f'(x)=nx^{n-1}>0. 由习题10.4.1(a)的解答知g在(0, +\infty)上连续. 至此,准备工作完成,由定理10.4.2反函数定理知对任意x\in (0, +\infty),g在x处可微并且g'(x)=\frac{1}{f'(x^\frac{1}{n})}=\frac{1}{nx^\frac{n-1}{n}}=\frac{1}{n}x^{\frac{1}{n}-1}.

同样值得一提的小细节,如果我们在0处定义g(0):=0=0^\frac{1}{n},那么g仍然是在[0, +\infty)连续的. 但g在0处不可导(发散到无穷大),在(0, +\infty)仍然可导(由命题9.3.9得到).

 

10.4.2证明:(a)由于q是比例数,即存在整数a和正整数b使得q=\frac{a}{b}. 于是对每个x\in(0, +\infty),有f(x)=x^q=x^\frac{a}{b}=(x^\frac{1}{b})^a,由习题10.4.1(b)、习题10.1.6知函数h_1,h_2:(0, +\infty)\rightarrow(0, +\infty), h_1(x):=x^\frac{1}{b}, h_2(x):=x^a是可微的,再由定理10.1.15知f'(x)=(h_2\circ h_1)'(x)=h_2'(x^\frac{1}{b})\cdot h_1'(x)=(a(x^\frac{1}{b})^{a-1})\cdot(\frac{1}{b}x^{\frac{1}{b}-1})=\frac{a}{b}x^{\frac{a}{b}-1}=qx^{q-1}.

(b)由(a)知f在1处可微,进而\displaystyle f'(1)=\lim_{x\rightarrow 1; x\in(0, +\infty)\backslash\{1\}}\frac{x^q-1}{x-1}=q\cdot 1^{q-1}=q.

 

10.4.3证明:已知\alpha是实数,同习题9.4.3类似的论证我们可以找到两比例数序列(p_n)_{n=1}^\infty(q_n)_{n=1}^\infty使得对一切自然数n\geqslant 1p_n\leqslant\alpha\leqslant q_n\displaystyle\lim_{n\rightarrow\infty}p_n=\lim_{n\rightarrow\infty}q_n=\alpha. 我们先考虑右极限\displaystyle\lim_{x\rightarrow 1; x\in(1, +\infty)}\frac{f(x)-f(1)}{x-1}是否存在.

对任意由(1, +\infty)中元素组成并且收敛到1的序列(a_n)_{n=0}^\infty,对一切正自然数m,对一切自然数n,有a_n>1p_m\leqslant\alpha\leqslant q_m,进而由命题6.7.3知有0<(a_n)^{p_m}\leqslant(a_n)^{\alpha}\leqslant(a_n)^{q_m},进而有\frac{(a_n)^{p_m}-1}{a_n-1}\leqslant\frac{(a_n)^{\alpha}-1}{a_n-1}\leqslant\frac{(a_n)^{q_m}-1}{a_n-1},由引理6.4.13比较原理知\displaystyle\limsup_{n\rightarrow\infty}\frac{(a_n)^{p_m}-1}{a_n-1}\leqslant\limsup_{n\rightarrow\infty}\frac{(a_n)^{\alpha}-1}{a_n-1}\leqslant\limsup_{n\rightarrow\infty}\frac{(a_n)^{q_m}-1}{a_n-1}. 由习题10.4.2(b)以及命题9.3.9知\displaystyle\lim_{n\rightarrow\infty}\frac{(a_n)^{p_m}-1}{a_n-1}=p_m, \lim_{n\rightarrow\infty}\frac{(a_n)^{q_m}-1}{a_n-1}=q_m,进而有\displaystyle p_m\leqslant\limsup_{n\rightarrow\infty}\frac{(a_n)^{\alpha}-1}{a_n-1}\leqslant q_m. 再由\displaystyle\lim_{m\rightarrow\infty}p_m=\lim_{m\rightarrow\infty}q_m=\alpha以及推论6.4.14知\displaystyle\lim_{m\rightarrow\infty}\limsup_{n\rightarrow\infty}\frac{(a_n)^{\alpha}-1}{a_n-1}=\limsup_{n\rightarrow\infty}\frac{(a_n)^{\alpha}-1}{a_n-1}=\alpha. 同理可证\displaystyle\liminf_{n\rightarrow\infty}\frac{(a_n)^{\alpha}-1}{a_n-1}=\alpha. 再由命题6.4.12(f)知\displaystyle\lim_{n\rightarrow\infty}\frac{(a_n)^{\alpha}-1}{a_n-1}=\alpha. 由此由命题9.3.9知有\displaystyle\lim_{x\rightarrow 1; x\in(1, +\infty)}\frac{f(x)-f(1)}{x-1}=\alpha.

同理可证\displaystyle\lim_{x\rightarrow 1; x\in(0, 1)}\frac{f(x)-f(1)}{x-1}=\alpha. 同命题9.5.3类似的论证我们有\displaystyle\lim_{x\rightarrow 1; x\in(0, +\infty)\backslash\{1\}}\frac{f(x)-f(1)}{x-1}=\alpha.

值得一提的是,由\displaystyle\lim_{x\rightarrow 1; x\in(0, +\infty)\backslash\{1\}}\frac{f(x)-f(1)}{x-1}=\alpha以及命题9.3.9知对任意由(0, +\infty)\backslash\{1\}中元素组成并且收敛到1的序列(a_n)_{n=0}^\infty有序列(\frac{(a_n)^\alpha-1}{a_n-1})_{n=0}^\infty收敛到\alpha,即\displaystyle\lim_{n\rightarrow\infty}\frac{(a_n)^\alpha-1}{a_n-1}=\lim_{n\rightarrow\infty}\frac{\displaystyle(\lim_{m\rightarrow\infty}(a_n)^{b_m})-1}{a_n-1}=\lim_{n\rightarrow\infty}\frac{\displaystyle\lim_{m\rightarrow\infty}((a_n)^{b_m}-1)}{a_n-1}=\lim_{n\rightarrow\infty}\frac{\displaystyle\lim_{m\rightarrow\infty}((a_n)^{b_m}-1)}{\displaystyle\lim_{m\rightarrow\infty}(a_n-1)}=\lim_{n\rightarrow\infty}\lim_{m\rightarrow\infty}\frac{(a_n)^{b_m}-1}{a_n-1}=\alpha. 而我们由习题10.4.2(b)知\displaystyle\lim_{m\rightarrow\infty}\lim_{n\rightarrow\infty}\frac{(a_n)^{b_m}-1}{a_n-1}=\lim_{m\rightarrow\infty}b_m=\alpha. 进而有\displaystyle\lim_{n\rightarrow\infty}\lim_{m\rightarrow\infty}\frac{(a_n)^{b_m}-1}{a_n-1}=\lim_{m\rightarrow\infty}\lim_{n\rightarrow\infty}\frac{(a_n)^{b_m}-1}{a_n-1}. 故此处极限是可以换序的. ((b_n)_{n=1}^\infty为收敛到\alpha的比例数Cauchy序列.)

(b)我们已知\displaystyle\lim_{x\rightarrow 1; x\in(0, +\infty)\backslash\{1\}}\frac{x^\alpha-1}{x-1}=\alpha. 对任意x_0\in(0, +\infty)x_0\neq 0. 对任意由集合(0, +\infty)\backslash\{x_0\}中元素组成并且收敛到x_0的序列(a_n)_{n=0}^\infty,即\displaystyle\lim_{n\rightarrow\infty}a_n=x_0\neq 0,进而有\displaystyle\lim_{n\rightarrow\infty}\frac{a_n}{x_0}=1. 由于对一切自然数n有0\neq a_n\neq x_0,进而有\frac{a_n}{x_0}\neq 0\frac{a_n}{x_0}\neq 1,进而\frac{a_n}{x_0}\in(0, +\infty)\backslash\{1\},于是序列(\frac{a_n}{x_0})_{n=0}^\infty为由集合(0, +\infty)\backslash\{x_0\}中元素组成并且收敛到1的序列,再由命题9.3.9以及\displaystyle\lim_{x\rightarrow 1; x\in(0, +\infty)\backslash\{1\}}\frac{x^\alpha-1}{x-1}=\alpha我们知道\displaystyle\lim_{n\rightarrow\infty}\frac{(\frac{a_n}{x_0})^\alpha-1}{\frac{a_n}{x_0}-1}=\alpha,进而有\displaystyle\lim_{n\rightarrow\infty}\frac{(a_n)^\alpha-(x_0)^\alpha}{a_n-x_0}=\alpha x_0^{\alpha-1},再由命题9.3.9我们知\displaystyle f'(x_0)=\lim_{x\rightarrow x_0; x\in(0, +\infty)\backslash\{x_0\}}\frac{f(x)-f(x_0)}{x-x_0}=\alpha x_0^{\alpha-1}. 这就完成了证明.

 

 

文内补充

1.习题10.4.3说明了通过证明幂函数在一点处可微进而证明其在整个定义域上可微. 这样的思想我们在习题9.4.3和习题9.4.4也见过,也是证明幂函数或指数函数在一点处的连续来证明其在整个定义域上连续.

《陶哲轩实分析》(中文第一版)——§10.3解答

习题10.3

10.3.1证明:已知f在x_0处可微,由命题9.3.9知对任意由X\backslash\{x_0\}中元素组成并且收敛到x_0的序列(a_n)_{n=0}^\infty有序列(\frac{f(a_n)-f(x_0)}{a_n-x_0})_{n=0}^\infty收敛到f'(x_0). 而对一切自然数n,由于有a_n\in X\backslash\{x_0\},进而a_n\in Xa_n\neq x_0,进一步有a_n<x_0a_n>x_0. 先考虑a_n<x_0的情形,由于f单调增且a_n,x_0\in X,进而有f(a_n)\leqslant f(x_0),进而有\frac{f(a_n)-f(x_0)}{a_n-x_0}\geqslant 0;同理可证当a_n>x_0时亦有\frac{f(a_n)-f(x_0)}{a_n-x_0}\geqslant 0. 综上,对一切自然数n有\frac{f(a_n)-f(x_0)}{a_n-x_0}\geqslant 0. 由命题5.4.9关于实数列的推广形式知有\displaystyle\lim_{n\rightarrow\infty}\frac{f(a_n)-f(x_0)}{a_n-x_0}=f'(x_0)\geqslant 0.

同理可证f为单调减情形.

 

10.3.2例子:函数f:(-1, 1)\rightarrow\mathbb{R}, f(x):=x+\frac{1}{2}|x|. 由命题9.4.9、命题9.4.12以及习题9.4.6知f在(-1, 1)上连续. 对任意x,y\in(-1, 1),如果x<y,分三种情形讨论:

  • x<0y\geqslant 0,则f(x)=x-\frac{1}{2}x=\frac{1}{2}x<0\leqslant\frac{3}{2}y=y+\frac{1}{2}y=f(y).
  • x,y\geqslant 0,则f(x)=x+\frac{1}{2}x=\frac{3}{2}x<\frac{3}{2}y=y+\frac{1}{2}y=f(y).
  • x,y<0,则f(x)=x-\frac{1}{2}x=\frac{1}{2}x<\frac{1}{2}y=y-\frac{1}{2}y=f(y).

综上,f在(-1, 1)上严格增,进而单调增.

由于\displaystyle\lim_{x\rightarrow 0; x\in(-1, 0)}\frac{f(x)-f(0)}{x-0}=\lim_{x\rightarrow 0; x\in(-1, 0)}\frac{\frac{1}{2}x-0}{x-0}=\lim_{x\rightarrow 0; x\in(-1, 0)}\frac{1}{2}=\frac{1}{2},而\displaystyle\lim_{x\rightarrow 0; x\in(0, 1)}\frac{f(x)-f(0)}{x-0}=\lim_{x\rightarrow 0; x\in(0, 1)}\frac{\frac{3}{2}x-0}{x-0}=\lim_{x\rightarrow 0; x\in(0, 1)}\frac{3}{2}=\frac{3}{2},于是函数极限\displaystyle\lim_{x\rightarrow 0; x\in(-1, 1)\backslash\{0\}}\frac{f(x)-f(0)}{x-0}不存在,即f在0处不可微. 由于f在0处不可微,故命题10.3.1对f在0处不适用.

 

10.3.3例子:函数f:\mathbb{R}\rightarrow\mathbb{R}, f(x):=x^3. 由习题10.1.5知f在整个实直线上可微并且f'(x)=3x^2,进而f'(0)=0. 对任意x,y\in\mathbb{R},如果x<y,我们分三种情形讨论:

  • x<0y\geqslant 0,进而x^3<0y^3\geqslant 0,进而x^3<y^3.
  • x,y\geqslant 0,由x<y进一步知y>0,进而x^2\leqslant xy<y^2,即x^2<y^2,进而x^3\leqslant xy^2<y^3,故x^3<y^3.
  • x,y<0,进而有-x,-y>0,同上面第二种情形的论述有(-y)^3<(-x)^3,即-y^3<-x^3,即x^3<y^3. 综上,f为严格增函数.

命题10.3.1显然适用于此例子,而命题10.3.3要依函数限制的定义域看是否适用此例子.

 

10.3.4证明:对于任意x,y\in[a, b],如果x<y,则区间[x, y](x, y)非退化(即不是空集且不是单元素集). 已知f:[a, b]\rightarrow\mathbb{R}在[a, b]上可微,由习题10.1.1知f|_{[x, y]}在(x, y)上可微,并且由命题10.1.10和习题9.4.6知f|_{[x, y]}在[x, y]上连续,由推论10.2.9知存在x'\in[x, y]使得f'(x')=\frac{f(y)-f(x)}{y-x}>0,由于x<y,进而y-x>0,进而f(y)-f(x)>0,即f(x)<f(y). 故f是严格增函数.

同理可证f':[a, b]\rightarrow\mathbb{R}恒小于0的情形和恒等于0的情形.

 

10.3.5例子:函数f:[-2, 0]\cup[1, +\infty)\rightarrow\mathbb{R},当x\in[-2, 0]f(x):=x+2,当x\in[1, +\infty)f(x):=x^2. 容易证明f在整个定义域上可微,并且当x\in[-2, 0]f'(x)=1>0和当x\in[1, +\infty)f'(x)=2x\geqslant 2>0. 但是有f(0)=2>1=f(1),于是f不是严格单调增的.

 

 

文内补充

1.从函数的单调性看其导函数有命题10.3.1;从函数的导函数看其单调性有命题10.3.3.

 

2.习题10.3.4,如果我们知道了微积分基本定理,那么对任意x,y\in[a, b],如果x<y,我们有\displaystyle\int_x^y f'(x) \ dx=f(x)\mid_x^y=f(y)-f(x),而由于对一切x\in[x, y]f'(x)>0,进而我们有\displaystyle\int_{x}^{y} f'(x)\ dx\geqslant 0,即f(y)-f(x)\geqslant 0,即f(x)\leqslant f(y),但由定理10.2.7(Rolle定理)我们知不可能为f(x)=f(y),故f(x)<f(y).

同理证明其余情形.

 

3.对于命题10.3.3,其中的前提f'(x)>0以及“f是严格单调增的”可以分别改为f'(x)\geqslant 0以及“f是单调增的”. 证明思路和习题10.3.4的证明思路完全一致.

《陶哲轩实分析》(中文第一版)——§10.2解答

习题10.2

10.2.1证明:假设f在x_0处取到局部最大值,即存在实数\delta>0使得对一切x\in (a, b)\cap(x_0-\delta, x_0+\delta)f(x)\leqslant f(x_0). 我们容易证明x_0(a, b)\cap(x_0-\delta, x_0)的极限点(或者附着点也行),进而由习题10.1.1知有\displaystyle\lim_{x\rightarrow x_0; x\in (a, b)\cap(x_0-\delta, x_0)}\frac{f(x)-f(x_0)}{x-x_0}=\lim_{x\rightarrow x_0; x\in (a, b)\backslash\{x_0\}}\frac{f(x)-f(x_0)}{x-x_0},进而由命题9.3.9知对任意由集合(a, b)\cap(x_0-\delta, x_0)的元素组成并且收敛到x_0的序列(a_n)_{n=0}^\infty有序列(\frac{f(a_n)-f(x_0)}{a_n-x_0})_{n=0}^\infty收敛到f'(x_0). 而对一切自然数n有a_n\in(a, b)\cap(x_0-\delta, x_0)\subseteq(a, b)\cap(x_0-\delta, x_0+\delta),进而有f(a_n)\leqslant f(x_0),进而\frac{f(a_n)-f(x_0)}{a_n-x_0}\geqslant 0,由命题5.4.9关于实数列的推广形式知\displaystyle\lim_{n\rightarrow\infty}\frac{f(a_n)-f(x_0)}{a_n-x_0}=f'(x_0)\geqslant 0. 同理由\displaystyle\lim_{x\rightarrow x_0; x\in (a, b)\cap(x_0, x_0+\delta)}\frac{f(x)-f(x_0)}{x-x_0}=f'(x_0)f'(x_0)\leqslant 0. 综上f'(x_0)=0. 对于f在x_0处取到局部最小值也有类似的证明.

 

我们当然也可以用命题10.1.7来进行证明:同假设f在x_0处取到局部最大值,即存在实数\delta_1>0使得对一切x\in (a, b)\cap(x_0-\delta_1, x_0+\delta_1)f(x)\leqslant f(x_0). 由命题10.1.7和f在x_0处可微知对每个实数\varepsilon>0,都存在实数\delta_2>0,对一切x\in(a, b)有如果|x-x_0|\leqslant\delta_2|f(x)-(f(x_0)+f'(x_0)(x-x_0))|\leqslant\varepsilon|x-x_0|. 综上,对每个实数\varepsilon>0,取\delta:=min\{\frac{1}{2}\delta_1, \delta_2\},对一切x\in(a, b)有如果|x-x_0|\leqslant\delta|f(x)-(f(x_0)+f'(x_0)(x-x_0))|\leqslant\varepsilon|x-x_0|,进而有0\leqslant f(x_0)-f(x)\leqslant\varepsilon|x-x_0|-f'(x_0)(x-x_0),进而有f'(x_0)(x-x_0)\leqslant\varepsilon|x-x_0|. 综上,对每个实数\varepsilon>0,存在实数\delta>0,对一切x\in(a, b)有如果|x-x_0|\leqslant\delta则有f'(x_0)(x-x_0)\leqslant\varepsilon|x-x_0|. 由于x_0(a, x_0]的极限点,故我们总可以取到一个x_1\in(a, x_0)使|x_1-x_0|\leqslant\delta,进而有f'(x_0)(x_1-x_0)\leqslant\varepsilon|x_1-x_0|=-\varepsilon(x_1-x_0),进而有f'(x_0)\geqslant-\varepsilon. 同理由x_0[x_0, b)的极限点知f'(x_0)\leqslant\varepsilon. 进而综合起来就有|f'(x_0)|\leqslant\varepsilon. 综上,对每个实数\varepsilon>0,总有|f'(x_0)|\leqslant\varepsilon,故f'(x_0)=0.

 

10.2.2例子:f:(-1, 1)\rightarrow\mathbb{R}, f(x):=-|x|. 由命题9.4.9知f在定义域(-1, 1)上连续. 对任意x\in(-1, 1),我们有|x|\geqslant 0,进而f(0)=0\geqslant -|x|,于是f在0处达到整体最大值. 由例10.1.6知f在0处在(-1, 1)上不可微.

 

10.2.3例子:f:(-1, 1)\rightarrow\mathbb{R}, f(x):=x^3. 由习题10.1.5知f'(x)=3x^2,故f'(0)=0. 但是我们有对任意实数\delta>0,存在实数\frac{min\{1, \delta\}}{2}\in(-1, 1)\cap(-\delta, +\delta)使得f(\frac{min\{1, \delta\}}{2})>f(0),故f在0处不会取到局部最大值. 同理可证f在0处不会取到局部最小值.

 

10.2.4证明:由题设和最大值原理知存在x_{max}\in[a, b]使在x_{max}处取得函数g的最大值. 如果x_{max}\in(a, b),则g在x_{max}处也取得局部最大值,再由命题10.2.6知g'(x_{max})=0. 如果x_{max}\in[a, b]\backslash(a, b)=\{a\}\cup\{b\},由于g(a)=g(b),则g在x=a, b处同时取得最大值. 我们分两种情形讨论:a.如果g的最大和最小值不相等,进而在某x_{min}\in(a, b)处取得最小值,同理由命题10.2.6知g'(x_{min})=0;b.如果g的最大、最小值相等,此时易反证g为常值函数,故对任意x\in [a, b]f'(x)=0.

我们举一个Rolle定理适用的典型例子,由表达式x^2+y^2=1隐式确定的函数g:[-1, 1]\rightarrow[0, +\infty). 其函数图像就是一个半径为1圆心在原点的半圆.

 

10.2.5证明:证明的关键是构造两端点处函数值相等的函数.

我们考虑函数g:[a, b]\rightarrow\mathbb{R}, g(x):=f(x)-\frac{f(b)-f(a)}{b-a}(x-a). 由f在[a, b]上连续和命题9.4.9知g在[a, b]上连续. 已知f在(a, b)上可微,由定理10.1.13和定理10.1.15知对任意x_0\in(a, b)g'(x_0)=f'(x_0)-\frac{f(b)-f(a)}{b-a}\cdot 1=f'(x_0)-\frac{f(b)-f(a)}{b-a},于是g在(a, b)上可微. 我们还容易验证g(a)=g(b)=f(a). 进而满足定理10.2.7的前提,于是存在x\in(a, b)使得g'(x)=f'(x_0)-\frac{f(b)-f(a)}{b-a}=0,即f'(x)=\frac{f(b)-f(a)}{b-a}.

 

10.2.6证明:勘误,我们应该说明a<b是实数.

已知f:[a, b]\rightarrow\mathbb{R}在[a, b]上连续并且在(a, b)上可微. 对任意x,y\in[a, b],当x=y时命题显然成立,故不失一般性,我们假设x<y,由习题9.4.6知f|_{[x, y]}:[x, y]\rightarrow\mathbb{R}在[x, y]上连续,再由习题10.1.1知f|_{[x, y]}在(x, y)上可微. 进而由推论10.2.9平均值定理知存在x'\in(x, y)使f'(x')=\frac{f(y)-f(x)}{y-x},进而有|\frac{f(y)-f(x)}{y-x}|=|f'(x')|\leqslant M,即|f(x)-f(y)|\leqslant M|x-y|.

 

10.2.7证明:由题设我们知道导函数f':\mathbb{R}\rightarrow\mathbb{R}有界,即存在实数M>0使得对一切x\in\mathbb{R}|f'(x)|\leqslant M. 对任意实数\varepsilon>0,存在实数\frac{\varepsilon}{M}>0,对每个x_0\in\mathbb{R},对每个x\in\mathbb{R}\backslash\{x_0\},如果|x-x_0|\leqslant\frac{\varepsilon}{M},我们由习题10.1.1知f|_{[-|x|-|x_0|, |x|+|x_0|]}[-|x|-|x_0|, |x|+|x_0|]上可微,进而在[-|x|-|x_0|, |x|+|x_0|]上连续并且在(-|x|-|x_0|, |x|+|x_0|)上可微,由习题10.2.6知对x, x_0\in[-|x|-|x_0|, |x|+|x_0|]|f(x)-f(x_0)|\leqslant M|x-y|\leqslant M\frac{\varepsilon}{M}=\varepsilon;再来考虑特殊情形x\in\{x_0\},即x=x_0. 此时|f(x)-f(x_0)|=0\leqslant\varepsilon. 综上,对任意实数\varepsilon>0,存在实数\frac{\varepsilon}{M}>0,对任意x,x_0\in\mathbb{R}有如果|x-x_0|\leqslant\frac{\varepsilon}{M}|f(x)-f(x_0)|\leqslant\varepsilon. 综上,f是一致连续的.

值得一提的是,习题10.2.7中的题设“f:\mathbb{R}\rightarrow\mathbb{R}”换成“f:[a, b]\rightarrow\mathbb{R}(\text{Both a and b is real number and }a<b)”论证仍然成立.

 

 

文内补充

1.极值(局部最大、最小值)的概念离不开开区间.

 

2.例10.2.4的“为什么?”.

显然.

 

3.注10.2.5的“为什么?”.

显然.

《陶哲轩实分析》(中文第一版)——§10.1解答

习题10.1

10.1.1证明:习题10.1.1的题干需要进行勘误:“x_0是X的极限点”应改为“x_0是X的极限点并且x_0\in X”;同样的“x_0是Y的极限点”应改为“x_0是Y的极限点并且x_0\in Y”. 要注意可微只对属于函数定义域并且为定义域的极限点的元素进行考虑.

我们已知\displaystyle\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{f(x)-f(x_0)}{x-x_0}存在(从此函数极限存在我们也可以知道x_0X\backslash\{x_0\}的附着点,即x_0为X的极限点;并且函数f在x_0处有定义,即x_0\in X),由命题9.3.9知存在实数L,对任意由X\backslash\{x_0\}的元素组成并且收敛到x_0的序列(a_n)_{n=0}^\infty有序列(\frac{f(a_n)-f(x_0)}{a_n-x_0})_{n=0}^\infty收敛到L. 进而对任意由集合Y\backslash\{x_0\}的元素组成并且收敛到x_0的序列(b_n)_{n=0}^\infty,其也是由X\backslash\{x_0\}的元素组成并且收敛到x_0的序列,进而序列(\frac{f(b_n)-f(x_0)}{b_n-x_0})_{n=0}^\infty也收敛到L. 再由命题9.3.9知有\displaystyle\lim_{x\rightarrow x_0; x\in Y\backslash\{x_0\}}\frac{f(x)-f(x_0)}{x-x_0}=\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{f(x)-f(x_0)}{x-x_0}.

这显然与注10.1.2不矛盾. 因为上面讨论成立的前提是:

  1. x_0是X的极限点并且x_0\in X
  2. x_0是Y的极限点并且x_0\in Y.

对注10.1.2中的例子,当把函数f\mathbb{R}\rightarrow\mathbb{R},f(x):=x^2限制在定义域X:=[1, 2]\cup\{3\}上时,3不再是X=[1, 2]\cup\{3\}的极限点,上述论证不再成立(或者说上述论证是正确的,但未传达出任何有价值信息,是空洞正确的废话. 因为不存在由[1, 2]中元素组成且收敛到3的实数列).

 

10.1.2证明:命题10.1.7的题干需要进行勘误:“x_0是X的极限点”应改为“x_0是X的极限点并且x_0\in X”.

如果f在x_0处在X上可微、导数为L,由定义9.3.6知对每个实数\varepsilon>0,都存在实数\delta>0,使得只要x\in X\backslash\{x_0\}\delta-接近于x_0的就有|\frac{f(x)-f(x_0)}{x-x_0}-L|\leqslant\varepsilon,即有|f(x)-(f(x_0)+L(x-x_0))|\leqslant\varepsilon|x-x_0|;当x=x_0时,|f(x)-(f(x_0)+L(x-x_0))|=0\leqslant 0=\varepsilon|x-x_0|. 综上,对每个实数\varepsilon>0,都存在实数\delta>0,使得只要x\in X并且|x-x_0|\leqslant\delta就有|f(x)-(f(x_0)+L(x-x_0))|\leqslant\varepsilon|x-x_0|.

如果对每个实数\varepsilon>0,都存在实数\delta>0,只要x\in X并且|x-x_0|\leqslant\delta就有|f(x)-(f(x_0)+L(x-x_0))|\leqslant\varepsilon|x-x_0|,进而有对每个实数\varepsilon>0都存在实数\delta>0使得只要x\in X\backslash\{x_0\}并且|x-x_0|\leqslant\delta就有|f(x)-(f(x_0)+L(x-x_0))|\leqslant\varepsilon|x-x_0|,即有\frac{|f(x)-(f(x_0)+L(x-x_0))|}{|x-x_0|}=|\frac{f(x)-f(x_0)}{x-x_0}-L|\leqslant\varepsilon. 由定义9.3.6知\displaystyle\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{f(x)-f(x_0)}{x-x_0}=L.

综上,命题得证.

 

10.1.3证明:命题10.1.10的题干需要进行勘误:“x_0是X的极限点”应改为“x_0是X的极限点并且x_0\in X”.

我们将给出两个证明.

证明一:由命题9.3.14和例9.4.2以及例9.4.3知有\displaystyle\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}x-x_0=\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}x-\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}x_0=0. 再由极限算律(命题9.3.14)知有\displaystyle\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}f(x)-f(x_0)=\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{f(x)-f(x_0)}{x-x_0}\cdot\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}x-x_0=0,进而有\displaystyle\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}f(x)=\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}f(x)-f(x_0)+\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}f(x_0)=f(x_0).这与定义9.4.1所要求的十分相似了,由\displaystyle\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}f(x)=f(x_0)我们容易用“\varepsilon-\delta”型表述分类讨论说明此时也有\displaystyle\lim_{x\rightarrow x_0; x\in X}f(x)=f(x_0),故f在x_0处连续.

证明二:我们用命题10.1.7来证明它. 若f在x_0处可微,由命题10.1.7知对每个实数\varepsilon>0,都存在实数\delta>0,使得只要x\in X|x-x_0|\leqslant\delta就有|f(x)-(f(x_0)+L(x-x_0))|\leqslant\varepsilon|x-x_0|,进而有|f(x)-f(x_0)|\leqslant(|L|+\varepsilon)|x-x_0|. 于是对每个实数\varepsilon>0,存在实数\delta>0,存在实数min\{\delta, \frac{\varepsilon}{|L|+\varepsilon}\},使得只要x\in X并且|x-x_0|\leqslant min\{\delta, \frac{\varepsilon}{|L|+\varepsilon}\}\leqslant\delta就有|f(x)-f(x_0)|\leqslant(|L|+\varepsilon)|x-x_0|\leqslant(|L|+\varepsilon)\cdot min\{\delta, \frac{\varepsilon}{|L|+\varepsilon}\}\leqslant(|L|+\varepsilon)\cdot\frac{\varepsilon}{|L|+\varepsilon}=\varepsilon. 于是有\displaystyle\lim_{x\rightarrow x_0; x\in X}f(x)=f(x_0),于是f在x_0处连续.

 

10.1.4证明:命题10.1.13的题干需要进行勘误:“x_0是X的极限点”应改为“x_0是X的极限点并且x_0\in X”.

(a)\displaystyle f'(x_0)=\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{f(x)-f(x_0)}{x-x_0}=\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{c-c}{x-x_0}\\=\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}0=0.

(b)\displaystyle f'(x_0)=\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{f(x)-f(x_0)}{x-x_0}=\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{x-x_0}{x-x_0}\\=\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}1=1.

(c)\displaystyle (f+g)'(x_0)=\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{(f+g)(x)-(f+g)(x_0)}{x-x_0}=\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{(f(x)+g(x))-(f(x_0)+g(x_0))}{x-x_0}\\=\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}(\frac{f(x)-f(x_0)}{x-x_0}+\frac{g(x)-g(x_0)}{x-x_0})\\=\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{f(x)-f(x_0)}{x-x_0}+\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{g(x)-g(x_0)}{x-x_0}=f'(x_0)+g'(x_0).

(d)\displaystyle (fg)'(x_0)=\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{(fg)(x)-(fg)(x_0)}{x-x_0}=\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{f(x)g(x)-f(x)g(x_0)+f(x)g(x_0)-f(x_0)g(x_0)}{x-x_0}\\=\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{f(x)(g(x)-g(x_0))+g(x_0)(f(x)-f(x_0))}{x-x_0}\\=\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}(f(x)\frac{g(x)-g(x_0)}{x-x_0}+g(x_0)\frac{f(x)-f(x_0)}{x-x_0})\\=\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}f(x)\frac{g(x)-g(x_0)}{x-x_0}+\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}g(x_0)\frac{f(x)-f(x_0)}{x-x_0}\\=\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}f(x)\cdot\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{g(x)-g(x_0)}{x-x_0}+\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}g(x_0)\cdot\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{f(x)-f(x_0)}{x-x_0}\\=f(x_0)g'(x_0)+g(x_0)f'(x_0).

(e)\displaystyle (cf)'(x_0)=\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{cf(x)-cf(x_0)}{x-x_0}=\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}c\frac{f(x)-f(x_0)}{x-x_0}\\=\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}c\cdot\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{f(x)-f(x_0)}{x-x_0}=cf'(x_0).

(f)\displaystyle (f-g)'(x_0)=(f+((-1)\cdot g))'(x_0)=f'(x_0)+((-1)\cdot g)'(x_0)\\=f'(x_0)+(-1)\cdot g'(x_0)=f'(x_0)-g'(x_0).

(g)\displaystyle (\frac{1}{g})'(x_0)=\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{\frac{1}{g}(x)-\frac{1}{g}(x_0)}{x-x_0}=\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{\frac{1}{g(x)}-\frac{1}{g(x_0)}}{x-x_0}\\=\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}(\frac{1}{g(x)g(x_0)}\cdot\frac{g(x_0)-g(x)}{x-x_0})\\=\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{1}{g(x)g(x_0)}\cdot\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}-\frac{g(x)-g(x_0)}{x-x_0}\\=\frac{1}{g(x_0)g(x_0)}\cdot(-g'(x_0))=-\frac{g'(x_0)}{g^2(x_0)}.

(h)我们可以使用定义和中间人把戏得出结论,但还有更快捷的办法如下:

\displaystyle (\frac{f}{g})'(x_0)=(\frac{1}{g}\cdot f)'(x_0)=(\frac{1}{g})'(x_0)f(x_0)+(\frac{1}{g})(x_0)f'(x_0)\\=-\frac{g'(x_0)}{g^2(x_0)}f(x_0)+\frac{f'(x_0)}{g(x_0)}=\frac{f'(x_0)g(x_0)-f(x_0)g'(x_0)}{g^2(x_0)}.

 

10.1.5证明:勘误,题设“n是自然数”应为“n是正自然数”.

对自然数1,有f:\mathbb{R}\rightarrow\mathbb{R}, f(x)=x^1=x,此时有f'(x)=1=1\cdot x^{1-1},这就完成了归纳假设. 归纳假设对某自然数n\geqslant 1有若f:\mathbb{R}\rightarrow\mathbb{R}, f(x)=x^nf'(x)=nx^{n-1}. 那么对自然数n+1,若f:\mathbb{R}\rightarrow\mathbb{R}, f(x)=x^{n+1}=x\cdot x^n,则由积法则和归纳假设有f'(x)=1\cdot x^n+x\cdot(nx^{n-1})=(n+1)x^n=(n+1)\cdot x^{(n+1)-1},这就完成了归纳. 故对一切正自然数n有若f:\mathbb{R}\rightarrow\mathbb{R}, f(x)=x^nf'(x)=nx^{n-1}.

对自然数0,若f:\mathbb{R}\rightarrow\mathbb{R}, f(x)=x^0=1,则此时有f'(x)=0. 对一切x\in\mathbb{R}\backslash\{0\},有f'(x)=0=0\cdot x^{0-1}=0\cdot\frac{1}{x}=0,但是在x=0处,f'(x)无法写成0\cdot x^{0-1}的形式.

 

10.1.6证明:对一切x\in\mathbb{R}\backslash\{0\},我们有f(x)=x^n=\frac{1}{x^{-n}}. 记函数g:\mathbb{R}\backslash\{0\}\rightarrow\mathbb{R}, g(x)=x^{-n},那么f'(x)=(\frac{1}{g})'(x)=-\frac{g'(x)}{g^2(x)}=-\frac{-n\cdot x^{-n-1}}{x^{-2n}}=nx^{n-1}.

 

10.1.7证明:

证明一:我们当然可以把此问题转化成关于序列的极限问题. 我们先假设f'(x_0)\neq 0的情形. 对任意由X\backslash\{x_0\}的元素组成并且收敛到x_0的序列(a_n)_{n=0}^\infty,由命题9.3.9知有\displaystyle \lim_{n\rightarrow\infty}\frac{f(a_n)-f(x_0)}{a_n-x_0}=f'(x_0)\neq 0,不失一般性,我们进一步假设f'(x_0)>0,进而\frac{1}{2}f'(x_0)>0,由\displaystyle \lim_{n\rightarrow\infty}\frac{f(a_n)-f(x_0)}{a_n-x_0}=f'(x_0)\neq 0知存在自然数N使对一切自然数n\geqslant N\frac{f(a_n)-f(x_0)}{a_n-x_0}\geqslant\frac{1}{2}f'(x_0)>0,于是有f(a_n)\neq f(x_0),即序列(f(a_n)-f(x_0))_{n=N}^\infty不含0项. 由f在x_0处可微和命题10.1.10知f在x_0处连续,于是序列(f(a_n))_{n=N}^\infty收敛到f(x_0). 由g在y_0处可微和命题9.3.9知任意由Y\backslash\{y_0\}元素组成并且收敛到y_0的序列(b_n)_{n=0}^\infty有序列(\frac{g(b_n)-g(y_0)}{b_n-y_0})_{n=0}^\infty收敛到g'(y_0). 由于上面我们已证对一切n\geqslant Nf(a_n)\neq f(x_0),进而此时f(a_n)\in Y\backslash\{y_0\},并且我们已知(f(a_n))_{n=N}^\infty收敛到f(x_0)=y_0,于是序列(\frac{g(f(a_n))-g(f(x_0))}{f(a_n)-f(x_0)})_{n=N}^\infty收敛到g'(y_0). 而序列(\frac{f(a_n)-f(x_0)}{a_n-x_0})_{n=N}^\infty收敛到f'(x_0),由序列极限算律知两序列乘积(\frac{g(f(a_n))-g(f(x_0))}{a_n-x_0})_{n=N}^\infty收敛到g'(y_0)\cdot f'(x_0). 于是序列(\frac{g(f(a_n))-g(f(x_0))}{a_n-x_0})_{n=0}^\infty收敛到g'(y_0)\cdot f'(x_0). 再由命题9.3.9知\displaystyle\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{g\circ f(x)-g\circ f(x_0)}{x-x_0}=g'(y_0)f'(x_0). 对f'(x_0)<0的情形有类似的论证证明同样的结论.

再来考虑f'(x_0)=0的情形. 注意上述对f'(x_0)\neq 0情形的论证不再对f'(x_0)=0适用. 我们使用命题10.1.7来证明. 由于g在y_0=f(x_0)处可微,由命题10.1.7知对每个实数\varepsilon>0,都存在实数\delta>0,对任意y\in Y有如果|y-y_0|\leqslant\delta|g(y)-g(y_0)-g'(y_0)(y-y_0)|\leqslant\sqrt{\varepsilon}|y-y_0|,由f在x_0处可微以及命题10.1.10知f在x_0处连续,故存在实数\delta'>0使得对一切x\in X有若|x-x_0|\leqslant\delta'|f(x)-f(x_0)|\leqslant\delta;同时存在实数\delta''>0使得对一切x\in X有如果|x-x_0|\leqslant\delta''|f(x)-f(x_0)-f'(x_0)(x-x_0)|=|f(x)-f(x_0)|\leqslant\sqrt{\varepsilon}|x-x_0|. 我们取\delta_2:=\{\delta', \delta''\},综上,对每个实数\varepsilon>0,存在实数\delta, \delta_2>0,对任意y\in Y有如果|y-y_0|\leqslant\delta|g(y)-g(y_0)-g'(y_0)(y-y_0)|\leqslant\sqrt{\varepsilon}|y-y_0|,并且对任意x\in X有若|x-x_0|\leqslant\delta_2|f(x)-f(x_0)|\leqslant\delta|f(x)-f(x_0)|\leqslant\sqrt{\varepsilon}|x-x_0|,进而对任意x\in X有若|x-x_0|\leqslant\delta_2|g(f(x))-g(f(x_0))-g'(f(x_0))(f(x)-f(x_0))|\leqslant\sqrt{\varepsilon}|f(x)-f(x_0)|\leqslant\sqrt{\varepsilon}\cdot\sqrt{\varepsilon}|x-x_0|=\varepsilon|x-x_0|. 综上,对每个实数\varepsilon>0,存在实数\delta_2>0,对一切x\in X\backslash\{x_0\}有如果|x-x_0|\leqslant\delta_2|g(f(x))-g(f(x_0))-g'(f(x_0))(f(x)-f(x_0))|\leqslant\varepsilon|x-x_0|,进而|\frac{g(f(x))-g(f(x_0))-g'(f(x_0))(f(x)-f(x_0))}{x-x_0}|\leqslant\varepsilon,故\displaystyle\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{g(f(x))-g(f(x_0))-g'(f(x_0))(f(x)-f(x_0))}{x-x_0}=0. 而我们已经知道\displaystyle\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{f(x)-f(x_0)}{x-x_0}=0,进而\displaystyle\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{g'(f(x_0))(f(x)-f(x_0))}{x-x_0}=0,进而\displaystyle\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{g(f(x))-g(f(x_0))}{x-x_0}=\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{g(f(x))-g(f(x_0))-g'(f(x_0))(f(x)-f(x_0))}{x-x_0}+\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{g'(f(x_0))(f(x)-f(x_0))}{x-x_0}=0+0=0. 综上,我们总有(g\circ f)'(x_0)=g'(y_0)f'(x_0).

 

证明二:受到上面证明一对f'(x_0)=0情形论证的启发,我们可以写一个更一般的证明:

由于g在y_0=f(x_0)处可微,f在x_0处可微,类似于证明一的论证我们知:对每个实数\varepsilon>0,都存在实数\delta>0使得对一切x\in X\backslash\{x_0\}有如果|x-x_0|\leqslant\delta|g(f(x))-g(f(x_0))-g'(y_0)(f(x)-f(x_0))|\leqslant\frac{\varepsilon}{\varepsilon+|f'(x_0)|}|f(x)-f(x_0)|并且存在实数\delta'>0使对一切x\in X如果|x-x_0|\leqslant\delta'|f(x)-f(x_0)-f'(x_0)(x-x_0)|\leqslant\varepsilon|x-x_0|,进而|f(x)-f(x_0)|\leqslant(\varepsilon+|f'(x_0)|)|x-x_0|. 我们取实数min\{\delta, \delta'\},进而对一切x\in X\backslash\{x_0\}有如果|x-x_0|\leqslant min\{\delta, \delta'\}|g(f(x))-g(f(x_0))-g'(y_0)(f(x)-f(x_0))|\leqslant\frac{\varepsilon}{\varepsilon+|f'(x_0)|}|f(x)-f(x_0)|\leqslant\varepsilon|x-x_0|,即有|\frac{g(f(x))-g(f(x_0))-g'(y_0)(f(x)-f(x_0))}{x-x_0}|\leqslant\varepsilon. 于是我们有\displaystyle\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{g(f(x))-g(f(x_0))-g'(y_0)(f(x)-f(x_0))}{x-x_0}=0. 由极限算律知\displaystyle\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{g(f(x))-g(f(x_0))}{x-x_0}=\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{g(f(x))-g(f(x_0))-g'(y_0)(f(x)-f(x_0))}{x-x_0}+\lim_{x\rightarrow x_0; x\in X\backslash\{x_0\}}\frac{g'(y_0)(f(x)-f(x_0))}{x-x_0}=0+g'(y_0)f'(x_0)=g'(y_0)f'(x_0).

 

 

文内补充

1.P207的第二段和P179第一段相呼应.

 

2.从定义10.1.1知道我们只考虑属于函数定义域并且为定义域的极限点处是否可导.

 

3.注10.1.2:“自动无定义”的原因详见注9.3.11;“不定义函数在孤立点处的导数”原因详见孤立点定义,因为孤立点不是X\backslash\{x_0\}的附着点.

 

4.注10.1.4的“为什么?”.

第一个:由定义9.3.6知显然.

第二个:一个反例是——f:\mathbb{R}\rightarrow\mathbb{R}, f(x):=xg:\mathbb{R}\rightarrow\mathbb{R}, g(x):=x^2,两者在x=1处有相同的函数值但导数不一样.

 

5.有时我们可以通过限制函数的定义域而重新取得可微性.

 

6.注10.1.14下面的“为什么?”.

由定理10.1.13显然.

《陶哲轩实分析》(中文第一版)——§9.10解答

习题9.10

9.10.1证明:如果\displaystyle\lim_{n\rightarrow +\infty; n\in\mathbb{N}}a_n存在,由定义9.10.3知存在实数L,对每个实数\varepsilon>0,都存在实数M,对一切n\in\mathbb{N}有如果n>M|f(n)-L|\leqslant\varepsilon. 进而存在实数L,对每个实数\varepsilon>0,都存在实数M,由习题5.4.3知存在整数N+1>M,对一切自然数n\geqslant N+1n\in\mathbb{N}n>M,进而|f(n)-L|\leqslant\varepsilon. 由定义6.1.8和定义6.1.5知\displaystyle\lim_{n\rightarrow\infty}a_n=L. 综上,若\displaystyle\lim_{n\rightarrow +\infty; n\in\mathbb{N}}a_n存在则\displaystyle\lim_{n\rightarrow\infty}a_n=\lim_{n\rightarrow +\infty; n\in\mathbb{N}}a_n.

如果\displaystyle\lim_{n\rightarrow\infty}a_n=L存在,由定义6.1.8和定义6.1.5知存在实数L,对每个实数\varepsilon>0,都存在自然数N,也为实数N,对一切n\in\mathbb{N},当n>N时有|f(n)-L|\leqslant\varepsilon. 由定义9.10.3知\displaystyle\lim_{n\rightarrow +\infty; n\in\mathbb{N}}a_n=L. 综上,若\displaystyle\lim_{n\rightarrow\infty; n\in\mathbb{N}}a_n存在则\displaystyle\lim_{n\rightarrow+\infty}a_n=\lim_{n\rightarrow\infty; n\in\mathbb{N}}a_n.

 

 

文内补充

1.例9.10.4中的“为什么?”.

显然.

 

2.对定义9.10.1和定义9.10.3的补充.

  • 定义9.1.8:定义9.10.1为定义9.1.8的补充.
  • 新定义9.1.10:由此定义9.1.10(闭包)需要改变,使其也包含无限附着点.
  • 引理9.1.11:引理9.1.11的结论对考虑无限附着点后仍全部成立,只需要单独考虑无限附着点的情形,证明几乎完全一样.
  • 新引理9.1.12:引理9.1.12只需小修改,考虑进无限附着点.
  • 新引理9.1.13:引理9.1.13只需小修改,自然数集、整数集、比例数集和实数集都有无穷大和无穷小附着点. 空集的闭包仍是空集.
  • 引理9.1.14补充:引理9.1.14也有对应的对无限附着点的版本,只要注意到了一个序列收敛到无穷大(无穷小)是什么意思(详见习题8.2.6(即序列上极限和下极限为无穷大(或无穷小)). 可能还要看看习题6.4.8). 具体来说即:设X是\mathbb{R}的子集合,那么+\infty(-\infty)是X的附着点(详见定义9.10.1)当且仅当存在一个全由X的元素组成的序列(a_n)_{n=0}^\infty其收敛到+\infty(-\infty)(即\displaystyle\limsup_{n\rightarrow\infty} a_n=\liminf_{n\rightarrow\infty} a_n=+\infty(-\infty)). 证明很容易,就不写了.
  • 新定义9.1.15:定义9.1.15需要改变,把实数集的无限附着点也考虑进去,即:一个子集E\subset\mathbb{R}叫作是闭的,当且仅当\overline{E}=E,或者换句话说,E包含它的一切附着点(包括无限附着点). 但是这样的改变与原定义不是完全相容的,因为新的定义9.1.15下如果实数集是闭的那么其不含无限附着点,进而可以看作“不考虑无限附着点只考虑实数附着点”,进而是在旧定义9.1.15下闭的;但是在旧定义9.1.15下闭的实数集在新的定义9.1.15下不一定是闭的,比如非负实数集.
  • 新例9.1.16:例9.1.16的结论需要修改,需要考虑无限附着点.
  • 新推论9.1.17:在实数集是闭的的定义如上进行了改变后,推论9.1.17的前半部分照样成立,因为实数集在新定义9.1.15是闭的蕴涵在旧定义9.1.15是闭的;后半部分需要进行修改成:反过来,如果每个由X的元素组成的收敛序列(包括收敛到无穷大和无穷小)极限都在X中,那么X必定是闭的(新定义9.1.15意义下).
  • 定义9.1.18:定义9.1.18无影响,因为其考虑的就是实数附着点.
  • 新注9.1.20:注9.1.20最后一句话需要修改:实数附着点的集合分成极限点的集合与孤立点的集合两部分.
  • 引理9.1.21照样适用.
  • 新定理9.1.24:定理9.1.24需要进行改变:设X是\mathbb{R}的子集,那么下述两命题等价——(a)X是闭的(考虑进无限附着点后的意义下)(b)任给取值于X中的实数序列(a_n)_{n=0}^\infty,存在它的一个子序列其收敛到X中的某实数. 证明很简单:只需要注意到“X是考虑进无限附着点后的意义下为闭的”当且仅当“X是只考虑实数附着点意义下为闭的且是有界的”.
  • 习题9.1.1:习题9.1.1对考虑进无限附着点后仍成立. 证明很容易,因为习题9.1.1的解答已经证明只考虑X的实数附着点时成立,故我们只需再考虑\overline{X}包含广义实数附着点时是否成立. 不失一般性,假设+\infty\in\overline{X},进而X无上界,由于X是Y的子集,进而Y无上界,进而+\infty\in\overline{Y}. 这就完成了证明.
  • 习题9.1.4:对考虑进无限附着点的“闭的”的定义,习题9.1.4的原解答仍适用.
  • 习题9.1.6没有对应于“新定义9.1.10”的版本,因为我们只定义了实直线的子集的附着点,没有定义\mathbb{R}^*的子集的附着点. 具体可以看书中定义9.1.8和定义定义9.10.1中都有一个前提:“设X是\mathbb{R}的子集合”.
  • 习题9.1.7:对考虑进无限附着点的“闭的”的定义(即新定义9.1.10),习题9.1.7的原解答仍适用. 只要注意到“X是考虑进无限附着点后的意义下为闭的”当且仅当“X是只考虑实数附着点意义下为闭的且是有界的”. 同样地,如同在“《陶哲轩实分析》(中文第一版)——§9.1解答”中的习题9.1.7解答的注意中,结论不可以推广到无限并.
  • 习题9.1.8:对考虑进无限附着点的“闭的”的定义(即新定义9.1.10),习题9.1.8的原解答仍适用. 只要注意到“X是考虑进无限附着点后的意义下为闭的”当且仅当“X是只考虑实数附着点意义下为闭的且是有界的”.
  • 习题9.1.9:对考虑进无限附着点的“闭的”的定义(即新定义9.1.10),需要限定讨论的附着点为实数,不考虑无限附着点.
  • 习题9.1.11:对考虑进无限附着点的“闭的”的定义(即新定义9.1.10),习题9.1.11的原解答仍适用. 只要注意到“X是考虑进无限附着点后的意义下为闭的”当且仅当“X是只考虑实数附着点意义下为闭的且是有界的”.
  • 习题9.1.14:对考虑进无限附着点的“闭的”的定义(即新定义9.1.10),习题9.1.11的结论应改为:\mathbb{R}的任何有限子集都是闭的(新定义9.1.10意义下). 只要注意到“X是考虑进无限附着点后的意义下为闭的”当且仅当“X是只考虑实数附着点意义下为闭的且是有界的”.
  • 定义9.10.3的注9.3.7:对于定义9.10.3,也有类似说明. 即函数在无限处的极限与集合的选取是有关系的.
  • 定义9.10.3的命题9.3.9:我们同样可以证明——设X是\mathbb{R}的子集合,f:X\rightarrow\mathbb{R}是函数,并设E是X的子集合,+\infty(-\infty)是E的附着点. 而L是实数. 那么下述两命题是逻辑上等价的:(a)f在+\infty(-\infty)处沿着E收敛到L;(b)对于每个完全由E的元素组成并且收敛到+\infty(-\infty)的序列(a_n)_{n=0}^\infty,序列(f(a_n))_{n=0}^\infty收敛到L. 证明如下:如果f在+\infty处沿着E收敛到L,进而对于每个完全由E的元素组成并且收敛到+\infty的序列(a_n)_{n=0}^\infty,对于任意实数\varepsilon>0,由于f在+\infty处沿着E收敛到L知存在实数M_\varepsilon,对任意元素x\in E,如果x>M_\varepsilon|f(x)-L|\leqslant\varepsilon. 又由于(a_n)_{n=0}^\infty收敛到+\infty,进而有\displaystyle\liminf_{n\rightarrow\infty} a_n=+\infty,即(a_N^-)_{N=0}^\infty无上界,进而对实数M_\varepsilon存在整数N_{M_\varepsilon}使得对一切整数N\geqslant N_{M_\varepsilon}a_N^->M_\varepsilon(因为我们已经在“《陶哲轩实分析》(中文第一版)——§6.4解答”的习题6.4.3中证明“(a_N^+)_{N=0}^\infty是一个减序列”,类似的论证可以说明(a_N^-)_{N=0}^\infty是增序列.),即有\inf(a_n)_{n=N_{M_\varepsilon}}^\infty>M_\varepsilon,进而对一切n\geqslant N_{M_\varepsilon}|f(a_n)-L|\leqslant. 综上,序列(f(a_n))_{n=0}^\infty收敛到L. 同理我们可以证明对于“-\infty”的情形. 综上,我们证明了(a)\Longrightarrow(b).                              现在来证明(b)\Longrightarrow(a). 我们假设(a)不成立,即并非f在+\infty(-\infty)处沿着E收敛到L,我们先考虑“+\infty”的情形,这说明存在实数\varepsilon_+>0,对任意实数M,存在元素x\in E使得x>M|f(x)-L|>\varepsilon_+. 由选择公理我们知存在序列(a_n)_{n=0}^\infty满足对一切自然数n有a_n\in Ea_n>n|f(a_n)-L|>\varepsilon_+. 进而我们可以证明(a_n)_{n=0}^\infty严格增且无上界且f((a_n))_{n=0}^\infty不收敛到L,进而可以证明(a_n)_{n=0}^\infty收敛到+\inftyf((a_n))_{n=0}^\infty不收敛到L,由此序列(a_n)_{n=0}^\infty与(b)相矛盾. 同理可以证明对于“-\infty”的情形. 由反证法我们知道(b)蕴涵(a). 综上,我们证明了(b)\Longrightarrow(a). 这就完成了证明.
  • 定义9.10.3的注9.3.11:同样的有类似的说明——我们只考虑当+\infty(-\infty)是E的附着点时,函数f在+\infty(-\infty)处的极限. 当+\infty(-\infty)不是E的附着点时,对于任何实数L,陈述\displaystyle\lim_{x\rightarrow +\infty(-\infty)}f(x)=L是空真的成立的.
  • 定义9.10.3的注9.3.12:对于函数在无限处的极限有类似说明.
  • 新推论9.3.13:函数在无限处的极限也是唯一的,由上面“引理9.1.14补充”和“定义9.10.3的命题9.3.9”知显然.
  • 定义9.10.3的命题9.3.14:类似的由上面“引理9.1.14补充”和“定义9.10.3的命题9.3.9”我们可以证明“函数在无限处的极限算律”. 也即例9.10.4中说的“一切极限算律保持成立”.
  • 定义9.10.3的注9.3.15:对于最后一段话也有类似的陈述——如果f在+\infty(-\infty)处沿着X收敛到L,而Y是X的子集使得+\infty(-\infty)仍然是Y的附着点,那么f在+\infty(-\infty)处沿着Y收敛到L,但反过来不对. 由“定义9.10.3”或者上面的“定义9.10.3的命题9.3.9”知显然.
  • 定义9.10.3的命题9.3.18:设X是\mathbb{R}的子集合,E是X的子集合,而+\infty(-\infty)是E的附着点. 并设f:X\rightarrow\mathbb{R}是函数,L是实数. 设M是实数. 那么我们有: \displaystyle\lim_{x\rightarrow +\infty(-\infty); x\in E}f(x)=L 当且仅当 \displaystyle\lim_{x\rightarrow +\infty(-\infty); x\in E\cap(M, +\infty)(E\cap(-\infty, M))}f(x)=L.                                                           证明如下:先考虑+\infty是E的附着点的情形. 如果有\displaystyle\lim_{x\rightarrow +\infty; x\in E}f(x)=L,由于+\infty是E的附着点,进而E无上界,进而E\cap(M, +\infty)无上界,于是+\infty也是E\cap(M, +\infty)的附着点. 进而再由上面“定义9.10.3的注9.3.15”知有\displaystyle\lim_{x\rightarrow +\infty; x\in E\cap(M, +\infty)}f(x)=L.               如果\displaystyle\lim_{x\rightarrow +\infty; x\in E\cap(M, +\infty)}f(x)=L,即对任意实数\varepsilon>0,存在实数M_\varepsilon,对一切x\in E\cap(M, +\infty),如果x>M_\varepsilon|f(x)-L|\leqslant\varepsilon. 而对任意实数\varepsilon>0,存在实数M+1,对一切x\in E\cap(-\infty, M],如果x>M+1|f(x)-L|\leqslant\varepsilon(此语句是空洞的没有告诉我们任何事情,却是真的. 详见上面“定义9.10.3的注9.3.11”). 综上,我们有对任意实数\varepsilon>0,存在实数max\{M+1, M_\varepsilon\},对一切x\in E,如果x>max\{M+1, M_\varepsilon\}|f(x)-L|\leqslant\varepsilon. 故\displaystyle\lim_{x\rightarrow +\infty; x\in E}f(x)=L. 综上我们证明了\displaystyle\lim_{x\rightarrow +\infty; x\in E}f(x)=L当且仅当\displaystyle\lim_{x\rightarrow +\infty; x\in E\cap(M, +\infty)}f(x)=L. 同理我们可以证明-\infty是E的附着点的情形. 综上我们完成了证明.