《x86汇编语言：编写64位多处理器多线程操作系统》图书介绍和资源下载

站长 · 发表于 2024-5-20 16:41:36

站长 · 发表于 2024-5-20 16:42:46

前言

十年前，我写了一本书，名字叫《x86汇编语言：从实模式到保护模式》（已于2023年再版）。记得当时我在书里说还要写一本64位的下册，但图书出版之后发现学汇编语言的人并没有当初想象中的那么多，以至于心灰意冷，这个下册也就没了下文。非但如此，按原来的计划，在图书出版之后我会提供一份习题答案。但由于我这个人比较懒散，过了没几天，出书的新鲜劲儿一过，对此事的热情大减，习题答案也就没有了下文，所以大家会注意到《x86汇编语言：从实模式到保护模式》至今没有一套官方的习题答案。

过去十年，我观察到了个人计算机市场上的两个变化。一是64位计算成为个人计算机市场的主流。仿佛一夜之间，市面上的32位计算机系统都消失了，64位处理器、64位操作系统开始在市场上占据统治地位，应用程序也都变成了64位，至少会提供32位和64位两种版本。二是多处理器和并行计算开始在桌面（个人）计算机系统上兴起，几乎所有计算机语言和编译器都添加了对多线程和并行计算的支持，甚至连C这种古老的语言都在2011年添加了多线程和并发的支持，并推出了ISO/IEC 9899:2011标准。

那么，在最接近硬件的层面上，以汇编语言的视角来看，64位的处理器都具有什么样的特点、如何创建多个线程、如何把线程指派到不同的处理器上同时并行执行等这一切又重新激发了我好为人师的兴致，以至于决定重启《x86汇编语言：从实模式到保护模式》传说中的下册。

决定写这本书的时候我正从事视频创作，所以决定先将它制作成视频，然后整理成书。视频制作花了一年多，接下来就是整理成书了。但这个时候我的新鲜劲儿又过了，又开始变得懒散，去年一年才整理出两章。也就是今年，在出版社编辑缪晓红的催促和鼓励下，我又快马加鞭，仅用两个多月就完成了全部书稿。

一本书，它的名字很重要，得让人一看到书的名字就知道它都讲了些什么内容。如果可能的话，我希望本书的名字叫《x86汇编语言：编写一个简单的、简易的操作系统雏形，用来演示64位环境下的多处理器管理、动态内存分配、多处理器多任务的调度和切换、多处理器多线程的调度和切换、数据竞争和锁，但它不包括文件管理、设备管理等内容》。但诚如你所见，本书的名字并不太长，太长就不成体统了。

本书一开始介绍64位x86处理器的硬件架构，接着介绍与操作系统相关的内容，包括单处理器的多任务切换、多处理器的多任务切换和多线程切换、数据竞争、原子操作、自旋锁和互斥锁等。

传统上，大家都是在流行的操作系统，比如Windows和Linux上编写并发程序的，而且只能使用高级语言。这使得多处理器环境下的多任务和多线程调度、原子操作、锁、线程同步等内容对很多人来说是笼统的、抽象的，像隔了层纱一样，看不见本质。相反，如果用汇编语言实现一个简单的操作系统内核，并演示多处理器环境下的多任务、多线程、锁和线程同步，这是可能的吗？我相信没有人会觉得这是简单的事情。但事实上，如果你想来一个简单的，其实也很容易，这本书就能告诉你如何实现它。

这本书并不是零基础可读的，你必须具有保护模式的知识基础，且我强烈建议你先读懂它的上册，即《x86汇编语言：从实模式到保护模式》一书。

为方便阅读，我把代码都印在书里了。这样做自然会增加书的厚度及成本，但相对于给你带来的便利和时间上的节省来说，还是值得的。

请关注我的个人网站www.lizhongc.com以了解我的最新动态或者获取相关的资源，也可以给我发送电子邮件，我的邮箱是leechung@126.com。

二〇二四年五月

站长 · 发表于 2024-5-20 16:42:57

目录

第1章基本要求和相关说明 1

1.1 配书代码和工具 1

1.2 NASM的下载和安装 1

1.3 NASMIDE的下载和使用 3

1.4 下载和安装VirtualBox 6

1.5 使用FixVhdWr将程序写入虚拟硬盘 8

1.6 本书的代码组织 10

第2章 x64架构的基本执行环境 37

2.1 x64架构的由来 37

2.2 物理地址、有效地址和线性地址 39

2.3 x64架构的工作模式 40

2.3.1 x86处理器的工作模式 40

2.3.2 IA-32e模式及其子模式 41

2.4 x64架构的寄存器 43

2.4.1 x64架构对通用寄存器的扩展 43

2.4.2 x64架构的通用寄存器访问规则 45

2.5 x86处理器的物理地址空间 46

2.6 传统模式的内存访问 47

2.6.1 传统模式下的线性地址和物理地址 47

2.6.2 传统模式下的32位4KB分页技术 48

2.6.3 传统模式下如何利用超过4GB的物理内存 49

2.6.4 传统模式下的32位4MB分页技术 50

2.6.5 传统模式下的32位PAE分页技术 51

2.6.6 传统模式下的32位PAE-4KB分页技术 52

2.6.7 传统模式下的32位PAE-2MB分页技术 54

2.7 IA-32e模式的内存访问 55

2.7.1 x64架构的线性地址空间 55

2.7.2 扩高（Canonical）地址 56

2.7.3 扩高地址的特点和处理器检查 57

2.7.4 兼容模式的内存访问 59

2.7.5 64位模式的内存访问 59

2.7.6 x64架构的段寄存器 60

2.7.7 x64架构的代码段描述符 61

2.7.8 x64架构的数据段描述符 62

2.7.9 x64架构的4级和5级分页 62

2.8 x64架构的系统表和系统描述符 64

2.8.1 x64架构的GDTR 65

2.8.2 x64架构的IDTR 66

2.8.3 x64架构的LDT描述符和LDTR 66

2.8.4 x64架构的TSS描述符和TR 67

2.9 x64架构的标志寄存器和指令指针寄存器 68

2.10 x64架构的寻址方式 70

2.10.1 x64架构下传统模式的寻址方式 70

2.10.2 x64架构下IA-32e模式的寻址方式 72

2.10.3 64位模式的RIP相对寻址方式 72

2.10.4 64位模式下的指令变化情况 74

2.11 IA-32e模式下的中断和异常处理概述 76

第3章进入IA-32e模式 78

3.1 如何进入IA-32e模式 78

3.2 本章代码清单 80

3.3 执行主引导程序 100

3.3.1 NASM的文件包含 100

3.3.2 主引导程序的说明 101

3.3.3 用BIOS硬盘扩展读加载内核加载器 102

3.3.4 通过数据段访问栈中的数据结构 105

3.3.5 读取内核加载器程序的剩余部分 106

3.3.6 转入内核加载器执行 108

3.4 执行内核加载器 108

3.4.1 检测处理器是否支持IA-32e模式 109

3.4.2 位测试指令BT 109

3.4.3 获取处理器的商标和地址尺寸 110

3.5 进入保护模式 113

3.6 加载内核程序 116

3.7 为进入IA-32e模式准备4级分页 119

3.7.1 2MB和1GB页面的4级分页方式 121

3.7.2 4级头表的格式 122

3.7.3 页目录指针项的格式 124

3.7.4 页目录项和页表项的格式 125

3.7.5 4级头表的创建和初始化 127

3.7.6 创建指向4级头表自身的4级头表项 128

3.7.7 准备映射物理内存的低端2MB空间 128

3.7.8 创建与低端2MB物理内存对应的分页系统表项 131

3.7.9 将物理内存低端的2MB映射到线性地址空间的高端 132

3.7.10 为多任务环境准备必要的4级头表项 134

3.7.11 为多任务环境预分配254个页目录指针表 135

3.7.12 进程上下文标识PCID 137

3.7.13 控制寄存器CR3的内容格式 138

3.7.14 设置控制寄存器CR3并开启物理地址扩展功能 139

3.7.15 型号专属寄存器IA32_EFER的设置和分页的开启 140

3.8 进入IA-32e的兼容模式执行 141

3.9 进入64位模式的内核执行 142

3.10 让内核工作在线性地址空间的高端 143

3.10.1 启用GDT和栈区的高端线性地址 144

3.10.2 使用RIP相对寻址方式计算内核的高端线性地址 145

3.10.3 让处理器转到内核程序对应的高端位置继续执行 146

3.11 初始化IA-32e模式下的中断系统 147

3.11.1 IA-32e模式下的中断门和陷阱门 147

3.11.2 IA-32e模式下的中断处理过程 148

3.11.3 通用的中断和异常处理策略 149

3.11.4 通用异常服务例程的工作过程 150

3.11.5 加载有效地址指令LEA 152

3.11.6 创建通用异常处理过程的中断门 154

3.11.7 安装通用异常处理过程的中断门 155

3.11.8 安装通用中断处理过程的中断门 156

3.11.9 初始化8259中断控制器 157

3.11.10 打印64位模式下的第一条信息 158

3.12 本章代码的编译和运行 159

第4章单处理器环境下的多任务管理和调度 161

4.1 本章代码清单 162

4.2 初始化快速系统调用环境 179

4.2.1 快速系统调用的原理 179

4.2.2 为快速系统调用安装段描述符 181

4.2.3 为快速系统调用准备段选择子 183

4.2.4 设置快速系统调用的入口点 184

4.2.5 快速系统调用时的RFLAGS和栈切换 184

4.3 动态内存分配 185

4.3.1 内核空间的分配策略 186

4.3.2 内核可用线性地址的获取和更新 187

4.3.3 立即数在64位模式下的长度限制 188

4.3.4 计算本次内存分配涉及的线性地址范围 189

4.3.5 获取与指定线性地址对应的4级头表项的线性地址 190

4.3.6 页面分配与页映射位串 192

4.3.7 页映射位串的定义和空闲页的查找 193

4.3.8 获取与指定线性地址对应的页目录指针项的线性地址 195

4.3.9 检查与指定线性地址对应的页目录指针项是否存在 197

4.3.10 分配页目录表并安装与线性地址对应的页目录指针项 198

4.3.11 安装与指定线性地址对应的页目录项、页表项和页面 198

4.4 创建并安装TSS描述符 199

4.4.1 LDT和TSS描述符的格式 200

4.4.2 创建和安装64位的TSS描述符并加载任务寄存器TR 201

4.5 初始化实时时钟中断 202

4.6 创建外壳任务 203

4.6.1 准备创建外壳任务 203

4.6.2 为新任务创建任务控制块PCB 204

4.6.3 为新任务创建4级头表 205

4.6.4 将指定的线性地址映射到指定的物理页 207

4.6.5 复制当前活动4级头表的内容给新任务的4级头表 207

4.6.6 切换到新任务的地址空间并清空4级头表的前半部分 208

4.6.7 为新任务分配0特权级使用的栈空间 209

4.6.8 为新任务分配3特权级使用的栈空间 210

4.6.9 从硬盘上加载用户程序 211

4.6.10 生成任务标识 212

4.6.11 将新任务的PCB添加到PCB链表 213

4.6.12 设置外壳任务的状态 215

4.7 设置任务状态段TSS 216

4.8 转到外壳任务的局部空间执行 216

4.9 快速系统调用的进入和返回 218

4.9.1 为快速系统调用指定功能号 219

4.9.2 根据功能号计算内核例程的线性地址 219

4.9.3 快速系统调用的返回和指令前缀REX 220

4.10 利用实时时钟中断执行任务切换 221

4.10.1 查找处于就绪状态的任务 222

4.10.2 任务切换的执行过程 223

4.11 外壳任务的执行过程 224

4.11.1 通过系统调用获取屏幕上可用的显示行坐标 224

4.11.2 通过系统调用获取当前时间 225

4.11.3 在外壳任务中显示当前时间 226

4.12 用户任务的创建和执行 227

4.12.1 当前任务标识的获取 228

4.12.2 用户程序例程库的介绍 228

4.12.3 将64位二进制数转换为十进制字符串 229

4.12.4 在每轮相加中将结果和加数转换为字符串 230

4.12.5 字符串的连接和显示 231

4.12.6 用户任务的终止 232

4.13 本章程序的编译和执行 233

第5章多处理器和APIC的初始化 235

5.1 多处理器环境概述 235

5.2 同时多线程和INTEL超线程技术 236

5.3 高级可编程中断控制器APIC 238

5.3.1 中断引脚、中断类型和中断源 240

5.3.2 本地中断源和本地向量表 241

5.3.3 APIC的工作模式和APIC ID 242

5.3.4 组成Local APIC ID的处理器拓扑 243

5.3.5 Local APIC的地址映射 244

5.3.6 I/O APIC的地址映射 245

5.3.7 多处理器的初始化过程和MP规范 245

5.3.8 高级的配置和电源接口（ACPI）规范 246

5.4 本章代码清单 247

5.5 获取ACPI申领的物理内存地址范围 266

5.5.1 ACPI的数据结构和表 266

5.5.2 E820功能调用和内存地址范围结构 267

5.5.3 查询和保存物理地址映射数据 267

5.5.4 准备映射ACPI申领的内存 269

5.5.5 映射ACPI申领的内存 269

5.6 访问ACPI的数据结构和表 271

5.6.1 根系统描述指针结构 272

5.6.2 搜索根系统描述指针结构 273

5.6.3 系统描述表的层次结构和表头格式 273

5.6.4 扩展的系统描述表XSDT 274

5.6.5 通过XSDT搜索多APIC描述表MADT 276

5.6.6 根系统描述表RSDT 276

5.6.7 通过RSDT搜索多APIC描述表MADT 277

5.6.8 多APIC描述表MADT的格式 278

5.6.9 准备遍历中断控制器结构列表 281

5.6.10 从中断控制器结构内提取处理器和APIC信息 281

5.7 映射APIC地址 283

5.8 测量Local APIC定时器 284

5.8.1 Local APIC定时器 284

5.8.2 Local APIC定时器的精度 285

5.8.3 APIC定时器的本地向量表寄存器及其设置 286

5.8.4 设置CMOS RTC以测量Local APIC定时器 287

5.8.5 测量Local APIC定时器在1ms内经历的时钟周期数 288

5.9 使用Local APIC定时器中断切换任务 289

5.9.1 多处理器系统的虚拟线模式 290

5.9.2 中断输入引脚LINT0的本地向量表寄存器 290

5.9.3 设置Local APIC定时器 292

5.10 使用经由I/O APIC的中断执行任务切换 294

5.10.1 I/O APIC概述 295

5.10.2 I/O APIC的I/O重定向表寄存器 296

5.10.3 用I/O APIC投递的中断实施任务切换 297

5.11 逻辑目标模式下的中断目标判别机制 298

5.12 APIC中断的优先级及其相关的寄存器 299

5.13 APIC中断的接受机制 300

5.14 最低优先级模式的中断处理 301

第6章多处理器环境下的多任务管理和调度 302

6.1 本章代码清单 303

6.2 高速缓存 332

6.3 数据竞争和锁 333

6.3.1 单处理器环境下的数据竞争 334

6.3.2 多处理器环境下的数据竞争 336

6.3.3 原子操作 337

6.3.4 锁和自旋锁 339

6.3.5 分支预测和PAUSE指令 341

6.3.6 多行宏定义 342

6.3.7 锁在内核例程中的应用 344

6.3.8 互斥锁的一般原理 346

6.4 内核的初始化 347

6.4.1 处理器专属存储区（每CPU数据区） 347

6.4.2 为自举处理器BSP分配专属存储区 349

6.4.3 处理器专属存储区的访问 350

6.5 多处理器系统的初始化 351

6.5.1 多处理器系统的初始化协议算法 352

6.5.2 本章的多处理器多任务调度方案 353

6.5.3 中断命令寄存器ICR 355

6.5.4 本章的AP初始化代码简介 357

6.5.5 将AP初始化代码传送到指定位置 357

6.5.6 向所有应用处理器广播SIPI消息 358

6.6 应用处理器AP的初始化过程 359

6.6.1 进入保护模式 360

6.6.2 进入64位模式 360

6.6.3 为每个应用处理器创建必要的数据结构 362

6.6.4 对称多处理器系统的实现 363

6.6.5 用SWAPGS指令访问专属存储区 365

6.6.6 开启Local APIC并进入停机待命状态 366

6.7 由自举处理器BSP继续完成剩余的内核初始化工作 367

6.7.1 等待所有应用处理器完成初始化 367

6.7.2 创建系统外壳任务并为其指定时间片 368

6.7.3 广播新任务认领消息并进入预定状态 369

6.8 多处理器多任务的管理和调度 370

6.8.1 新任务认领中断的处理过程 370

6.8.2 在任务链表中查找就绪任务 372

6.8.3 用CMPXCHG指令以无锁方式操作链表节点 373

6.8.4 为新任务指定时间片 375

6.8.5 恢复任务的状态并开始执行 376

6.8.6 时间片到期中断的处理过程 377

6.8.7 处理器专属存储区的必要性 378

6.8.8 外壳任务的执行流程 379

6.8.9 用户任务的执行流程 380

6.8.10 任务的终止 381

6.9 程序的编译和执行 382

第7章多处理器环境下的多线程管理和调度 383

7.1 任务（进程）和线程 383

7.2 本章代码清单 384

7.3 本章的任务控制块PCB和线程控制块TCB 418

7.4 任务及其主线程的创建 421

7.5 线程的调度和切换 422

7.5.1 新线程认领中断的处理过程 423

7.5.2 查找处于就绪状态的线程 424

7.5.3 恢复并执行指定的线程 425

7.5.4 时间片到期中断的处理过程 426

7.6 系统外壳任务及其主线程的执行 427

7.7 将例程创建为线程 429

7.7.1 将例程创建为线程 429

7.7.2 创建线程控制块TCB和线程私有的栈 430

7.7.3 例程返回和结束线程的区别 430

7.7.4 如何用RET指令结束线程 431

7.7.5 在栈中构造结束线程的栈帧 432

7.7.6 将TCB添加到当前任务的TCB链表 434

7.8 线程的执行 435

7.8.1 动态内存分配 435

7.8.2 在栈中保存所有缓冲区的线性地址 436

7.8.3 字符串的生成、连接和打印 438

7.9 线程的结束和任务的终止 438

7.10 程序的编译和执行 439

第8章数据竞争和互斥锁 441

8.1 本章代码清单 441

8.2 线程的休眠和唤醒 501

8.2.1 执行线程休眠的系统调用 501

8.2.2 保存和修改休眠线程的状态 503

8.2.3 安装系统管理中断 505

8.2.4 系统管理中断的处理过程 505

8.2.5 唤醒休眠的线程 507

8.3 数据竞争的实例 507

8.3.1 在两个同时执行的线程内访问共享数据 508

8.3.2 线程等待 509

8.3.3 唤醒处于等待状态的线程 510

8.3.4 打印两个线程操作之后的共享数据 511

8.3.5 并发线程的数据竞争过程 513

8.4 使用锁定的原子操作解决数据竞争 514

8.5 使用互斥锁解决数据竞争 515

8.5.1 互斥锁的创建和初始化 515

8.5.2 互斥锁的获取（加锁） 516

8.5.3 唤醒等待互斥锁的线程 517

8.5.4 互斥锁的释放 517

8.5.5 使用互斥锁之后的运行效果 518

8.6 互斥锁的应用策略 519

代码索引 521

站长 · 发表于 2024-5-20 16:43:08

相关资源：

编辑和编译工具（Nasmide和Fixvhdwr等工具）下载：

x64_Binary.rar (3.76 MB, 下载次数: 3870)
源文件（各章的汇编语言源程序文件）下载：

x64_Source.rar (354.38 KB, 下载次数: 3358)
完整的配书文件包（以上两者的综合）下载：

x64asm.rar (4.1 MB, 下载次数: 4411)

签名书含邮费共计98元每本，需要签名书的同学请给站长留言。

努力学习的小菜 · 发表于 2024-5-30 12:45:25

老师新书什么时候能买到

站长 · 发表于 2024-5-30 12:58:07

努力学习的小菜发表于 2024-5-30 12:45
老师新书什么时候能买到

昨天编辑说已经开始印刷了。印刷完入库，上架。估计也就十来天吧。

lincolln · 发表于 2024-6-1 08:43:16

老师好，windows一直提示有病毒，是什么原因：

站长 · 发表于 2024-6-1 10:09:51

lincolln 发表于 2024-6-1 08:43
老师好，windows一直提示有病毒，是什么原因：

尚不太清楚。我的计算机是Windows 10，我一直用它自带的Windows Defender。
我自己尝试下载，检测，Windows Defender报告说没有发现威胁。
从你发的截图，我看不到X64_Source是怎么报告的。如果也报告威胁，那就不可能了。因为这个文件夹只包含源码，以及生成的二进制文件。

lincolln · 发表于 2024-6-2 22:51:38

站长发表于 2024-6-1 10:09
尚不太清楚。我的计算机是Windows 10，我一直用它自带的Windows Defender。
我自己尝试下载，检测，Windo ...

老师好，sourc没有问题，asm和binary两个系统说有问题。系统是 Microsoft Windows 11 企业版，如图：

站长 · 发表于 2024-6-3 09:36:46

lincolln 发表于 2024-6-2 22:51
老师好，sourc没有问题，asm和binary两个系统说有问题。系统是 Microsoft Windows 11 企业版，如图： ...

报告的危险来自于文件LEARN.VHD
这是一个虚拟硬盘，能有什么危险呢？这是误报。

		自动登录	找回密码
密码			立即注册

《x86汇编语言：编写64位多处理器多线程操作系统》图书介绍和资源下载

至尊会员