【Linux杂货铺】进程的基本概念
秋刀鱼的滋味@ 2024-08-04 10:37:01 阅读 68
目录
🌈前言🌈
📁进程的概念
📂描述进程-PCB
📂 查看进程
📂 查看正在运行的程序
📂杀死进程
📂通过系统调用获取进程标识符
📂通过系统调用创建进程
📂 进程的特点
📁进程的状态
📂 kill 信号
📂 僵尸进程
📂 孤儿进程
📂 运行状态
📂 阻塞状态
📂 挂起状态
📁进程的切换
📁进程的优先级
📂 概念
📂 原则
📂 查看方式
📂 PRI 和 NI
📂 调整方式
📁 进程的地址空间 (虚拟地址)
📂 虚拟地址的好处
📁 Linux2.6 内核进程调度队列编辑
📂 活动队列
📂 过期队列
📂active指针和expired指针
📁总结
🌈前言🌈
欢迎观看本期【Linux杂货铺】,本期内容,将讲解操作系统中重要的概念——进程。本篇文章将讲解操作系统关于进程的通用知识,以及在Linux中如何组织管理进程,以及运行进程。
如果你还不是很了解操作系统的概念,可以收看上期关于操作系统的知识:
【Linux杂货铺】操作系统-CSDN博客
这里简单概括一下操作系统的的前置知识,即什么管理,简单概括就是先描述,在组织。举个例子,操作系统将一个个硬件描述为一个结构体struct,将结构体组织称不同数据结构,例如链表,通过对链表的增删查改来管理硬件。
这里就先介绍了操作系统重管理的概念。
📁进程的概念
除法任何一个事件时,系统都会将它定义为一个进程,并给予这个进程一个ID,称为PID,同时根据触发这个进程的用户与相关属性关系,给予这个PID一组有效的权限设置。
执行一个程序或者命令,就是触发一个事件,而获取一个PID。
简单来说就是一个正在运行的程序。
📂描述进程-PCB
进程的信息会被放在一个叫进程控制块的数据结构中,可以理解为进程的属性。在Linux系统中PCB是:task_struct。
task_stuct就是Linux内核中的一个数据结构,它会被装载到内存里并且包含进程的信息。
task_ struct
内容分类
● 标示符:
描述本进程的唯一标示符,用来区别其他进程。
● 状态:
任务状态,退出代码,退出信号等。
● 优先级:
相对于其他进程的优先级。
● 程序计数器:
程序中即将被执行的下一条指令的地址。
● 内存指针:
包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针
● 上下文数据:
进程执行时处理器的寄存器中的数据
[
休学例子,要加图
CPU
,寄存器
]
。
● I/
O
状态信息
:
包括显示的
I/O
请求
,
分配给进程的
I
/
O
设备和被进程使用的文件列表。
● 记账信息:
可能包括处理器时间总和,使用的时钟数总和,时间限制,记账号等。
● 其他信息
进程 = 内核结构体PCB + 程序的代码和数据。
每个进程都有一个唯一标识符,叫pid。
📂 查看进程
进程信息可以通过 /proc 系统文件查看。如获得PID为1的进程信息,需要查看/proc/1这个文件。
大多数进程信息同样可以使用top和ps这些用户级工具来获取。
📂 查看正在运行的程序
<code>ps -ajx
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main()
{
while(1){
sleep(1);
}
return 0;
}
📂杀死进程
<code>kill -9 pid
kill 先简单理解为向进程发了个信号,-9表示杀死进程,在进程的状态会进行讲解。
📂通过系统调用获取进程标识符
进程id = pid
父进程id = ppid
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main()
{
//获得子进程
printf("pid: %d\n", getpid());
//获得父进程
printf("ppid: %d\n", getppid());
return 0;
}
我们通过父进程来创建子进程,子进程继承父进程的代码和数据,会有自己的PCB。
📂通过系统调用创建进程
fork函数,fork函数会有两个返回值,父进程一个,子进程一个。这里可以这样理解,进入fork函数后,已经有了两个进程,父进程和子进程,父子进程会进行代码共享,即有两个return。
父进程会得到子进程的pid,子进程的返回值为0。
<code>#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main()
{
int ret = fork();
printf("hello proc : %d!, ret: %d\n", getpid(), ret);
sleep(1);
return 0;
}
fork之后通常要用 if 分流。
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main()
{
int ret = fork();
if(ret < 0){
perror("fork");
return 1;
}
else if(ret == 0){ //child
printf("I am child : %d!, ret: %d\n", getpid(), ret);
}else{ //father
printf("I am father : %d!, ret: %d\n", getpid(), ret);
}
sleep(1);
return 0;
}
📂 进程的特点
1. 竞争性:系统进程数目众多,而CPU资源只有少量,甚至1个,所以进程之间具有竞争属性,为了高效完成任务,更合理的竞争相关资源,便具有了优先级。
2. 独立性:多进程运行,需要独享各种资源,多进程运行期间互不干扰。
3. 并行: 多个进程在多个CPU下分别,同时进行运行,这称之为并行。
4. 并发: 多个进程在1个CPU下采用进程切换的方式,在一段时间内,让多个进程得以推进,称之为并发。
📁进程的状态
<code>static const char * const task_state_array[] = {
"R (running)", /* 0 */
"S (sleeping)", /* 1 */
"D (disk sleep)", /* 2 */
"T (stopped)", /* 4 */
"t (tracing stop)", /* 8 */
"X (dead)", /* 16 */
"Z (zombie)", /* 32 */
};
R运行状态(running): 并不意味着进程一定在运行中,它表明进程要么是在运行中要么在运行队列code>
里。
S睡眠状态(sleeping): 意味着进程在等待事件完成(这里的睡眠有时候也叫做可中断睡眠
(interruptible sleep))。
D磁盘休眠状态(Disk sleep)有时候也叫不可中断睡眠状态(uninterruptible sleep),在这个状态的
进程通常会等待IO的结束。
T停止状态(stopped): 可以通过发送 SIGSTOP 信号给进程来停止(T)进程。这个被暂停的进程可
以通过发送 SIGCONT 信号让进程继续运行。
X死亡状态(dead):这个状态只是一个返回状态,你不会在任务列表里看到这个状态。
僵死状态(Zombies)是一个比较特殊的状态。当进程退出并且父进程(使用wait()系统调用,后面讲)
没有读取到子进程退出的返回代码时就会产生僵死(尸)进程
R : 进程运行状态
S:(浅)休眠状态,进程处于等待状态,等待资源就绪,可中断休眠。
D:(深)休眠状态,不可被杀,深度睡眠,不可中断睡眠。
1. 等待进程自己醒来。
2. 断电重启。
T:暂停状态
kill -19 pid 改为暂停状态,即将进程暂停。
kill -18 pid 继续运行进程。
t : 调试暂停,debug调试,遇到断点就暂停。
📂 kill 信号
kill 向指定进程发送信号。kill -l 查看信号
📂 僵尸进程
z状态,即进程已经运行完毕,但需要维持自己的退出信息,在自己的task_struct记录自己的退出信息,未来让父进程读取,如果父进程没有读取,僵尸进程会一直存在。
僵尸进程不可以被杀死。如果僵尸进程一直没有被父进程读取,就会造成内存泄漏。
x状态就就是,读取了z,由os释放进程。
📂 孤儿进程
父进程先退出,子进程就被称为“孤儿进程”。孤儿进程被1号进程领养,由os进行回收。
孤儿进程可以被杀死。
📂 运行状态
R运行状态:并不意味着程序一定在运行中,表明程序要么在运行中,要么在运行队列中。
分时操作系统,即每个进程都有一个时间片,在规定时间片内执行进程,如果进程没有执行完毕,则会再次进入运行队列等待。
📂 阻塞状态
S休眠状态:意味着进程正在等待事件完成。
D磁盘休眠状态:有时候也叫不可中断休眠状态,在这个状态的进程通常会等待IO结束。
📂 挂起状态
内存资源不足,且进程处于阻塞状态时,进程就会被唤出到swap分区中。过多的挂起,会导致效率问题
📁进程的切换
基于时间片等原因,进程可能会切换到其他状态,那么CPU是如何知道进程执行到哪了呢,接着上一次执行继续执行呢?
CPU的寄存器会保存着进程的临时数据。CPU内部所有寄存器中的临时数据,就叫做进程的上下文。
📁进程的优先级
📂 概念
本质是指定一个进程获得某种资源的先后顺序,在task_struct中是一个数字int,优先级数字越小,优先级越高。
为什么要有优先级呢?因为进程访问的资源是有限的。
📂 原则
分时操作系统,基于时间片调度轮转,要保证基本的公平。如果进程因为长时间不被调度,就会造成饥饿问题。
📂 查看方式
<code>ps -l
UID :
代表执行者的身份
PID :
代表这个进程的代号
PPID
:代表这个进程是由哪个进程发展衍生而来的,亦即父进程的代号
PRI
:代表这个进程可被执行的优先级,其值越小越早被执行
NI
:代表这个进程的
nice
值
📂 PRI 和 NI
PRI就是进程的优先级,其值越小,进程的优先级就越高。
NI就是nice值,即进程可被执行的优先级的修证数据。
进程优先级 = PRI + NI。
nice值的取值范围是[-20 , 19] 一共40个级别。
RPI优先级默认是从801开始的,取值是[60 , 99]。
📂 调整方式
用top命令更改已存在的进程的nice
● top
● 输入“r” -> 输入PID -> 输入nice值
📁 进程的地址空间 (虚拟地址)
我们在C/C++语言中看到的地址都是虚拟地址。物理地址,用户是看不到的,由os统一管理。os负责将虚拟地址转换为物理地址。
地址空间本质上是一个结构体,内部是很多属性,表示每个区间的范围。可以简单理解,每个进程都有一个地址空间和页表,页表负责将地址空间上的虚拟地址转为物理地址。
父进程创建子进程后,子进程的页表与父进程的页表是一样的,即相同的虚拟地址映像到相同的物理地址。但是如果一个进程想要修改,则物理地址就会发生改变,即虚拟地址对应不同的物理地址。这就是写实拷贝。
📂 虚拟地址的好处
1. 将无序变为有序,以统一的视角看待物理内存以及运行各个区域。
2. 进程管理模块和内存管理模块进行解耦
3. 有效的拦截非法请求。
📁 Linux2.6 内核进程调度队列
一个CPU拥有一个requeue(运行队列)。
普通优先级:100-139
实时优先级:0 - 99 (不关心)
📂 活动队列
时间片还没有结束的所有进程都会按照优先级放在该队列。
nr_active:
总共有多少个运行状态的进程
queue[140]:
一个元素就是一个进程队列,相同优先级的进程按照
FIFO
规则进行排队调度
,
所以,数组下标就是优先级!
从该结构中,选择一个最合适的进程,过程是怎么的呢?
1.
从
0
下表开始遍历
queue[140]
2.
找到第一个非空队列,该队列必定为优先级最高的队列
3.
拿到选中队列的第一个进程,开始运行,调度完成!
4.
遍历
queue[140]
时间复杂度是常数!但还是太低效了!
bitmap[5]:
一共
140
个优先级,一共
140
个进程队列,为了提高查找非空队列的效率,就可以用
5*32
个
比特位表示队列是否为空,这样,便可以大大提高查找效率
上图,我们展示活动队列,过期队列也是同理。
📂 过期队列
过期队列和活动队列一模一样,过期队列上放置的集成,都是时间片耗尽,但是还没有结束的进程。当活动队列上的进程都处理完毕后,对过期队列进程时间片重计算。
📂active指针和expired指针
active指针永远指向活动队列。
expired指针永远指向过期队列。
可是活动队列上的进程会越来越少,过期队列上的进程会越来越多,因为进程时间片到期时一直都存在的。
没关系,在合适的时候,只要能够交换active
指针和
expired
指针的内容,就相当于有具有了一批新的活动进程!
📁总结
以上,就是本期【Linux杂货铺】进程基本概念的所有内容了,讲解了什么事进程,进程的状态有哪些,包括僵尸进程,孤儿进程,讲解了进程的优先级,也粗略的讲解了进程的地址空间,也就是平常说的虚拟地址,以及Linux中临时拷贝是什么,在Linux中是如何调度进程的。
如果感觉本期内容对你有帮助,欢迎点赞,收藏,关注Thanks♪(・ω・)ノ
声明
本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。