【Linux杂货铺】进程的基本概念

秋刀鱼的滋味@ 2024-08-04 10:37:01 阅读 68


目录

🌈前言🌈

📁进程的概念

📂描述进程-PCB

📂 查看进程

📂 查看正在运行的程序

📂杀死进程

📂通过系统调用获取进程标识符

📂通过系统调用创建进程

📂 进程的特点

📁进程的状态

📂 kill 信号

📂 僵尸进程 

📂 孤儿进程

📂 运行状态

📂 阻塞状态

📂 挂起状态

📁进程的切换

📁进程的优先级

📂 概念

📂 原则

📂 查看方式

📂 PRI 和 NI

📂 调整方式

📁 进程的地址空间 (虚拟地址)

📂 虚拟地址的好处

📁 Linux2.6 内核进程调度队列​编辑

📂 活动队列

📂  过期队列

📂active指针和expired指针

📁总结


🌈前言🌈

        欢迎观看本期【Linux杂货铺】,本期内容,将讲解操作系统中重要的概念——进程。本篇文章将讲解操作系统关于进程的通用知识,以及在Linux中如何组织管理进程,以及运行进程。

        如果你还不是很了解操作系统的概念,可以收看上期关于操作系统的知识:

【Linux杂货铺】操作系统-CSDN博客

        这里简单概括一下操作系统的的前置知识,即什么管理,简单概括就是先描述,在组织。举个例子,操作系统将一个个硬件描述为一个结构体struct,将结构体组织称不同数据结构,例如链表,通过对链表的增删查改来管理硬件。

        这里就先介绍了操作系统重管理的概念。

📁进程的概念

        除法任何一个事件时,系统都会将它定义为一个进程,并给予这个进程一个ID,称为PID,同时根据触发这个进程的用户与相关属性关系,给予这个PID一组有效的权限设置。

        执行一个程序或者命令,就是触发一个事件,而获取一个PID。

        简单来说就是一个正在运行的程序。

📂描述进程-PCB

        进程的信息会被放在一个叫进程控制块的数据结构中,可以理解为进程的属性。在Linux系统中PCB是:task_struct。

        task_stuct就是Linux内核中的一个数据结构,它会被装载到内存里并且包含进程的信息。

task_ struct

内容分类

  ● 标示符:

描述本进程的唯一标示符,用来区别其他进程。

  ● 状态:

任务状态,退出代码,退出信号等。

  ● 优先级:

相对于其他进程的优先级。

  ● 程序计数器:

程序中即将被执行的下一条指令的地址。

  ● 内存指针:

包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针

  ● 上下文数据:

进程执行时处理器的寄存器中的数据

[

休学例子,要加图

CPU

,寄存器

]

  ● I/

O

状态信息

:

包括显示的

I/O

请求

,

分配给进程的

I

O

设备和被进程使用的文件列表。

  ● 记账信息:

可能包括处理器时间总和,使用的时钟数总和,时间限制,记账号等。

  ● 其他信息

        进程 = 内核结构体PCB + 程序的代码和数据。

        每个进程都有一个唯一标识符,叫pid。

📂 查看进程

        进程信息可以通过 /proc 系统文件查看。如获得PID为1的进程信息,需要查看/proc/1这个文件。

        大多数进程信息同样可以使用top和ps这些用户级工具来获取。

📂 查看正在运行的程序

<code>ps -ajx

#include <stdio.h>

#include <sys/types.h>

#include <unistd.h>

int main()

{

while(1){

sleep(1);

}

return 0;

}

📂杀死进程

<code>kill -9 pid

        kill 先简单理解为向进程发了个信号,-9表示杀死进程,在进程的状态会进行讲解。

📂通过系统调用获取进程标识符

进程id = pid

父进程id  = ppid

#include <stdio.h>

#include <sys/types.h>

#include <unistd.h>

int main()

{

//获得子进程

printf("pid: %d\n", getpid());

//获得父进程

printf("ppid: %d\n", getppid());

return 0;

}

        我们通过父进程来创建子进程,子进程继承父进程的代码和数据,会有自己的PCB。

📂通过系统调用创建进程

        fork函数,fork函数会有两个返回值,父进程一个,子进程一个。这里可以这样理解,进入fork函数后,已经有了两个进程,父进程和子进程,父子进程会进行代码共享,即有两个return。

        父进程会得到子进程的pid,子进程的返回值为0。

<code>#include <stdio.h>

#include <sys/types.h>

#include <unistd.h>

int main()

{

int ret = fork();

printf("hello proc : %d!, ret: %d\n", getpid(), ret);

sleep(1);

return 0;

}

        fork之后通常要用 if 分流。

#include <stdio.h>

#include <sys/types.h>

#include <unistd.h>

int main()

{

int ret = fork();

if(ret < 0){

perror("fork");

return 1;

}

else if(ret == 0){ //child

printf("I am child : %d!, ret: %d\n", getpid(), ret);

}else{ //father

printf("I am father : %d!, ret: %d\n", getpid(), ret);

}

sleep(1);

return 0;

}

📂 进程的特点

        1. 竞争性:系统进程数目众多,而CPU资源只有少量,甚至1个,所以进程之间具有竞争属性,为了高效完成任务,更合理的竞争相关资源,便具有了优先级。

        2. 独立性:多进程运行,需要独享各种资源,多进程运行期间互不干扰。

        3. 并行: 多个进程在多个CPU下分别,同时进行运行,这称之为并行。

        4. 并发: 多个进程在1个CPU下采用进程切换的方式,在一段时间内,让多个进程得以推进,称之为并发。

📁进程的状态

<code>static const char * const task_state_array[] = {

"R (running)", /* 0 */

"S (sleeping)", /* 1 */

"D (disk sleep)", /* 2 */

"T (stopped)", /* 4 */

"t (tracing stop)", /* 8 */

"X (dead)", /* 16 */

"Z (zombie)", /* 32 */

};

R运行状态(running): 并不意味着进程一定在运行中,它表明进程要么是在运行中要么在运行队列code>

里。

S睡眠状态(sleeping): 意味着进程在等待事件完成(这里的睡眠有时候也叫做可中断睡眠

(interruptible sleep))。

D磁盘休眠状态(Disk sleep)有时候也叫不可中断睡眠状态(uninterruptible sleep),在这个状态的

进程通常会等待IO的结束。

T停止状态(stopped): 可以通过发送 SIGSTOP 信号给进程来停止(T)进程。这个被暂停的进程可

以通过发送 SIGCONT 信号让进程继续运行。

X死亡状态(dead):这个状态只是一个返回状态,你不会在任务列表里看到这个状态。

僵死状态(Zombies)是一个比较特殊的状态。当进程退出并且父进程(使用wait()系统调用,后面讲)

没有读取到子进程退出的返回代码时就会产生僵死(尸)进程

R : 进程运行状态

S:(浅)休眠状态,进程处于等待状态,等待资源就绪,可中断休眠。

D:(深)休眠状态,不可被杀,深度睡眠,不可中断睡眠。

  1. 等待进程自己醒来。

  2. 断电重启。

T:暂停状态

        kill -19 pid 改为暂停状态,即将进程暂停。

        kill -18 pid  继续运行进程。

t : 调试暂停,debug调试,遇到断点就暂停。

📂 kill 信号

        kill 向指定进程发送信号。kill -l 查看信号

📂 僵尸进程 

        z状态,即进程已经运行完毕,但需要维持自己的退出信息,在自己的task_struct记录自己的退出信息,未来让父进程读取,如果父进程没有读取,僵尸进程会一直存在。

        僵尸进程不可以被杀死。如果僵尸进程一直没有被父进程读取,就会造成内存泄漏。

        x状态就就是,读取了z,由os释放进程。

📂 孤儿进程

        父进程先退出,子进程就被称为“孤儿进程”。孤儿进程被1号进程领养,由os进行回收。

        孤儿进程可以被杀死。

📂 运行状态

        R运行状态:并不意味着程序一定在运行中,表明程序要么在运行中,要么在运行队列中。

        分时操作系统,即每个进程都有一个时间片,在规定时间片内执行进程,如果进程没有执行完毕,则会再次进入运行队列等待。

📂 阻塞状态

        S休眠状态:意味着进程正在等待事件完成。

        D磁盘休眠状态:有时候也叫不可中断休眠状态,在这个状态的进程通常会等待IO结束。

📂 挂起状态

        内存资源不足,且进程处于阻塞状态时,进程就会被唤出到swap分区中。过多的挂起,会导致效率问题

📁进程的切换

        基于时间片等原因,进程可能会切换到其他状态,那么CPU是如何知道进程执行到哪了呢,接着上一次执行继续执行呢?

        CPU的寄存器会保存着进程的临时数据。CPU内部所有寄存器中的临时数据,就叫做进程的上下文。

📁进程的优先级

📂 概念

        本质是指定一个进程获得某种资源的先后顺序,在task_struct中是一个数字int,优先级数字越小,优先级越高。

        为什么要有优先级呢?因为进程访问的资源是有限的。

📂 原则

        分时操作系统,基于时间片调度轮转,要保证基本的公平。如果进程因为长时间不被调度,就会造成饥饿问题。

📂 查看方式

<code>ps -l

UID :

代表执行者的身份

PID :

代表这个进程的代号

PPID

:代表这个进程是由哪个进程发展衍生而来的,亦即父进程的代号

PRI

:代表这个进程可被执行的优先级,其值越小越早被执行

NI

:代表这个进程的

nice

📂 PRI 和 NI

        PRI就是进程的优先级,其值越小,进程的优先级就越高。

        NI就是nice值,即进程可被执行的优先级的修证数据。

        进程优先级 = PRI + NI。

        nice值的取值范围是[-20 , 19] 一共40个级别。

        RPI优先级默认是从801开始的,取值是[60 , 99]。

📂 调整方式

        用top命令更改已存在的进程的nice

● top

● 输入“r” -> 输入PID -> 输入nice值

📁 进程的地址空间 (虚拟地址)

        我们在C/C++语言中看到的地址都是虚拟地址。物理地址,用户是看不到的,由os统一管理。os负责将虚拟地址转换为物理地址。

        地址空间本质上是一个结构体,内部是很多属性,表示每个区间的范围。可以简单理解,每个进程都有一个地址空间和页表,页表负责将地址空间上的虚拟地址转为物理地址。

        父进程创建子进程后,子进程的页表与父进程的页表是一样的,即相同的虚拟地址映像到相同的物理地址。但是如果一个进程想要修改,则物理地址就会发生改变,即虚拟地址对应不同的物理地址。这就是写实拷贝

📂 虚拟地址的好处

1. 将无序变为有序,以统一的视角看待物理内存以及运行各个区域。

2. 进程管理模块和内存管理模块进行解耦

3. 有效的拦截非法请求。

📁 Linux2.6 内核进程调度队列

        一个CPU拥有一个requeue(运行队列)。

        普通优先级:100-139 

        实时优先级:0 - 99 (不关心)

 

📂 活动队列

         时间片还没有结束的所有进程都会按照优先级放在该队列。

nr_active:

总共有多少个运行状态的进程

queue[140]:

一个元素就是一个进程队列,相同优先级的进程按照

FIFO

规则进行排队调度

,

所以,数组下标就是优先级!

从该结构中,选择一个最合适的进程,过程是怎么的呢?

1.

0

下表开始遍历

queue[140]

2.

找到第一个非空队列,该队列必定为优先级最高的队列

3.

拿到选中队列的第一个进程,开始运行,调度完成!

4.

遍历

queue[140]

时间复杂度是常数!但还是太低效了!

bitmap[5]:

一共

140

个优先级,一共

140

个进程队列,为了提高查找非空队列的效率,就可以用

5*32

比特位表示队列是否为空,这样,便可以大大提高查找效率

        上图,我们展示活动队列,过期队列也是同理。

📂  过期队列

        过期队列和活动队列一模一样,过期队列上放置的集成,都是时间片耗尽,但是还没有结束的进程。当活动队列上的进程都处理完毕后,对过期队列进程时间片重计算。

📂active指针和expired指针

        active指针永远指向活动队列。

        expired指针永远指向过期队列。

        可是活动队列上的进程会越来越少,过期队列上的进程会越来越多,因为进程时间片到期时一直都存在的。

        没关系,在合适的时候,只要能够交换active

指针和

expired

指针的内容,就相当于有具有了一批新的活动进程!

📁总结

        以上,就是本期【Linux杂货铺】进程基本概念的所有内容了,讲解了什么事进程,进程的状态有哪些,包括僵尸进程,孤儿进程,讲解了进程的优先级,也粗略的讲解了进程的地址空间,也就是平常说的虚拟地址,以及Linux中临时拷贝是什么,在Linux中是如何调度进程的。

        如果感觉本期内容对你有帮助,欢迎点赞,收藏,关注Thanks♪(・ω・)ノ



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。