【Linux】进程间通信:详解 VSCode使用 | 匿名管道

lvy¯ 2024-08-11 10:07:02 阅读 69

目录

0. 引入:vscode 的使用

下载

推荐插件

连接云服务器

1. 进程间通信

1.1 是什么

1.2 为什么

1.3 怎么办

介绍 :

2. 匿名管道

2.1 引入

2.2 原理

3. 建立管道的系统调用pipe

3.1 介绍

形参

返回值

3.2 代码

3.3 站在内核的角度

编码实现


0. 引入:vscode 的使用

下载

官⽹下载地址:https://code.visualstudio.com/Download

下载太慢,推荐下载链接:

https://vscode.cdn.azure.cn/stable/30d9c6cd9483b2cc586687151bcbcd635f373630/VSCodeUser

然后一直 next 安装即可

推荐插件

安装完成后在如下地方,继续安装插件即可

Remote - SSH - 远程登录LinuxC/C++ - 必装C/C++ Extension Pack - C/C++扩展包,下载直接安装,它包含了 vscode 编写 C/C++ ⼯程需要的插件(C/C++、C/C++ Themes、CMake、CMake Tools和Better C++ Syntax等),和以前⽐不需要⼀个个找了。C/C++ Themes - 主题设置,插件⾥⾯可以点击设置Chinese (Simplified) (简体中⽂)vscode-icons - 改变编辑器⾥⾯的⽂件图标filesize - 左下⻆显⽰源⽂件⼤⼩的插件Include AutoComplete - ⾃动头⽂件包含GBKtoUTF8 - ⾃动将 GBK 转换为 UTF8

连接云服务器

安装如下软件后,对照 README 操作,输入主机号即可

可以在我的电脑的如下路径下查看 config ,检查连接

记事本查看

连接完成后,打开需要的文件夹即可

使用小tips:

ctrl ~ :打开终端ctrl s : 保存文件ctrl/ :可以实现注释

1. 进程间通信

1.1 是什么

数据传输:一个进程需要将它的数据发送给另一个进程。资源共享:多个进程之间共享同样的资源。通知事件:一个进程需要向另一个或一组进程发送消息,通知它(它们)发生了某种事件(如进程终止时要通知父进程)。进程控制:有些进程希望完全控制另一个进程的执行(如Debug进程),此时控制进程希望能够拦截另一个进程的所有陷入和异常,并能够及时知道它的状态改变。

1.2 为什么

为了实现两个或者多个进程实现数据层面的交互,因为进程独立性的存在,导致进程通信的成本比较高

通信可以用于:1. 基本数据 2. 发送命令 3. 某种协调 4. 通知 ...很多场景下需要多个进程协同工作来完成要求。例如

两个进程cat和grep协同工作,将log.txt文件中带有hello的文字显示出来。

1.3 怎么办

当前主要是通过三种策略来实现进程间通信的:

管道:通过文件系统通信

匿名管道命名管道

System Ⅴ:聚焦在本地通信

共享内存消息队列信号量

POSIX:让通信可以跨主机

共享内存消息队列信号量互斥量条件变量读写锁

每一种策略下都有很多种通信方式,在这篇文章中将详细讲解管道策略的通信方式。

介绍 :

a. 进程间通信的本质:必须让不同的进程看到同一份“资源

b. 资源?特定形式的内存空间

c. 这个资源谁提供?一般是操作系统

为什么不是我们两个进程中的一个呢?假设一个进程提供,这个资源属于谁?

这个进程独有,破坏进程独立性,所以要借用第三方空间

d. 我们进程访问这个空间,进行通信,本质就是访问操作系统!

进程代表的就是用户,资源从创建,使用(一般),释放--系统调用接口!

从底层设计,从接口设计,都要由操作系统独立设计,一般操作系统,会有一个独立的通信模块--隶属于文件系统--IPC 通信模块

定制标准 -- 进程间通信是有标准的 -- system V && posix

e. 基于文件级别的通信方式 --管道

2. 匿名管道

2.1 引入

父子间通信仍然正常进行,并且效率还非常的高,而且还没有影响进程的独立性。而这种不进行IO(不刷到磁盘),就是内存级文件

这种由文件系统提供公共资源的进程间通信,就叫做管道

2.2 原理

匿名管道:没有名字的文件(struct file)。

匿名管道用于父子间通信,或者由一个父创建的兄弟进程(必须有“血缘“)之间进行通信

现在我们知道了匿名管道就是没有名字的文件,通过管道进行通信时,只需要通信双方打开同一个文件就可以。

我们通过系统调用open打开文件的时候,会指定打开方式,是读还是写。

当父进程以写方式打开一个文件的时候,创建的子进程会继承父进程的一切。此时子进程以写的方式打开的这个文件。

既然是通信,势必有一方在写,一方在读,而现在父子双方都是以写的方式打开,它们怎么进行通信呢?

父进程以读和写的方式打开同一份文件两次。可以理解为管道就是文件,有缓冲区,由父子进程引入管道文件

进程拷贝创建出子进程,PCB 是肯定要的,files_struct 指向同一文件

父子进程公用文件实现了,那么对于读写的控制是怎么实现的呢?

为了防止父进程对管道进行误读,以及子进程对管道进行误写,破坏通信规则。将父进程的读端关闭,将子进程的写端关闭,使用系统调用close(fd)。

只想让父子进程进行单向通信!所以称为管道通信。把文件这套拿过来,用就是为了简单

我们想让子进程进行写入,父进程进行读取

细节图

如果我要进行双向通信呢?多个管道

如果文件没有任何关系,可以用我们刚刚讲的原理进行通信呢?

不能,必须是父子关系/兄弟关系/爷孙关系...进程之间需要有血缘关系,常用于父子,才能继承一套 file_struct。制作如下动图

sum: 至此,通信了吗??没有。建立通信信道--为什么这么费劲?--因为进程具有独立性,要操作系统忙活才能建立出信道,通信是有成本的!

3. 建立管道的系统调用pipe

3.1 介绍

上面都是理论上的,具体到代码中是如何建立管道的呢?既然是操作系统中的文件系统提供的公共资源,当然是用系统调用来建立管道了。

<code>man 2 pipe

形参

<code>int pipefd[2] 是一个输出型参数,表示一个数组,该数组有两个元素,下标分别为0和1。

下标为0的元素表示管道读端的文件描述符 fd。(0像张嘴读书)下标为1的元素表示管道写端的文件描述符 fd。(1像拿笔写字)

通过系统调用 pipe,可以直接获得这两个文件描述符,并将其添加到父进程的文件描述符表中,无需两次打开内存级别的文件。

返回值

返回值为 int 类型的整数,用来反馈管道创建的情况。

返回0表示管道创建成功。返回-1表示管道创建失败,并且会将错误码自动写入 errno 中。

那么,父进程创建管道后,得到的两个文件描述符是多少呢?是3和4吗?我们可以通过代码来验证这一点。

输出型参数:文件的描述符数字带出来,让用户使用-->3,4,因为0,1,2分别被stdin,stdout,stderr占用。

3.2 代码

下面代码示例展示了如何通过管道(pipe)在父子进程之间进行通信。为了更好地理解代码,我们将其拆分开来并逐段解释每部分的含义。

<code>#include <unistd.h> // 包含pipe, fork, waitpid, write, read等函数的头文件

#include <sys/types.h> // 包含pid_t类型的头文件

#include <string> // 包含std::string类的头文件

#include <iostream> // 包含std::cout, std::endl等输入输出流的头文件

#include <cstdlib> // 包含exit函数和一些其他通用函数的头文件

这些头文件提供了程序中使用的函数和类型的声明。

const int NUM = 100; // 定义缓冲区大小

const int N = 2; // 定义管道数组的大小

这两行代码定义了一些常量,NUM 是缓冲区的大小,N 是管道数组的大小。

void Writer(int wfd) {

std::string s = "hello, I am child";

pid_t self = getpid();

int number = 0;

char buffer[NUM]; // 定义一个缓冲区

while (true) {

sleep(1);

// 构建发送字符串

snprintf(buffer, sizeof(buffer), "%s-%d-%d", s.c_str(), self, number++);

// 发送/写入给父进程, system call

write(wfd, buffer, strlen(buffer) + 1); // 注意这里需要加1来包括'\0'

std::cout << number << std::endl;

if (number >= 5) break;

}

}

这个函数Writer用于子进程向父进程写入数据。wfd是写端文件描述符,s是发送的字符串,self是子进程ID,number是一个计数器。每次循环中,构建一个包含字符串、子进程ID和计数器的消息,然后写入管道。每写一次,计数器加一,循环5次后退出。

void Reader(int rfd) {

char buffer[NUM];

while (true) {

buffer[0] = 0;

ssize_t n = read(rfd, buffer, sizeof(buffer));

if (n > 0) {

buffer[n] = 0; // 终止字符串

std::cout << "father get a message[" << getpid() << "]# " << buffer << std::endl;

} else if (n == 0) {

std::cout << "father read file done!" << std::endl;

break;

} else {

std::perror("Error reading from pipe"); // 打印错误信息

break;

}

}

}

这个函数Reader用于父进程从管道读取数据。rfd是读端文件描述符。每次循环中,尝试从管道读取数据,如果成功读取到数据,将其打印出来。如果读取到文件结尾或发生错误,则退出循环。

主函数中:

创建一个管道,pipefd数组包含两个文件描述符,一个用于读,一个用于写。调用fork()创建子进程。如果fork()失败,打印错误信息并退出。如果是子进程,关闭读端,调用Writer函数写数据,写完后关闭写端并退出。如果是父进程,关闭写端,调用Reader函数读数据,等待子进程结束,关闭读端。最后,打印程序结束的信息并返回。

int main() {

int pipefd[N] = {0}; // 管道文件描述符

int n = pipe(pipefd);

if (n < 0) {

std::perror("Error creating pipe");

return 1;

}

pid_t id = fork(); // 创建子进程

if (id < 0) {

std::perror("Error forking");

return 2;

}

if (id == 0) { // 子进程

close(pipefd[0]); // 关闭读端

Writer(pipefd[1]); // 写入数据

close(pipefd[1]); // 关闭写端

exit(0);

} else { // 父进程

close(pipefd[1]); // 关闭写端

Reader(pipefd[0]); // 读取数据

pid_t rid = waitpid(id, nullptr, 0);//回收子进程

if (rid < 0) {

std::perror("Error waiting for child process");

return 3;

}

close(pipefd[0]); // 关闭读端

}

std::cout << "Program finished." << std::endl;

return 0;

}

回忆点:

return 2 的设置 : 如果 fork() 失败,程序将返回 2。这里的数字 2 是一个约定的返回值,用于表示 fork() 调用失败。通常情况下,不同的错误情况会使用不同的返回值来区分。子进程关闭管道的写端 (pipefd[1]) 并随后调用 exit(0) 是为了:确保子进程只执行写操作,一旦写操作完成,子进程就退出pid_t rid = waitpid(id, nullptr, 0) :使用 waitpid 函数来等待子进程的结束,结束后父进程一定要实现资源回收

waitpid 是一个系统调用,用于等待指定子进程的终止状态。参数 id 是子进程的 PID(进程标识符)。参数 nullptr 表示不关心子进程的状态信息。参数 0 表示默认的行为,即等待任何子进程的终止。

运行:

批注:

<code>buffer[0] = 0; - 清空字符串,标志数组 buffer 作为字符串使用。buffer[n] = 0; --终止字符串,进行打印snprintf(buffer, sizeof(buffer), "%s-%d-%d", s.c_str(), self, number++); - 使用安全的格式化函数,防止缓冲区溢出。

<code>snprintf 参数设计简洁说明:

buffer:目标字符数组,用于存储格式化后的字符串。sizeof(buffer):指定缓冲区大小,防止溢出。"%s-%d-%d":定义字符串格式,包含字符串、两个整数和一个分隔符。s.c_str():提供要插入的字符串。self:插入的第一个整数。number++:使用并递增的第二个整数。

完整代码:

#include <unistd.h>

#include <sys/types.h>

#include <sys/wait.h>

#include <string>

#include <iostream>

#include <cstdlib>

#include <cstdio> // 包含snprintf和perror的头文件

const int NUM = 100; // 缓冲区大小

const int N = 2; // 管道数组的大小

using namespace std;

void Write(int wfd) {

string s = "hello, I am child";

int number = 0;

char buffer[NUM]; // 定义一个缓冲区

while (true) {

sleep(1);

snprintf(buffer, sizeof(buffer), "%s-%d-%d", s.c_str(), getpid(), number++);

// 构建字符串

write(wfd, buffer, sizeof(buffer)); // 实现传参写入

cout << number << endl; // 打印计数

if (number >= 5) break;

}

}

void Reader(int rfd) {

char buffer[NUM];

while (true) {

buffer[0] = 0;

ssize_t n = read(rfd, buffer, sizeof(buffer)); // 读取缓冲区

if (n > 0) {

buffer[n] = 0; // 终止字符串,打印

cout << "father get a message[" << getpid() << "]# " << buffer << endl;

} else if (n == 0) {

cout << "father read file done!" << endl;

break;

} else {

perror("Error reading from pipe"); // 打印错误信息

break;

}

}

}

int main() {

int pipefd[N] = {0}; // 管道数组描述符

int n = pipe(pipefd);

if (n < 0) {

perror("Error pipe");

return 1;

}

pid_t id = fork(); // 创建子进程

if (id < 0) {

perror("Error forking");

return 2; // 回忆点1

}

if (id == 0) {

// 子进程

close(pipefd[0]);

Write(pipefd[1]); // 传入写端

close(pipefd[1]);

exit(0); // 回忆点2

} else {

// 父进程

close(pipefd[1]);

Reader(pipefd[0]);

// 回忆点3

// 等待回收

pid_t rid = waitpid(id, NULL, 0);

if (rid < 0) {

perror("Error waiting for child process");

return 3;

}

close(pipefd[0]); // 关闭读端

}

cout << "Program finished." << endl;

return 0;

}

3.3 站在内核的角度

必须要调用 write read,系统调用,防止群众当中有坏人,操作系统起到了一个媒介的作用

note:

混编C/C++需掌握字符串处理转换;管道通信需制定字节流数据协议。

编码实现

管道的 5 大特征

1. 具有血缘关系进程,进行进程间通信

2. 管道只能单向通信

为什么子进程休眠,父进程也会休眠?是的看到同一份资源实现了,多执行流共享,难免出现访问冲突的问题,存在临界资源竞争的问题

3. 管道是基于文件的,而文件的生命周期是随进程的例如:不需要我们去关 0 1 2

下面特性之后会详细解释:

4. 父子进程是会进程协同的,同步与互斥的---保护管道文件的数据安全

那父进程休眠,子进程呢?

不读的时候,一瞬间就把管道写满了,可以发现:管道是有固定大小的

5. 管道是面向字节流

可能写端写了十次一百次,读端都不管,看着就是一个一个字节的,上面提到管道有固定大小,那么是多少?

验证管道的固定大小: 使用 <code>ulimit -a 命令可以查看当前用户进程的资源限制,其中包括管道的大小。管道大小在输出中通常标记为 pipe size

ulimit -a | grep "pipe size"

解释管道大小: 管道的默认大小在不同内核版本中可能有所不同。在许多 Linux 系统上,默认的管道大小是 64 KB。

查看 Linux 发行版和版本: 使用 cat /etc/redhat-release 命令可以查看 Red Hat 或 CentOS 系统的发行版和版本信息。

cat /etc/redhat-release

测试管道大小: 要测试管道大小是否为 64 KB,可以使用 dd 命令尝试写入一个大于 64 KB 的文件到管道,并观察是否能够成功写入。

dd if=/dev/zero of=/dev/null bs=65536 count=1 2>&1 | grep records

如果管道大小确实是 64 KB,那么上面的命令应该能成功写入 64 KB 数据。

查找 pipe_buf 大小pipe_buf 的大小定义在内核头文件中,可以通过查看内核源码或使用 grep 命令在内核头文件中搜索。制

grep -R "define PIPE_BUF" /usr/include/linux

或者,如果你有内核源码树,可以在源码中搜索:

grep -R "define PIPE_BUF" /path/to/linux-source-code/include/linux

进行原子性读取测试: 为了确保在不间断的情况下完整读取 “hello world” 字符串,并保证原子性,可以创建一个管道,并在一个进程中写入字符串,在另一个进程中读取。

管道的四种情况

读写段正常,管道如果为空,读端就要阻塞读写端正常,管道如果被写满,写端就要阻塞读端正常读,写端关闭,读端就会读到 0,表面读到了文件(pipe)结尾,不会被阻塞

eg. 父进程等待子进程(Z)退出,测试 n=0;

      4. 写端是正常写入,读端关闭了的情况呢?敬请期待下篇分解~

一些小思考:

1. 一个进程中可以开两个 pipe:

一个进程可以创建多个管道,每个管道都有独立的读写端。

2. read 读到文件尾,write 一写就会更新到文件头:

管道是循环缓冲区,写入数据会覆盖最早的数据,read 指针会自动跳到新的数据开始处

3. 覆盖写,但为什么不会读取垃圾信息?read 指针也在移动:

管道确保了写入和读取的原子性,每次读取都是连续的数据块,不会读取到被覆盖的旧数据。

拓展:

管道(pipe)是一种在进程间进行单向通信的机制。

为什么管道文件无法实现“写了就马上读到”:

缓冲区限制:管道有一个固定大小的缓冲区。当这个缓冲区满了之后,进一步的写操作将会被阻塞,直到有空间可用。这意味着,如果写入的数据超过了缓冲区的大小,那么这些数据不会立即被读取,因为它们还在等待空间变得可用。读写顺序:管道是按照顺序操作的。写入端(writer)必须先写入数据,然后读取端(reader)才能从管道中读取这些数据。如果读取端没有进行读取操作,写入端的数据可能会留在缓冲区中。原子性:管道的读写操作具有原子性。这意味着每次读取操作要么读取一个完整的数据块,要么读取0个字节(如果缓冲区为空)。这防止了读取到不完整或“垃圾”数据。阻塞与非阻塞:默认情况下,读取端如果尝试从一个空的管道中读取数据,将会被阻塞,直到有数据可读。进程调度:操作系统的进程调度可能影响管道的读写操作。即使缓冲区中有数据,如果读取进程没有获得CPU时间,那么读取操作也不会发生。

总结来说,管道不是立即写入即读取的同步机制,而是一个提供了有序、缓冲的通信方式,其设计考虑了数据的完整性和进程间的同步。如果需要立即写入后读取,可能需要考虑其他通信机制,如消息队列或信号量。



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。