深入理解 PHP 高性能框架 Workerman 守护进程原理

cnblogs 2024-08-12 10:09:00 阅读 75

深入理解 PHP 高性能框架 Workerman 守护进程原理

守护进程顾名思义就是能够在后台一直运行的进程,不会霸占用户的会话终端,脱离了终端的控制。相信朋友们对这东西都不陌生了吧?如果连这个概念都还不能理解的话,建议回炉重造多看看 Linux 进程管理相关的基础知识。

大家好,我是码农先森。

守护进程顾名思义就是能够在后台一直运行的进程,不会霸占用户的会话终端,脱离了终端的控制。相信朋友们对这东西都不陌生了吧?如果连这个概念都还不能理解的话,建议回炉重造多看看 Linux 进程管理相关的基础知识。在我们日常的编程中常见有类似 <code>php think ...、php artisan ...php yii ... 等命令启动需要一直执行的任务,都会通过 nohup 挂载到后台保持长期运行的状态。同样在 Workerman 中也是使用类似 php index.php start 的命令来启动进程,但不同的是它不需要利用 nohup 便可以挂载到后台运行。那有些朋友就会好奇它是怎么实现的呢?为了解决朋友们的疑惑,我们今天就重点深入分析一下 Workerman 守护进程的实现原理。

我们先了解一些进程相关的知识:

  • 父进程:父进程是生成其他进程的进程。当一个进程创建了另一个进程时,创建者被称为父进程,而被创建的进程则成为子进程。父进程可以通过进程标识符(PID)来识别它所创建的子进程。
  • 子进程:子进程是由父进程创建的新进程。子进程继承了父进程的一些属性,例如环境变量、文件描述符等。子进程独立于父进程运行,它可以执行自己的代码,并且具有自己的资源和内存空间。
  • 进程组:进程组是一组相关联的进程的集合。每个进程组都有一个唯一的进程组ID(PGID),用于标识该进程组。进程组通常由一个父进程创建,并且包含了与父进程具有相同会话ID(SID)的所有子进程。
  • 会话:会话是一组关联进程的集合,通常由用户登录到系统开始,直至用户注销或关闭终端会话结束,一个会话中的进程共享相同的控制终端。每个会话都有一个唯一的会话ID(SID),用于标识该会话。会话通常包含一个或多个进程组,其中第一个进程组成为会话的主进程组。

这些概念俗称八股文,向来都不怎么好理解,那我们来看个例子。执行了命令 php index.php 便产生了进程 61052「该进程的父进程是 Bash 进程 8243,这里不用管它」,然后通过 Fork 创建了子进程 61053 且其父进程就是 61052,这两个进程拥有共同的进程组 61052 和会话 8243。调用 posix_setsid 函数,将会为子进程 61053 开启新的进程组 61053 和新的会话 61053,这里的会话可以理解为一个新的命令窗口终端。最后子进程 61053 通过 Fork 创建了子进程 61054,进程 61053 升级成了父进程,这里再次 Fork 的原因是要避免被终端控制进程所关联,这个进程 61052 是在终端的模式下创建的,自此进程 61054 就形成了守护进程。

[manongsen@root phpwork]$ php index.php

[parent] 进程ID: 61052, 父进程ID: 8243, 进程组ID: 61052, 会话ID: 8243

[parent1] 进程ID: 61052, 父进程ID: 8243, 进程组ID: 61052, 会话ID: 8243 退出了该进程

[child1] 进程ID: 61053, 父进程ID: 61052, 进程组ID: 61052, 会话ID: 8243

[child1] 进程ID: 61053, 父进程ID: 61052, 进程组ID: 61053, 会话ID: 61053

[parent2] 进程ID: 61053, 父进程ID: 61052, 进程组ID: 61053, 会话ID: 61053 退出了该进程

[child2] 进程ID: 61054, 父进程ID: 61053, 进程组ID: 61053, 会话ID: 61053 保留了该进程

[manongsen@root phpwork]$ ps aux | grep index.php

root 66064 0.0 0.0 408105040 1472 s080 S+ 10:00下午 0:00.00 grep index.php

root 61054 0.0 0.0 438073488 280 ?? S 10:00下午 0:00.00 php index.php

上面举例的进程信息,正是这段代码运行所产生的。如果看了这段代码且细心的朋友,会发现为什么 posix_setsid 这个函数不放在第一次 Fork 前调用,而在第二次 Fork 前调用呢,这样的话就不用 Fork 两次了?原因是组长进程是不能创建会话的,进程组ID 61052 和进程ID 61052 相同「即当前进程则为组长进程」,所以需要子进程来创建新的会话,这一点需要特别注意一下。

<?php

function echoMsg($prefix, $suffix="") {code>

// 进程ID

$pid = getmypid();

// 进程组ID

$pgid = posix_getpgid($pid);

// 会话ID

$sid = posix_getsid($pid);

// 父进程ID

$ppid = posix_getppid();

echo "[{$prefix}] 进程ID: {$pid}, 父进程ID: {$ppid}, 进程组ID: {$pgid}, 会话ID: {$sid} {$suffix}" . PHP_EOL;

}

// [parent] 进程ID: 61052, 父进程ID: 8243, 进程组ID: 61052, 会话ID: 8243

echoMsg("parent");

// 第一次 Fork 进程

$pid = pcntl_fork();

if ( $pid < 0 ) {

exit('fork error');

} else if( $pid > 0 ) {

// [parent1] 进程ID: 61052, 父进程ID: 8243, 进程组ID: 61052, 会话ID: 8243 退出了该进程

echoMsg("parent1", "退出了该进程");

exit;

}

// 创建的 子进程ID 为 61053 但 进程组、会话 还是和父进程是同一个

// [child1] 进程ID: 61053, 父进程ID: 61052, 进程组ID: 61052, 会话ID: 8243

echoMsg("child1");

// 调用 posix_setsid 函数,会创建一个新的会话和进程组,并设置 进程组ID 和 会话ID 为该 进程ID

if (-1 === \posix_setsid()) {

throw new Exception("Setsid fail");

}

// 现在会发现 进程组ID 和 会话ID 都变成了 61053 在这里相当于启动了一个类似 Linux 终端下的会话窗口

// [child1] 进程ID: 61053, 父进程ID: 61052, 进程组ID: 61053, 会话ID: 61053

echoMsg("child1");

// 第二次 Fork 进程

// 这里需要二次 Fork 进程的原因是避免被终端控制进程所关联,这个进程 61052 是在终端的模式下创建的

// 需要脱离这个进程 61052 以确保守护进程的稳定

$pid = pcntl_fork();

if ( $pid < 0 ){

exit('fork error');

} else if( $pid > 0 ) {

// [parent2] 进程ID: 61053, 父进程ID: 61052, 进程组ID: 61053, 会话ID: 61053 退出了该进程

echoMsg("parent2", "退出了该进程");

exit;

}

// 到这里该进程已经脱离了终端进程的控制,形成了守护进程

// [child2] 进程ID: 61054, 父进程ID: 61053, 进程组ID: 61053, 会话ID: 61053 保留了该进程

echoMsg("child2", "保留了该进程");

sleep(100);

有时间的朋友最好自行执行代码并分析一遍,会有不一样的收获。这里假装你已经实践过了,这下我们来看 Workerman 的 Worker.php 文件中 554 行的 runAll 方法中的 static::daemonize() 这个函数,实现的流程逻辑和上面的例子几乎一样。不过这里还使用了 umask 这个函数,其主要的作用是为该进程所创建的文件或目录赋予相应的权限,保证有权限操作文件或目录。

// workerman/Worker.php:554

/**

* Run all worker instances.

* 运行进程

* @return void

*/

public static function runAll()

{

static::checkSapiEnv();

static::init();

static::parseCommand();

static::lock();

// 创建进程并形成守护进程

static::daemonize();

static::initWorkers();

static::installSignal();

static::saveMasterPid();

static::lock(\LOCK_UN);

static::displayUI();

static::forkWorkers();

static::resetStd();

static::monitorWorkers();

}

// workerman/Worker.php:1262

/**

* Run as daemon mode.

* 使用守护进程模式运行

* @throws Exception

*/

protected static function daemonize()

{

// 判断是否已经是守护状态、以及当前系统是否是 Linux 环境

if (!static::$daemonize || static::$_OS !== \OS_TYPE_LINUX) {

return;

}

// 设置 umask 为 0 则当前进程创建的文件权限都为 777 拥有最高权限

\umask(0);

// 第一次创建进程

$pid = \pcntl_fork();

if (-1 === $pid) {

// 创建进程失败

throw new Exception('Fork fail');

} elseif ($pid > 0) {

// 主进程退出

exit(0);

}

// 子进程继续执行...

// 调用 posix_setsid 函数,可以让进程脱离父进程,转变为守护进程

if (-1 === \posix_setsid()) {

throw new Exception("Setsid fail");

}

// 第二次创建进程,在基于 System V 的系统中,通过再次 Fork 父进程退出

// 保证形成的守护进程,不会成为会话首进程,不会拥有控制终端

$pid = \pcntl_fork();

if (-1 === $pid) {

// 创建进程失败

throw new Exception("Fork fail");

} elseif (0 !== $pid) {

// 主进程退出

exit(0);

}

// 子进程继续执行...

}

守护进程也是 Workerman 中重要的一部分,它保障了 Workerman 进程的稳定性。不像我们通过 nohup 启动的命令,挂起到后台之后,有时还神不知鬼不觉的就挂了,朋友们或许都有这样的经历吧。当然在市面上也有一些开源的守护进程管理软件,比如 supervisor 等,其次还有人利用会话终端 screen、tmux 等工具来实现。其实守护进程的实现方式有多种多样,我们这里只是为了分析 Workerman 中守护进程的实现原理,而引出了在 PHP 中实现守护进程模式的例子,希望本次的内容能对你有所帮助。

感谢大家阅读,个人观点仅供参考,欢迎在评论区发表不同观点。


欢迎关注、分享、点赞、收藏、在看,我是微信公众号「码农先森」作者。



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。