PHP文件上传处理逻辑大梳理(全面分析)

本文给大家介绍有关PHP文件上传的逻辑实现分析,想必这种实现在项目中都比较常见的,大家一起来看看吧~希望对需要的朋友有所帮助~文件名字处理文件名字得看业务要求。不需要保留原始名字,则随机生成名字,拼接上白名单校验过的后缀即可。反之要谨慎处理

本文给大家介绍有关PHP文件上传的逻辑实现分析,想必这种实现在项目中都比较常见的,大家一起来看看吧~希望对需要的朋友有所帮助~

PHP文件上传处理逻辑大梳理(全面分析)

文件名字处理

文件名字得看业务要求。不需要保留原始名字,则随机生成名字,拼接上白名单校验过的后缀即可。

反之要谨慎处理:

//允许上传的后缀白名单
$extension_white_list = ['jpg', 'pdf'];
//原始文件的名字
$origin_file_name = 'xx/xxx/10月CPI同比上涨2.1%.php.pdf';
//提取文件后缀,并校验是否在白名单内
$extension = strtolower(pathinfo($origin_file_name, PATHINFO_EXTENSION));
if (!in_array($extension, $extension_white_list)) {
    die('错误的文件类型');
}
//提取文件名
$new_file_name = pathinfo($origin_file_name, PATHINFO_BASENAME);
//截取掉后缀部分
$new_file_name = mb_substr($new_file_name, 0, mb_strlen($new_file_name) - 1 - mb_strlen($extension));
//只保留有限长度的名字
$new_file_name = mb_substr($new_file_name, 0, 20);
//替换掉所有的 . 避免攻击者构造多后缀的文件,缺点是文件名不能包含 .
$new_file_name = str_replace('.', '_', $new_file_name);
//把处理过的名字和后缀拼接起来构造成一个名字
$new_file_name = $new_file_name . '.' . $extension;
print_r($new_file_name); //10月CPI同比上涨2_1%_php.pdf


文件内容处理

文件后缀只是表面,一个 php 文件,把后缀改成 jpg,也改变不了它携带 php 代码的事实。

针对图片文件,可以读取图片文件头判断图片类型,当然我也没测试过这个方法,感兴趣的可以自测。

另外即便上述方法可行,依然可以绕过,只要在 php 文件的头部写入某个图片类型的头部特征的字节即可伪装。

针对图片文件内容处理,真正的大招是重绘图片。

windows 系统下用 copy 命令可以制作一个包含 php 代码的图片文件,命令如下:

Copy 1.jpg/b + test.php/a 2.jpg

上述命令的意思是,把 test.php 合并到 1.jpg 的尾部,并重新导出到 2.jpg 里面,如此一来,这个 2.jpg 就是一个包含 php 代码的图片文件,可以用记事本打开它,拖滚动条到底部看到 php 代码。

像这种不干净的图片,用重绘图片的方式可以剔除掉不干净的部分。下面是重绘图片的 php 代码:

try {
    $jpg = '包含php代码的.jpg';
    list($width, $height) = getimagesize($jpg);
    $im = imagecreatetruecolor($width, $height);
    $image = imagecreatefromjpeg($jpg);
    imagecopyresampled($im, $image, 0, 0, 0, 0, $width, $height, $width, $height);
    $target = '重绘后干净的图片.jpg';
    imagejpeg($image, $target);
} finally {
    isset($im) && is_resource($im) && imagedestroy($im);
    isset($image) && is_resource($image) && imagedestroy($image);
}

这个处理办法的缺点是,耗费内存,图片失真,而且只能处理图片。

当然其它的文件格式,我也不知道能不能用重绘的思路去处理。

文件权限处理

只讨论 Linux 下的权限,先简单介绍 Linux 的权限:

读取,字母 r 或数字 4 表示

写入,字母 w 或数字 2 表示

执行,字母 x 或数字 1 表示

对文件来讲,rwx 是如下含义:

r:可打开读取此文件

w:可写入此文件

x:可执行此文件

对目录来讲,rwx 的含义又有点差别:

r:可读取此目录的内容列表

w:可在此目录里面进行:增、删、改文件和子目录

x:可进入此目录

另外 Linux 里面,针对一个文件,用户是会被分成三种,分别是:创建该文件的用户、和创建该文件的用户处于同一用户组的用户、既不是创建者也不是同一个小组的其它用户。

有了对 Linux 的权限了解,针对上传的文件所在的目录,应该设定 755 权限,表示:

创建该目录的用户有读取、写入、进入此目录的权限

和创建该目录的用户处于同一用户组的用户有读取、进入此目录的权限

既不是创建者也不是同一个小组的其它用户有读取、进入此目录的权限

755 的权限设定,可以让 nginx 代理静态文件的时候不会报 403 错误。

代码示例:

mkdir($save_path, 0755, true);

针对上传的文件,采用更严格的权限设定,应该设定 644 权限,表示:

创建该文件的用户有读取、写入此文件的权限,无法执行

和创建该文件的用户处于同一用户组的用户只有读取权限

既不是创建者也不是同一个小组的其它用户只有读取权限

644 的权限设定,可以确保即便是上传了一个非法文件也无法串改内容、执行。

代码示例:

chmod($file, 0644);

文件服务器处理

掏钱买个 oss 存储服务吧,啥鸡毛都不考虑了,直接丢上去。

原文地址:https://learnku.com/articles/73100
作者博客:https://learnku.com/blog/buexplain

本站内容转自网络,若侵犯了你的权益,请联系我们,我们将在第一时间删除。

如若转载,请注明出处:http://www.ntuku.com/18588.html