本文介绍在使用ossfs时遇到的一些问题案例及解决方案。
通用说明
ossfs报错信息中均包含message。排查问题时,需要收集这些message,并根据message判断问题。例如socket建连失败、HTTP响应的状态码4xx、5xx等,使用前先开启debug-log。
-
403错误是因权限不足,导致访问被拒绝。
-
400错误是用户的操作方法有误。
-
5xx错误一般和网络抖动以及客户端业务有关系。
ossfs有以下特点:
-
ossfs是将远端的OSS挂载到本地磁盘,如果对文件读写性能敏感的业务,不建议使用ossfs 。
-
ossfs的操作不是原子性,存在本地操作成功,但OSS远端操作失败的风险。
如果ossfs不满足您的业务需求时,建议使用ossutil。
使用yum/apt-get安装ossfs时报错”conflicts with file from package fuse-devel”
问题分析:系统中存在老版本的fuse,与ossfs里的依赖版本冲突。
解决方案:请先使用相关的包管理器卸载fuse,再重新安装ossfs。
安装ossfs时报错”fuse: warning: library too old, some operations may not work”
问题分析:出现错误的原因是ossfs编译时所使用的libfuse版本比运行时链接到的libfuse版本高,这往往是用户自行安装了libfuse导致的。CentOS-5.x和CentOS-6.x系统中,阿里云提供的ossfs安装包里包含了libfuse-2.8.4,如果在运行的时候环境中有libfuse-2.8.3,并且ossfs被链接到了旧版本的fuse上,就会出现上述错误。
您可以通过ldd $(which ossfs) | grep fuse命令确认ossfs运行时链接的fuse版本,如结果是/lib64/libfuse.so.2,那么通过ls -l /lib64/libfuse*命令可以看到fuse的版本。
解决方案:让ossfs链接到正确的版本。
-
通过rpm -ql ossfs | grep fuse命令找到libfuse的目录。
-
如果结果是/usr/lib/libfuse.so.2,则通过LD_LIBRARY_PATH=/usr/lib ossfs …命令运行ossfs。
安装依赖库fuse报错
问题分析:fuse的版本不满足ossfs的要求。
解决方案:手动下载fuse最新版本安装,不要使用yum安装。详情请参见fuse。
挂载报错”ossfs: unable to access MOUNTPOINT /tmp/ossfs: Transport endpoint is not connected”
问题分析:未创建该目录导致的。
解决方案:先创建对应的目录,之后再进行挂载操作。
挂载报错”fusermount: failed to open current directory: Permission denied”
问题分析:fuse的Bug,要求当前用户对当前目录(非挂载目录)有读权限。
解决方案:通过cd命令切换到一个有读权限的目录,再运行ossfs命令。
挂载报错”ossfs: Mountpoint directory /tmp/ossfs is not empty. if you are sure this is safe, can use the ‘nonempty’ mount option”
问题分析:默认情况下,ossfs只能挂载到空目录下。当试图挂载到非空目录下时,会提示上述错误。
解决方案:切换到一个空目录下重新挂载。如果还是需要挂载到该目录下,挂载时增加 -ononempty 参数。
挂载报错”ops-nginx-12-32 s3fs[163588]: [tid-75593]curl.cpp:CurlProgress(532): timeout now: 1656407871, curl_times[curl]: 1656407810, readwrite_timeout: 60″
问题分析:ossfs挂载超时。
解决方案:ossfs通过readwrite_timeout选项指定读或者写请求的超时时间,单位为秒,默认值为60秒。您需要结合实际业务场景,适当增加该选项的取值。
挂载报错”ossfs: credentials file /etc/passwd-ossfs should not have others permissions”
问题分析:/etc/passwd-ossfs文件权限不正确。
解决方案:/etc/passwd-ossfs保留了访问凭证信息,需要限制others访问该文件。您可以通过chmod 640 /etc/passwd-ossfs
命令修改文件的访问权限。
挂载成功后,ls目录时报错”operation not permitted”
问题分析:请检查您的Bucket中,是否存在名称含有不可见字符的Object。文件系统对文件名和目录名有严格的限制,因此会收到上述错误。
解决方案:用其他工具对这些Object重命名后,ls就能正确显示目录内容了。
通过rm命令删除文件时报错”Operation not permitted”
问题分析:通过rm命令删除文件时,会调用DeleteObject API进行删除。如果您是通过RAM用户挂载,请检查挂载的RAM用户是否具备删除文件的权限。
解决方案:为该RAM用户设置正确的权限。更多信息,请参见RAM Policy概述和RAM Policy常见示例。
ossfs偶尔出现断开的情况
问题分析:
-
开启ossfs的debug日志,加上-d -o f2参数,ossfs会把日志写入到系统
/var/log/message
。 -
分析日志,发现ossfs在listbucket、listobject申请内存过多,触发了系统的oom。
说明
listobject是发起HTTP请求到OSS获取文件的meta信息,如果客户的文件很多,ls会消耗系统大量内存来获取文件的meta。
解决方案:
-
通过-omax_stat_cache_size=xxx参数增大stat cache 的 size,这样第一次ls会较慢,但是后续的ls速度会提高,因为文件的元数据都在本地cache中。这个值默认是1000,约消耗4 MB内存,请根据您机器内存大小调整为合适的值。
-
ossfs在读写时会占用磁盘写大量的temp cache ,和Nginx差不多,可能会导致磁盘可用空间不足。当ossfs退出后,会自动清理临时文件。
-
使用ossutil替代ossfs,非线上敏感业务可以使用ossfs ,要求可靠性、稳定性的建议使用ossutil。
访问报错”The bucket you are attempting to access must be addressed using the specified endpoint”
问题分析:根据Message判断,错误原因是Endpoint指定错误,有以下两种可能性:
-
Bucket和Endpoint不匹配。
-
Bucket所属UID和实际的AccessKey对应的UID不一致。
解决方案:确认正确的配置信息并修改。
通过cp命令拷贝数据时报错”input/output error”
问题分析:input/output error都是捕获到系统磁盘的错误而产生的报错,可以查看出现报错时,磁盘读写是否存在高负载的情况。
解决方案:可以增加分片参数,控制文件读写。使用ossfs -h命令可以查看分片参数。
使用rsync同步时报错”input/output error”
问题分析:ossfs与rsync同步使用本身会出现问题。此案例中,用户对一个141 GB的大文件进行cp操作,使磁盘读写处于非常高的负载状态,从而产生此报错。
解决方案:如果想要将OSS文件下载到本地ECS ,或者本地上传到ECS ,可以通过ossutil的分片上传、下载进行操作。
上传大文件时报错”there is no enough disk space for used as cache(or temporary)”
-
问题原因
磁盘空间小于
multipart_size * parallel_count
。multipart_size表示分片大小(默认单位为MB),parallel_count表示并发上传分片数量(默认值为5)。
-
问题分析
ossfs默认通过分片上传的方式上传大文件。上传时,ossfs会将临时缓存文件写入/tmp目录下,写入前需要先判断/tmp目录所在的磁盘可用空间是否小于
multipart_size * parallel_count
。如果磁盘可用空间大于multipart_size * parallel_count
,则正常写入文件。如果磁盘可用空间小于multipart_size * parallel_count
,则出现本地磁盘可用空间不足的报错。例如,磁盘可用空间为300 GB,待上传的文件为200 GB,但multipart_size设置为100000(100 GB),并发上传分片数量保持默认值5。此时,ossfs判断上传的文件大小为100 GB*5=500 GB,超出本地磁盘可用空间。
-
解决方法
在并发上传分片数量保持默认值5的情况下,设置合理的multipart_size:
-
如果磁盘可用空间为300 GB,待上传的文件为200 GB,则multipart_size设置为20。
-
如果磁盘可用空间为300 GB,待上传的文件为500 GB,则multipart_size设置为50。
-
挂载成功后,touch文件时报错403
问题分析:403错误通常是访问权限问题导致的。以下情况会导致touch一个文件出现403报错。
-
该文件为归档类型文件,touch时会出现403报错。
-
使用的AccessKey无该存储空间的操作权限。
解决方案:
-
归档类型文件问题:将文件解冻后访问或为文件所在Bucket开启归档直读。
-
权限问题:为使用的AccessKey对应的账号配置正确的权限。
使用ossfs上传到OSS的文件的Content-Type全是application/octet-stream
问题分析:上传文件时,ossfs通过查询/etc/mime.types中的内容来设置文件的Content-Type。当该文件不存在时,默认设置为application/octet-stream。
解决方案:请检查这个文件是否存在,如果不存在,则需要添加。
-
通过命令自动添加mime.types文件
-
Ubuntu系统
使用sudo apt-get install mime-support命令添加。
-
CentOS系统
使用sudo yum install mailcap命令添加。
-
-
手动添加mime.types文件
-
创建mime.types文件
vi /etc/mime.types
-
添加需要的格式,每种格式一行,每行格式为
application/javascript js
。
-
添加完成后,需要重新挂载OSS。
目录下有非常多的文件时,为什么ls该目录很慢
问题分析:假设一个目录下有N个文件,那么ls该目录至少需要N次OSS HTTP requests。在文件非常多的时候,这可能造成严重的性能问题。
解决方案: 通过-omax_stat_cache_size=xxx
参数增大stat cache的size,这样第一次ls会较慢,但是后续的ls就快了,因为文件的元数据都在本地cache中。这个值默认是1000,大约消耗4 MB内存,请根据您机器内存大小调整为合适的值。
为什么用ossfs看到的文件信息(例如大小)与其他工具看到的不一致
问题分析:ossfs默认会缓存文件的元信息(包括大小/权限等),这样就不需要每次ls的时候向OSS发送请求,加快速度。 如果用户通过其他程序(例如SDK/官网控制台/ossutil等)对文件进行了修改,由于缓存的关系,ossfs没有及时更新,导致与其他工具看到的文件信息不一致。
解决方案:可以在挂载的时候加上参数-omax_stat_cache_size=0,禁用元数据缓存功能。每次ls时,都会向OSS 发送请求,获取最新的文件信息。
在ECS上挂载OSS,如何避免因后台程序扫描文件而产生费用
问题分析:程序扫描ossfs挂载的目录,会转换成向OSS的请求。如果请求次数很多,会产生费用。
解决方案:可以通过auditd工具查看是哪些进程扫描了OSS挂载的目录。具体步骤如下:
-
安装auditd并启动。
sudo apt-get install auditd sudo service auditd start
-
将OSS挂载的目录设置为监视目录,例如挂载目录为/mnt/ossfs。
auditctl -w /mnt/ossfs
-
在auditlog中查看是哪些进程访问了这个目录。
ausearch -i | grep /mnt/ossfs
-
修改参数,跳过程序扫描。
例如通过auditlog查到是 updatedb 扫描了所挂载的目录,可以通过修改/etc/updatedb.conf让它跳过。具体做法是:
-
在
RUNEFS =
后面加上fuse.ossfs
。 -
在
PRUNEPATHS =
后面加上挂载的目录。
-
ossfs执行mv操作失败
问题原因:通过ossfs执行mv操作失败的可能原因是源文件为归档存储、冷归档存储或者深度冷归档存储类型文件。
解决方法:对归档存储、冷归档存储或者深度冷归档存储类型的文件执行mv操作前,您需要先解冻文件。具体步骤,请参见解冻文件。
为什么Bucket开启版本控制后出现挂载慢的问题?
问题原因:ossfs默认通过调用ListObjects(GetBucket)列举文件。在Bucket开启版本控制,且Bucket中存在一个或者多个历史版本Object以及大量的过期删除标记的情况下,使用ListObjects(GetBucket)接口列举当前版本Object时会出现响应速度下降,从而影响ossfs挂载操作。
解决方法:使用-olistobjectsV2选项将ossfs切换至ListObjectsV2(GetBucketV2)接口,提升列举文件的性能。
如何设置通过HTTPS方式挂载?
ossfs支持通过HTTPS方式挂载,以华东1(杭州)地域为例,挂载命令如下:
ossfs examplebucket /tmp/ossfs -o url=https://oss-cn-hangzhou.aliyuncs.com
ossfs为什么会把磁盘空间写满?
问题原因:为提升性能,默认情况下ossfs会尽可能使用磁盘空间来保存上传或下载的临时数据,此时会存在磁盘空间写满的情况。
解决方法:您可以通过-oensure_diskfree选项指定保留磁盘空间大小。例如,指定保留20 GB的磁盘空间大小,命令如下:
ossfs examplebucket /tmp/ossfs -o url=http://oss-cn-hangzhou.aliyuncs.com -oensure_diskfree=20480
ossfs挂载后,为什么通过df命令显示磁盘空间大小为256 TB?
通过df命令显示的磁盘空间大小仅作为展示值,并不代表OSS存储空间实际容量。其中,Size(磁盘空间总大小)和Avail(磁盘空间剩余可用大小)固定为256 TB,Used(已使用磁盘空间大小)固定为0 TB。
OSS存储空间容量无限制,存储空间使用量取决于您的实际使用量。关于存储空间用量查询的更多信息,请参见查询Bucket级别的用量情况。
ossfs是否支持在Windows环境中挂载存储空间?
不支持。您可以在Windows环境下,通过以下两种方式挂载OSS存储空间。
-
通过云存储网关挂载存储空间。具体步骤,请参见通过云存储网关挂载OSS。
-
通过Rclone挂载存储空间。具体步骤,请参见Rclone。
卸载时报错”fusermount: failed to unmount /mnt/ossfs-bucket: Device or resource busy”
问题分析:有进程正在访问挂载目录/mnt/ossfs-bucket下的文件 ,所以无法卸载。
解决方案:
-
使用
lsof /mnt/ossfs-bucket
找出访问该目录的进程。 -
使用kill命令强制关闭进程。
-
使用
fusermount -u /mnt/ossfs-bucket
卸载Bucket。
内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家
阿里云企业补贴进行中: 马上申请
腾讯云限时活动1折起,即将结束: 马上收藏
同尘科技为腾讯云授权服务中心。
购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠
转转请注明出处:https://www.yunxiaoer.com/157155.html