高速下载GEO数据库的单细胞表达量矩阵文件
发布网友
发布时间:2024-10-19 18:47
我来回答
共1个回答
热心网友
时间:2024-12-01 23:44
通常情况下,GEO数据库中的文件无需高速下载,因为其存储的信息,如表达量矩阵等,文件体积相对较小,即便网络速度较慢,通过浏览器下载也能顺利完成。
然而,若需下载大量文件,如成百上千个,建议使用代码进行批量下载。随着单细胞技术的普及,表达量矩阵文件体积也变得相当大,例如:ncbi.nlm.nih.gov/geo/qu... ,可看到文件大小达到9.3 Gb:
若以常规速度下载,可能需要两三天时间:
借助aspera的高速下载:
首先自行参考:使用ebi数据库直接下载fastq测序数据,配置好aspera软件,然后仔细阅读GEO数据库的官方文档。
构建的命令如下所示:
下载速度非常感人:
全部的Linux命令:
首先是安装自己的conda,在自己的服务器中自行下载并安装,自己进行配置:
首先,如果在中国大陆,需要设置好镜像:
然后,可以使用自己的conda来安装aspera软件。本来是让大家自行参考:使用ebi数据库直接下载fastq测序数据,配置好aspera软件。
上面的代码是基于Linux操作系统的,如果大家一定要在自己的Windows或Mac电脑上处理,只需简单替换关键参数即可。