# `fsspec` 简介

```{topic} 概要
有许多地方可以存储字节，从内存中、本地磁盘、集群分布式存储到云端。许多文件还包含名称到字节的内部映射，可能是以分层目录为导向的树状结构。处理所有这些不同的存储介质及其相关的库是一件麻烦事。{mod}`fsspec` 的存在是为了提供一个熟悉的 API，无论后端存储是什么，都能以相同的方式工作。我们尽可能地消除每个实现特有的怪癖，这样你只需要为你访问的每个服务提供凭证（如果需要），之后就不用再担心实现的问题了。
```

```{topic} 设计目标
{mod}`fsspec` 提供了两个主要概念：一组具有统一 API 的文件系统类（即，提供一系列存储系统操作的函数，如 `cp`、`rm`、`cat`、`mkdir` 等）；以及顶级便利函数，如 {func}`fsspec.open`，允许你快速从 URL 获取一个类似文件的对象，你可以将其与第三方库或自己的代码一起使用。
```

```{topic} 背景
Python 提供了标准接口用于打开文件，这样替代的文件类对象实现可以与许多仅依赖于该标准接口方法的函数无缝协作。许多库为文件系统实现了类似的概念，其中可以在逻辑文件系统上执行文件操作，这些文件系统可能是本地的、结构化数据存储或某些远程服务。

{mod}`fsspec` 旨在定义一个标准接口，这样的文件系统应该遵循该接口，以便使用它们的代码不必了解后端实现的细节就可以操作任何数量的后端。希望社区能够聚集在一起，定义一个对最多用户来说最佳的接口，并且有了这个规范，使得开发其他文件系统实现变得更简单。
```


## 安装

`fsspec` 可以从 PyPI 或 conda 安装，并且没有自己的依赖项。

```bash
pip install fsspec
conda install -c conda-forge fsspec
```

并非所有文件系统实现都可以在不安装额外依赖项的情况下使用。例如，要访问 GCS（Google Cloud Storage）中的数据，你可以使用下面的可选 `pip` 安装语法，或者安装所需的特定包。

```bash
pip install fsspec[gcs]
conda install -c conda-forge gcsfs
```

`fsspec` 尝试在您尝试使用需要额外依赖项的文件系统时提供正确的消息。已知实现的当前列表可以在以下位置找到：

In [1]:
from fsspec.registry import known_implementations

known_implementations

{'data': {'class': 'fsspec.implementations.data.DataFileSystem'},
 'file': {'class': 'fsspec.implementations.local.LocalFileSystem'},
 'local': {'class': 'fsspec.implementations.local.LocalFileSystem'},
 'memory': {'class': 'fsspec.implementations.memory.MemoryFileSystem'},
 'dropbox': {'class': 'dropboxdrivefs.DropboxDriveFileSystem',
  'err': 'DropboxFileSystem requires "dropboxdrivefs","requests" and "dropbox" to be installed'},
 'http': {'class': 'fsspec.implementations.http.HTTPFileSystem',
  'err': 'HTTPFileSystem requires "requests" and "aiohttp" to be installed'},
 'https': {'class': 'fsspec.implementations.http.HTTPFileSystem',
  'err': 'HTTPFileSystem requires "requests" and "aiohttp" to be installed'},
 'zip': {'class': 'fsspec.implementations.zip.ZipFileSystem'},
 'tar': {'class': 'fsspec.implementations.tar.TarFileSystem'},
 'gcs': {'class': 'gcsfs.GCSFileSystem',
  'err': 'Please install gcsfs to access Google Storage'},
 'gs': {'class': 'gcsfs.GCSFileSystem',
  'err': 'P