PyArrow

PyArrow#

PyArrow 是 Apache Arrow 的 Python 绑定。

安装

pip install pyarrow
conda install -c conda-forge pyarrow

Windows 上的 tzdata#

虽然 Arrow 在 Linux 和 macOS 上使用操作系统提供时区数据库,但在 Windows 上需要用户提供数据库。要下载和解压缩 IANA 时区数据库的文本版本,请按照 C++ 运行时依赖项中的说明操作。

默认情况下,时区数据库将被检测在 %USERPROFILE%\Downloads\tzdata 目录中。如果数据库被下载到了其他位置,你需要从 Python 设置一个到数据库的自定义路径:

import pyarrow as pa
pa.set_timezone_db_path("custom_path")