使用 Emscripten 交叉编译 WebAssembly#
前提条件#
您需要按照常规构建说明安装 CMake 和编译器等。在使用 Emscripten 构建之前,您还需要安装 Emscripten 并使用以下命令激活它(详情请参阅 https://emscripten.webassembly.net.cn/docs/getting_started/downloads.html)。
git clone https://github.com/emscripten-core/emsdk.git
cd emsdk
# replace <version> with the desired EMSDK version.
# e.g. for Pyodide 0.26, you need EMSDK version 3.1.58
# the versions can be found in the Makefile.envs file in the Pyodide repo:
# https://github.com/pyodide/pyodide/blob/10b484cfe427e076c929a55dc35cfff01ea8d3bc/Makefile.envs
./emsdk install <version>
./emsdk activate <version>
source ./emsdk_env.sh
如果您想为 Pyodide 构建 PyArrow,您需要通过 pip
安装 pyodide-build
,并且运行与 Pyodide 构建所用的 Python 版本相同的版本,以及相同版本的 emsdk 工具。
# install Pyodide build tools.
# e.g., for version 0.26 of Pyodide, pyodide-build 0.26 and later work
pip install "pyodide-build>=0.26"
然后使用 ninja-release-emscripten
CMake 预设进行构建,如下所示
emcmake cmake --preset "ninja-release-emscripten"
ninja install
这会将构建的 libarrow
静态库版本安装到 Emscripten sysroot 缓存中,这意味着您可以构建依赖于它的东西,它们将找到 libarrow
。
例如,如果您想为 Pyodide 构建,请运行上述命令,然后转到 arrow/python
并运行
pyodide build
它应该在 dist
子目录中创建一个针对当前启用版本的 Pyodide 的 wheel 文件。
手动构建#
如果您想手动为 Emscripten 构建,请查看 arrow/cpp
目录中的 CMakePresets.json
文件,以获取您需要覆盖的内容列表。特别是您将需要
将构建依赖项设置为
BUNDLED
,以便它使用正确交叉编译的构建依赖项。使用
emcmake cmake
代替cmake
设置CMAKE_TOOLCHAIN_FILE
。对于针对单线程 Emscripten 环境(例如 Pyodide)的构建,您需要将
ARROW_ENABLE_THREADING
设置为OFF
。ARROW_FLIGHT
和任何其他使用网络的东西可能无法工作。ARROW_JEMALLOC
和ARROW_MIMALLOC
可能需要设置为OFF
将
ARROW_BUILD_STATIC
设置为ON
并将ARROW_BUILD_SHARED
设置为OFF
最有可能工作。