利用GPU并行计算beta-NTI，大幅减少群落构建计算时间

作品简介

若没有GPU可使用AutoDL云GPU服务器，运行环境已配置，上传购买代码即可运行。运行环境链接见https://www.codewithgpu.com/i/HuTianlong1994/betaNTI/betaNTI_gpu_autoDL

18个样本，抽平到8500条序列，4344个OTUs，计算beta-NTI共花费时间如下。如果更好的显卡，更大的数据量，节约的时间应该更加可观。

> GPU（GTX1050）：1分20秒

> iCAMP包的`bNTIn.p()` 函数4核并行：约16分钟

Stegen等最初在2011年发表论文，利用`beta-NTI`推断群落构建，但其原始代码过多的使用for循环，效率很低。
尝试利用并行的方法加速beta-NTI 的计算过程，取得一定的效果，但picante 包的comdistnt 函数计算beta-MNTD的效率也同样很低，所以速度还是偏慢（但比之前Stegen的原始代码好很多了，取决于使用的线程数）
iCAMP 包对beta-MNTD 的函数的算法进行了优化，极大提高了计算的速度，同样也支持使用多线程。尽管如此，计算的速度和普通的beta多样性计算相比还是慢了很多（毕竟要进行1000次零模型的模拟）。
本文尝试利用python 基于cuda 的cupy 包调用GPU计算beta-NTI （总体的运行依然是在R中运行的）

创作时间：2023-05-15 20:20:54