没想到K80帮派超越了P40帮派登场。1万日元就能买到K80并获得24GB的VRAM,哈哈哈。不过,运行70B模型时,即使VRAM全部装载,也只能达到2tps的速度,与CPU差不多(大概是CPU的2到3倍速度吧)。想要用低成本构建运行70B本地LLM的环境:https://qiita.com/Kozo_Mizutani/items/e6bb3a182ec5ba7d6ad7