量化后的Gemma2B在我的iPhone15pro上通过ML-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

2 年前

trueweixin_42518981

量化后的Gemma 2B在我的iPhone 15 pro上通过MLX Swift运行得非常快。

代码和文档：https://github.com/ml-explore/mlx-swift-examples/blob/main/Applications/LLMEval/README.md

在@msysorg的基准测试中，其性能可与GPT 3.5 turbo和Mixtral 8x7B相媲美，但可以高效地在iPhone上运行。真是太疯狂了。

CSDN App 扫码分享

分享

15

170

复制链接
举报

下一条：

谁在进行最有趣的关于米斯特拉模型的机械智能工作？