在iPhone 15上使用Hugging Face的135M SmolLM以超过每秒100个token的速度生成文本。小型语言模型 🚀使用MLX Swift,文档在这里:https://github.com/ml-explore/mlx-swift-examples/blob/main/Applications/LLMEval/README.md