尽管看起来不可思议,但事实就是如此,感兴趣的朋友不妨一试。目前,Groq 的官网提供了试用体验。官网地址:https://groq.com/Groq 的处理器名为 LPU(语言处理单元),是一种新型的端到端处理单元系统,可以为具备序列组件的计算密集型应用(比如 LLM)提供极快的推理速度。它带动的大模型速度能达到前所未有的 500 Token/s,并且实现了极低的延迟。