个人快速评测大模型的3个提问:编码:不使用搜索和工具,设计并使用Python实现流式的JSON解码器,只能使用标准库,代码结构良好。指令遵循:使用中文以及JSON 格式输出中国城市和主要景点的对应关系,城市为key,景点为列表。输出五个城市,第一个城市一个景点,以此类推。逻辑推理:不使用搜索和工具,使用万有引力定律反推出开普勒三定律,给出完整严谨的证明过程。模型效果:kimi:0、0、0GPT4: 1、1、0.5 ,最后一个问题有少量省略。llama3: 1、1、0