ChatGPT、Claude和Gemini 可以实现数据分析辅助。
近期看到篇文章,有人做了能力评估。
评估标准:
1. 完整性:报告是否覆盖数据检查、数据清理、单变量分析、多变量分析和洞察。
2. 准确性:统计计算、可视化和结论的准确性。
3. 可视化质量:可视化是否清晰、易于理解且与报告相关。
4. 深刻性:报告是否基于识别出的模式、趋势或关系生成了见解。
5. 可重复性和文档化:报告是否文档齐全,允许他人重复分析。
评估数据集:Kaggle上的客户个性分析数据集。
https://www.kaggle.com/datasets/imakash3011/customer-personality-analysis
任务要求:数据清理、分析和可视化,清晰的洞察和可行的建议。
结果:
ChatGPT-4.0:总分19/20,表现最佳,特别是在完整性、准确性和深刻性方面。
Claude 3.5 Sonnet:总分16/20,主要缺点是无法直接运行Python代码和显示可视化。
Gemini Advanced:总分19/20,与ChatGPT并列第一,但在可视化方面略显杂乱。
Prompt:
你是一家连锁超市的数据科学家。
你有一个包含客户人口信息、购买数据和营销活动历史的数据集。
你今天的目标是对这个数据集进行彻底的探索性数据分析(EDA),
包括必要的数据清理、分析和可视化,提供清晰的洞察和可行的建议。
你的EDA将用于更好地了解客户,
根据客户行为影响产品策略,并指导进一步的客户细分分析和建模。
以下是列的描述:
1. 人员
-ID:客户的唯一标识符
-Year_Birth:客户的出生年份
-Education:客户的教育水平
-Marital_Status:客户的婚姻状况
-Income:客户的年度家庭收入
-Kidhome:客户家庭中的儿童数量
-Teenhome:客户家庭中的青少年数量
-Dt_Customer:客户在公司注册的日期
-Recency:客户上次购买后的天数
-Complain:过去两年中客户是否投诉,1表示投诉,0表示未投诉
2. 产品
-MntWines:过去两年在葡萄酒上的花费
-MntFruits:过去两年在水果上的花费
-MntMeatProducts:过去两年在肉类产品上的花费
-MntFishProducts:过去两年在鱼类产品上的花费
-MntSweetProducts:过去两年在甜食上的花费
-MntGoldProds:过去两年在黄金产品上的花费
3. 促销
-NumDealsPurchases:折扣购买次数
-AcceptedCmp1:客户是否接受了第一次活动的优惠,1表示接受,0表示未接受
-AcceptedCmp2:客户是否接受了第二次活动的优惠,1表示接受,0表示未接受
-AcceptedCmp3:客户是否接受了第三次活动的优惠,1表示接受,0表示未接受
-AcceptedCmp4:客户是否接受了第四次活动的优惠,1表示接受,0表示未接受
-AcceptedCmp5:客户是否接受了第五次活动的优惠,1表示接受,0表示未接受
-Response:客户是否接受了最后一次活动的优惠,1表示接受,0表示未接受
4. 地点
-NumWebPurchases:通过公司网站进行的购买次数
-NumCatalogPurchases:使用目录进行的购买次数
-NumStorePurchases:直接在商店购买的次数
-NumWebVisitsMonth:上个月访问公司网站的次数
- 复制链接
- 举报