热门
最新
红包
立Flag
投票
同城
我的
发布
CSDN App 扫码分享
评论
点赞
打赏
- 复制链接
- 举报
下一条:
ChatGPT、Claude和Gemini 可以实现数据分析辅助。近期看到篇文章,有人做了能力评估。评估标准:1. 完整性:报告是否覆盖数据检查、数据清理、单变量分析、多变量分析和洞察。2. 准确性:统计计算、可视化和结论的准确性。3. 可视化质量:可视化是否清晰、易于理解且与报告相关。4. 深刻性:报告是否基于识别出的模式、趋势或关系生成了见解。5. 可重复性和文档化:报告是否文档齐全,允许他人重复分析。评估数据集:Kaggle上的客户个性分析数据集。https://www.kaggle.com/datasets/imakash3011/customer-personality-analysis任务要求:数据清理、分析和可视化,清晰的洞察和可行的建议。结果:ChatGPT-4.0:总分19/20,表现最佳,特别是在完整性、准确性和深刻性方面。Claude 3.5 Sonnet:总分16/20,主要缺点是无法直接运行Python代码和显示可视化。Gemini Advanced:总分19/20,与ChatGPT并列第一,但在可视化方面略显杂乱。Prompt:你是一家连锁超市的数据科学家。你有一个包含客户人口信息、购买数据和营销活动历史的数据集。你今天的目标是对这个数据集进行彻底的探索性数据分析(EDA),包括必要的数据清理、分析和可视化,提供清晰的洞察和可行的建议。你的EDA将用于更好地了解客户,根据客户行为影响产品策略,并指导进一步的客户细分分析和建模。以下是列的描述:1. 人员-ID:客户的唯一标识符-Year_Birth:客户的出生年份-Education:客户的教育水平-Marital_Status:客户的婚姻状况-Income:客户的年度家庭收入-Kidhome:客户家庭中的儿童数量-Teenhome:客户家庭中的青少年数量-Dt_Customer:客户在公司注册的日期-Recency:客户上次购买后的天数-Complain:过去两年中客户是否投诉,1表示投诉,0表示未投诉2. 产品-MntWines:过去两年在葡萄酒上的花费-MntFruits:过去两年在水果上的花费-MntMeatProducts:过去两年在肉类产品上的花费-MntFishProducts:过去两年在鱼类产品上的花费-MntSweetProducts:过去两年在甜食上的花费-MntGoldProds:过去两年在黄金产品上的花费3. 促销-NumDealsPurchases:折扣购买次数-AcceptedCmp1:客户是否接受了第一次活动的优惠,1表示接受,0表示未接受-AcceptedCmp2:客户是否接受了第二次活动的优惠,1表示接受,0表示未接受-AcceptedCmp3:客户是否接受了第三次活动的优惠,1表示接受,0表示未接受-AcceptedCmp4:客户是否接受了第四次活动的优惠,1表示接受,0表示未接受-AcceptedCmp5:客户是否接受了第五次活动的优惠,1表示接受,0表示未接受-Response:客户是否接受了最后一次活动的优惠,1表示接受,0表示未接受4. 地点-NumWebPurchases:通过公司网站进行的购买次数-NumCatalogPurchases:使用目录进行的购买次数-NumStorePurchases:直接在商店购买的次数-NumWebVisitsMonth:上个月访问公司网站的次数