大数据专业要解决的问题1.数据采集与清洗(ETL,数据的导出,清洗,转换,装入)2.数据存储与管理3.数据处理与分析4.结果展示(可视化技术)5.资源管理与调度数据采集的开源工具:1.Scrapy爬虫框架2.Flume日志采集系统3.kafka消息中间件4.Sqoop工具