当当网图书数据分析与挖掘
数据集:爬取当当网的图书的销售数据
Video Player is loading.
Current Time 0:00
Duration 0:44
Remaining Time -0:44
Beginning of dialog window. Escape will cancel and close the window.
End of dialog window.
技术:Flask、MySQL、Echarts
数据的分析
在数据的分析部分,主要分为四个维度,分别是类型、出版社、作者、出版时间。我们将对不同维度的平均价格和平均评论人数进行分析,并探讨它们之间的关系。通过这些分析结果,用户可以直观地了解数据的潜在内容。
1. 类型维度分析:
- 平均价格:计算每个类型的图书的平均价格。
- 平均评论人数:计算每个类型的图书的平均评论人数。
- 关系分析:绘制散点图,展示不同类型图书的平均价格和平均评论人数之间的关系。用户可以通过观察图表来发现是否存在某种趋势或相关性。
2. 出版社维度分析:
- 平均价格:计算每个出版社的图书的平均价格。
- 平均评论人数:计算每个出版社的图书的平均评论人数。
- 关系分析:绘制散点图,展示不同出版社图书的平均价格和平均评论人数之间的关系。用户可以通过观察图表来发现是否存在某种趋势或相关性。
3. 作者维度分析:
- 平均价格:计算每个作者的图书的平均价格。
- 平均评论人数:计算每个作者的图书的平均评论人数。
- 关系分析:绘制散点图,展示不同作者图书的平均价格和平均评论人数之间的关系。用户可以通过观察图表来发现是否存在某种趋势或相关性。
4. 出版时间维度分析:
- 平均价格:计算每个出版时间的图书的平均价格。
- 平均评论人数:计算每个出版时间的图书的平均评论人数。
- 关系分析:绘制散点图,展示不同出版时间图书的平均价格和平均评论人数之间的关系。用户可以通过观察图表来发现是否存在某种趋势或相关性。
创新点
在对数据进行分析的基础上,我们加入了聚类算法,对不同的图书进行聚类,并对聚类结果进行绘图,以查看不同类别的特征。通过聚类分析,我们可以将具有相似特征的图书分为一类,从而更好地理解图书的分布和特点。
系统设计
目录