全套-当当网图书数据的分析与挖掘

作品简介

当当网图书数据分析与挖掘

数据集:爬取当当网的图书的销售数据

Video Player is loading.
Current Time 0:00
Duration 0:44
Loaded: 59.29%
Stream Type LIVE
Remaining Time 0:44
 
1x

技术:Flask、MySQL、Echarts

数据的分析

在数据的分析部分,主要分为四个维度,分别是类型、出版社、作者、出版时间。我们将对不同维度的平均价格和平均评论人数进行分析,并探讨它们之间的关系。通过这些分析结果,用户可以直观地了解数据的潜在内容。

1. 类型维度分析:

  - 平均价格:计算每个类型的图书的平均价格。

  - 平均评论人数:计算每个类型的图书的平均评论人数。

  - 关系分析:绘制散点图,展示不同类型图书的平均价格和平均评论人数之间的关系。用户可以通过观察图表来发现是否存在某种趋势或相关性。

2. 出版社维度分析:

  - 平均价格:计算每个出版社的图书的平均价格。

  - 平均评论人数:计算每个出版社的图书的平均评论人数。

  - 关系分析:绘制散点图,展示不同出版社图书的平均价格和平均评论人数之间的关系。用户可以通过观察图表来发现是否存在某种趋势或相关性。

3. 作者维度分析:

  - 平均价格:计算每个作者的图书的平均价格。

  - 平均评论人数:计算每个作者的图书的平均评论人数。

  - 关系分析:绘制散点图,展示不同作者图书的平均价格和平均评论人数之间的关系。用户可以通过观察图表来发现是否存在某种趋势或相关性。

4. 出版时间维度分析:

  - 平均价格:计算每个出版时间的图书的平均价格。

  - 平均评论人数:计算每个出版时间的图书的平均评论人数。

  - 关系分析:绘制散点图,展示不同出版时间图书的平均价格和平均评论人数之间的关系。用户可以通过观察图表来发现是否存在某种趋势或相关性。

创新点

在对数据进行分析的基础上,我们加入了聚类算法,对不同的图书进行聚类,并对聚类结果进行绘图,以查看不同类别的特征。通过聚类分析,我们可以将具有相似特征的图书分为一类,从而更好地理解图书的分布和特点。

系统设计

目录



创作时间:2023-11-18 12:50:13