1、作品名称
淘宝商品数据可视化
2、作品分类
数据可视化
3、作品描述
通过使用Python爬虫技术实现淘宝商家信息的爬取,经过解析库的解析后把商家信息存储在SQLite数据库中。经过数据预处理后,对爬取到的每一种商品信息进行了可视化分析,如商品价格走势图、各地区店铺数量图,商家广告信息词云图(基于自然语言处理)和城市销售量热力图等。同时,为了给用户提供更好的交互性,用django搭建完整框架,编写Web界面,让用户操作更简单,并提供了栩栩如生的动态画面,用户可以轻易改变热力图显示区域,让淘宝商家信息尽在掌控之中。 项目实现了主要从商品价格走势,商品主要采用的关键词,主要发货地,月销量几个主要方面对商品进行分析,将其制成可视化图表,使读者对影响商品销量的因素有更直观的了解;与此同时通过价格走势表,买家也对什么时候该买什么商品更有了解,也可以为买家省下一些钱财,避免出现卖家打着促销活动的口号却进行着“杀猪”的行为。
4、创意来源
如今,淘宝在人类生活中扮演着越来越重要的角色。eMarketer报告依照过去一年对各平台销售额统计得出,全球两大顶级电商平台是阿里巴巴旗下的淘宝和天猫。公开数据显示,阿里巴巴中国零售市场上一财年成交总额达5.727万亿元,淘宝天猫新增1亿用户,为商家带去了超过9000亿的增量生意。根据淘宝最新公开数据,最近三年加入淘宝的新商家,年成交总体量已接近5000亿元人民币的规模。 轻敲几下键盘,点几下鼠标,或者摆弄一下手机,然后安心在家等“宝贝”送上门来。而网上商品种类繁多,价格也各异,质量参差不齐,买家如何在海量信息中自动、快速获取所需优质商品成为一个急需解决的问题。
5、运行环境(所需操作系统、硬件、软件等)
系统框架采用django,页面整体布局采用bootstrap栅格框架,使用自动化测试工具 Selenium、pyecharts库等。 运行环境建议为:Python3.7,MySQL5.8,内存:4GB;硬盘空间:1TB;处理器:Intel 奔腾双核 E5200 或更高;显卡:七彩虹 GTX1050。
声明:此文版权归原作者所有,若有来源错误或者侵犯您的合法权益,您可通过邮箱与我们取得联系,我们将及时进行处理。邮箱地址:mail@cmit.cn