-
置顶
亚马逊雨林火灾数据的可视化分析
亚马逊雨林区是世界最大的雨林区,它可以消耗大量二氧化碳,阻止气候变暖;林区还藏有丰富的动植物资源,种类高达300万种,里面还有100万原住民。不幸的是,雨林生态系统不断面临着众多的威胁,越来越多的森林砍伐导致雨林面积逐年缩小。同时,全球变暖也增加了发生野火的可能性和频率。本案例对20年(1999-2019)的的亚马逊雨林火灾数据进行探索分析与可视化。
-
Tranfer+fine Tune+mnist
迁移学习用来解决当某一任务A数据量不足时,通过另一相似任务B提供经验(也就是从任务B迁移到任务A)的问题。
-
Imagenet迁移学习图片分类示例
import keras from keras.applications import Xception from keras.applications.vgg19 import VGG19
-
苹果商店游戏APP数据的可视化分析
手机游戏产业价值数十亿美元,公司在这些游戏的开发和市场推广上花费了大量的资金。利用苹果商店游戏数据集,可以洞察其中的细分市场——策略游戏。这一细分市场包括《部落冲突》、《植物大战僵尸》和《精灵宝可梦GO》等游戏。在案例中可以将游戏的评分数量作为游戏总体获得成功的代替指标,找出是什么因素造就了这款游戏的成功;或者可以衡量一段时间内市场的状况,并尝试预测这些游戏的发展方向。
-
非洲国家金融危机数据分析
数据集
african_crises.csv
包含1860年至2014年在13个非洲国家发生的银行业,债务,金融,通货膨胀和系统性危机,这些国家包括:阿尔及利亚,安哥拉,中非共和国,象牙海岸,埃及,肯尼亚,毛里求斯,摩洛哥, 尼日利亚,南非,突尼斯,赞比亚和津巴布韦,在本案例中我们通过分析各个国家货币对美元的汇率变化、通货膨胀率的变化以及国内国外债务违约情况等,对一些历史和金融现象进行了梳理。同时我们通过以上一系列特征,通过分类模型预测银行危机的发生。该数据集对研究非洲金融动态较有价值。 -
基于Python的红楼梦文本分析
在一部小说中主人公的每一段语言、文字都或多或少带着其人物形象的烙印,《红楼梦》是中国的四大名著之一,共120回,一直以来吸引着很多学者去研究。本案例基于统计分析、文本挖掘等知识,使用Python对红楼梦120回的文本数据进行可视化和聚类分析。
-
基于分类算法的宫颈癌疾病诊断
据世界卫生组织报告,宫颈癌作为危害女性健康的主要恶性肿瘤之一,是欠发达地区女性致死的第二大癌症。中国医学科学院肿瘤医院全国肿瘤登记中心数据统计显示,2003~2007年中国女性宫颈癌发病率为9.62/10万 ,在癌症发病构成中排列第7位;同期宫颈癌死亡率为2.54/10万,在癌症死亡原因中排列第14位。宫颈癌对女性健康产生了巨大威胁,宫颈癌如能早期发现并提前治疗,能有效降低患病死亡率。
-
空难数据探索分析
本案例基于Socrata上的开放数据,数据集
Airplane_Crashes_and_Fatalities_Since_1908.csv
记录了全球自1908年以来的部分空难情况。我们对数据做探索分析:哪些年份的空难较多?哪些航空公司的空难较多? 哪些机型的空难较多? 生还和遇难人数如何?空难原因是什么?
1/2