拉勾教育在Python中创建文字云或标签云
从开始从事数据可视化工作的那一天起,我就爱上它了。我总是喜欢从数据中获得有用的见解。拉勾IT课小编为大家分解
在此之前,我只了解基本图表,例如条形图,散点图,直方图等,这些基本图表内置在tableau中,而Power BI则用于数据可视化。通过每天完成此任务,我遇到了许多新图表,例如径向仪表盘,华夫图等。
因此,出于好奇,近我正在搜索数据可视化中使用的所有图表类型,这些词云引起了我的注意,我发现它非常有趣。直到现在,看到这个词云图像迫使我认为这些只是随机排列的图像,这些单词是随机排列的,但是我错了,而且一切都从这里开始。之后,我尝试使用Tableau和Power BI中的少量数据制作词云。在成功尝试之后,我想通过编写条形图,饼图和其他图表的代码来尝试使用它。
词云是什么?
定义:词云是一个简单但功能强大的可视化表示对象,用于文本处理,它以更大,更粗的字母和不同的颜色显示常用的词。单词的大小越小,重要性就越小。
标签云的用途
1)社交媒体上的热门标签(Instagram,Twitter): 全世界,社交媒体都在寻找新更新的趋势,因此,我们可以获取人们在其帖子中使用多的标签。
2)媒体中的热门话题: 分析,我们可以在头条中找到关键字,并提取出前n个需求较高的主题,并获得所需的结果,即前n个热门媒体主题。
3)电子商务中的搜索词: 在电子商务购物网站中,网站所有者可以制作被搜索次数多的购物商品的词云。这样,他就可以了解在特定时期内哪些商品需求量很大。
让我们开始在python中编码以实现这种词云
首先,我们需要在jupyter notebook中安装所有库。
在python中,我们将安装一个内置库wordcloud。在Anaconda命令提示符下,输入以下代码:
pip install wordcloud
如果你的anaconda环境支持conda,请输入:
conda install wordcloud
虽然,这可以直接在notebook本身中实现,只需在代码的开头添加“!”即可。
像这样:
!pip install wordcloud
现在,在这里,我将生成拥有任何主题的维基百科文本的词云。因此,我将需要一个Wikipedia库来访问Wikipedia API,可以通过在anaconda命令提示符下安装Wikipedia来完成,如下所示:
pip install wikipedia
现在我们还需要其他一些库,它们是numpy,matplotlib和pandas。
截至目前,我们需要的库就安装好了
import wikipedia
result= wikipedia.page("MachineLearning")
final_result = r***ntent
print(final_result)
机器学习维基百科页面的输出:
上图是我们通过检索Wikipedia的机器学习页面获得的输出的图像。在那里,我们还可以看到它可以向下滚动,这表示将检索整个页面。
在此之前,我只了解基本图表,例如条形图,散点图,直方图等,这些基本图表内置在tableau中,而Power BI则用于数据可视化。通过每天完成此任务,我遇到了许多新图表,例如径向仪表盘,华夫图等。
因此,出于好奇,近我正在搜索数据可视化中使用的所有图表类型,这些词云引起了我的注意,我发现它非常有趣。直到现在,看到这个词云图像迫使我认为这些只是随机排列的图像,这些单词是随机排列的,但是我错了,而且一切都从这里开始。之后,我尝试使用Tableau和Power BI中的少量数据制作词云。在成功尝试之后,我想通过编写条形图,饼图和其他图表的代码来尝试使用它。
词云是什么?
定义:词云是一个简单但功能强大的可视化表示对象,用于文本处理,它以更大,更粗的字母和不同的颜色显示常用的词。单词的大小越小,重要性就越小。
标签云的用途
1)社交媒体上的热门标签(Instagram,Twitter): 全世界,社交媒体都在寻找新更新的趋势,因此,我们可以获取人们在其帖子中使用多的标签。
2)媒体中的热门话题: 分析,我们可以在头条中找到关键字,并提取出前n个需求较高的主题,并获得所需的结果,即前n个热门媒体主题。
3)电子商务中的搜索词: 在电子商务购物网站中,网站所有者可以制作被搜索次数多的购物商品的词云。这样,他就可以了解在特定时期内哪些商品需求量很大。
让我们开始在python中编码以实现这种词云
首先,我们需要在jupyter notebook中安装所有库。
在python中,我们将安装一个内置库wordcloud。在Anaconda命令提示符下,输入以下代码:
pip install wordcloud
如果你的anaconda环境支持conda,请输入:
conda install wordcloud
虽然,这可以直接在notebook本身中实现,只需在代码的开头添加“!”即可。
像这样:
!pip install wordcloud
现在,在这里,我将生成拥有任何主题的维基百科文本的词云。因此,我将需要一个Wikipedia库来访问Wikipedia API,可以通过在anaconda命令提示符下安装Wikipedia来完成,如下所示:
pip install wikipedia
现在我们还需要其他一些库,它们是numpy,matplotlib和pandas。
截至目前,我们需要的库就安装好了
import wikipedia
result= wikipedia.page("MachineLearning")
final_result = r***ntent
print(final_result)
机器学习维基百科页面的输出:
上图是我们通过检索Wikipedia的机器学习页面获得的输出的图像。在那里,我们还可以看到它可以向下滚动,这表示将检索整个页面。