什么样用Python做词云(收藏)

0、如若原先安装过ceph,则先卸载

图片 1

sudo stop ceph-all                                                                         //停止所有CEPH进程
ceph-deploy uninstall  [{ceph-node}]                                             //卸载所有ceph程序
ceph-deploy purge   [[ceph-node} [{ceph-node}]                           //删除ceph相关的包
ceph-deploy purgedata {ceph-node} [{ceph-node}]                       // 删除ceph相关的包
ceph-deploy forgetkeys                                                                  //删除key

图片 2

  

图片 3

壹 、修改/etc/hosts,使主机名对应本机的IP地址(若选拔回环地址127.0.0.1一般解析不了域名)。注:以下主机名都为monster,读者需将其改为协调的主机名

看过未来你有哪些感觉?想不想本身做一张出来?

10.10.105.78    monster
127.0.0.1       localhost

假定你的答案是顺其自然的,大家就不用贻误了,前些天就来一步步从零开首做个词云分析图。当然,做为基础的词云图,肯定没有刚才那两张新闻图酷炫。不过没什么,好的发轫是马到功成的2/4呗。食髓知味,后边你就足以自个儿晋级技术,进入你开挂的成功之路。

 

网上教你做新闻图的课程很多。许多都以使用了专用工具。那个工具好是好,便捷而强劲。只是它们功用都太过专一,适用范围有限。今日我们要品尝的,是用通用的编制程序语言Python来做词云。

贰 、创建目录ceph并进入

Python是一种时下相当流行的编制程序语言。你不仅能够用它做多少解析和可视化,仍可以够用来做网站、爬取数据、做数学题、写脚本替你偷懒……

 

接头豆瓣吗?它一开首正是用Python写的。

③ 、准备多个块设备(能够是硬盘也得以是LVM卷),那里我们利用LVM

在当前的编制程序语言热度排序里,Python屈居第六(当然,很三个人不容许,所以编制程序语言的排名榜有许多,你懂的)。但看难题要用发展理念。随着数据正确的向上,Python有突发的自由化。早点儿站上风口,很有便宜。

   dd if=/dev/zero of=ceph-volumes.img bs=1M count=8192 oflag=direct
   sgdisk -g --clear ceph-volumes.img
   sudo vgcreate ceph-volumes $(sudo losetup --show -f ceph-volumes.img)
   sudo lvcreate -L2G -nceph0 ceph-volumes
   sudo lvcreate -L2G -nceph1 ceph-volumes
   sudo mkfs.xfs -f /dev/ceph-volumes/ceph0
   sudo mkfs.xfs -f /dev/ceph-volumes/ceph1
   mkdir -p /srv/ceph/{osd0,osd1,mon0,mds0}
   sudo mount /dev/ceph-volumes/ceph0 /srv/ceph/osd0
   sudo mount /dev/ceph-volumes/ceph1 /srv/ceph/osd1

假定您前边未曾编制程序基础,没涉及。从零早先,意味着笔者会教您哪些设置Python运维环境,一步步做到词云图。希望你不用限于浏览,而是亲自下手尝试一番。到成功的那一步,你不光能够做出第叁张词云图,而且那还将是你的首先个有效的编制程序小说。

  依据地点的命令大家创立了多个虚拟磁盘ceph0和ceph1并分别挂载到/srv/ceph/osd0和/srv/ceph/osd1目录下

心动了?那大家就起来吧。

 

安装

首先,大家必要设置Python运维条件。

万一您用的是macOS,那么你的种类里面其实已经预装好了Python。

不过大家要动用到很多恢宏包的功用。因而最好安装1个Python工具套装。只须要一遍安装,未来半数以上的效益就都已购并了。不必每一次使用新作用,都去零打碎敲地安装新包了。

Python的套装有过多种,那里推荐给大家anaconda。因为经过自家4年多的品味与相比,感觉那款软件包的装置更为便捷,扩充包的蕴藏范围与结构更合理。

请你到 那个网址
下载anaconda套装。下拉网页找到下载地方。依照你的操作系统类型选取适宜的版本。

图片 4

因为本身的系统是macOS,所以网站一向给作者引进的就是macOS系统版本。但万一你用的是Windows或Linux,请切换来对应的标签页上边。

图片 5

不管你用的是哪个操作系统,请留意左边的五个按钮,分别对应Python
2.X和3.X版本。有人一定很纳闷,既然有新的版本,小编凭什么用旧的?

不是那样的。到2020年此前,Python的多少个版本会直接并存。Python的开发者确实希望大家升级切换来3.X本子。可惜最近3.X版本包容的壮大包数量比2.X本子要少,越发是关乎到数量科学类的软件包,就尤其显著。所以只要您是初我们,我建议您下载2.X(近来是2.7)版本,那样在此后的运用中,大概遭受的标题会少一些。等你采用熟练了,再迁移到3.X本子不迟。相信我,到那儿您会飞快适应新本子的。

下载后,执行安装文件就行了。

依照你的微处理器运转速度区别,安装的年华长短不等。耐心点儿,只需求等那1遍嘛。

安装完成之后,请你安装二个“现代化”浏览器。假若您用的是macOS,那么系统自带的Safari就挺好。别的的选料包括Firefox和GoogleChrome。

请安装上述浏览器之一,然后将其设置为系统私下认可的浏览器。

好了,上面请进来命令行方式。

在macOS和Linux下,你要求开启三个极端(terminal)。

图片 6

假假使Windows,请打开“开端”-“附属类小部件”-“命令提醒符”。

图片 7

键入以下命令:

mkdir democd demo

好了,你今后有1个专用的目录,叫做demo了。请到macOS的Finder或然Windows的“作者的微型总结机”里面,找到这些目录并且打开它。

重临终端上面,macOS也许Linux用户请键入以下命令:

pip install wordcloud

macOS会提醒您先安装XCode命令行工具,你依据暗中同意设置一步步进展就能够了。不过请小心,务必在WiFi环境下安装。假若您用的是4G流量,那你可要破费一笔了。

借使您用的是Windows,那么为了利用这几个词云包,就稍微麻烦一些,你需求到
那里 下载 wordcloud‑1.3.1‑cp27‑cp27m‑win32.whl
以此文件。下载后将它拖拽到你的demo目录里。

在指令行下,先实施:

pip install wheel

然后,再执行:

pip install wordcloud‑1.3.1‑cp27‑cp27m‑win32.whl

好了,大家须求的凡事Python运转条件到底装好了。

请务必依照上述手续执行,确认保障每一步都早就顺遂实现。不然假设遗漏,后边运转程序会报错。

4、安装ceph-deploy

数据

词云分析的对象,是文件。

答辩上讲,文本能够是各样语言的。英文、中文、法文、阿拉伯文……

为了省事,我们那里以英文文本为例。你能够任意到网上找一篇英文小说作为分析对象。笔者特别喜爱美利哥产影视片”Yes,
minister”,所以到维基百科上找到了那部剧的介绍词条。

图片 8

本人把个中的正文文字部分拷贝了下去,存款和储蓄为一个文书文件,叫做yes-minister.txt。

把那几个文件挪动到大家的行事目录demo里。

好了,文本数据现已准备好了。起头进入编程的魔幻世界呢!

sudo apt-get install ceph-deploy

代码

在命令行下,执行:

jupyter notebook

浏览器会活动开启,并且呈现如下界面。

图片 9

那正是我们刚才的劳动成果——安装好的运作环境了。我们还从未编写程序,目录下只有三个刚刚生成的文件文件。

开辟这些文件,浏览一下情节。

图片 10

归来Jupyter台式机的主页面。大家点击New按钮,新建二个台式机(Notebook)。在Notebooks里面,请选取Python
2选项。

图片 11

系统会提醒大家输入Notebook的称呼。程序代码文件的称呼,你能够随便起。不过我建议您起一个有意义的名字,现在好方便寻找。由于大家要尝试词云,就叫它wordcloud好了。

图片 12

接下来就涌出了贰个空白的记录簿,供大家利用了。我们在网页里唯一的代码文本框里,输入以下3条语句。请务必逐字依照示例代码输入,空格数量都不得以有差别。尤其让人瞩目第③行,用5个空格,可能三个Tab开始。输入后,按Shift+Enter键,就足以执行了。

filename = "yes-minister.txt"with open(filename) as f:

没有其他结果啊。

对,因为大家那里没有其余输出动作,程序只是开拓了您的yes-minister.txt文本文件,把内部的始末都读了出去,存款和储蓄到了二个号称mytext的变量里面。

然后大家尝试展现mytext的内容。输入以下语句之后,照旧得按Shift+Enter键,系统才会实际施行该语句。

mytext

以往的步骤里,也相对不要忘了这一确认实施动作。

展现的结果如下图所示。

图片 13

嗯,看来mytext变量里积存的文件便是大家从网上摘来的文字。到近来截至,一切寻常。

接下来大家呼唤(import)词云包,利用mytext中储存的文书内容来创造词云。

from wordcloud import WordCloud

那时程序大概会报告警方。别担心。警告(warning)不影响程序的正规运作。

图片 14

那时词云分析已经完毕了。你没看错,制作词云的主导步骤只须求那2行说话,而且首先条还只是从扩大包里找外来援助。不过程序并不会给大家来得任夏雯西。

说好了的词云呢?折腾了那样半天,却甚也没有,你蒙人吧?!

别激动。输入上面4行语句后,便是见证奇迹产生的每二日了。

%pylab inlineimport matplotlib.pyplot as plt

运行结果如图所示:

图片 15

不用那么欢乐嘛。

您能够在词云图片上单机鼠标右键,用“图片另存为”功效导出。

图片 16

由此那张词云图,我们得以见见不一致单词和词组出现的频率高低差异。高频词的字体分明更大,而且颜色也很扎眼。值得表达的是,最分明的单词哈克er并不是指黑客,而是指那部剧的台柱之一——哈克首相。

包涵程序完整代码的ipynb文件,笔者也分享了出去,你能够从 那里 下载。

梦想您在品尝进度中一切顺遂。对协调生成的词云图满足吗?假使您不乐意,也不要紧,能够挖掘wordcloud软件包的其余高档成效。尝试一下,看本人能或不能够做出如此的词云图来?学习进度中遇见什么难题恐怕想获取学习能源的话,私聊笔者

 

五 、创造工作目录,进入并创建集群

   mkdir ceph-cluster
   cd ceph-cluster
   ceph-deploy new  monster //创建一个新集群,并写入CLUSTER.conf和keyring等等

  因为我们是在单节点上中国人民解放军海军工程学院业作,因而必要修改一下布局文件

echo "osd crush chooseleaf type = 0" >> ceph.conf
echo "osd pool default size = 1" >> ceph.conf
echo "osd journal size = 100" >> ceph.conf

 

6、安装Ceph基本库(ceph,ceph-common, ceph-fs-common, ceph-mds)

ceph-deploy install monster

  可是本身透过地点的措施安装好像有个别难题……于是直接apt-get install
ceph也行

 

柒 、创立2个集群监视器

ceph-deploy mon create monster

 

捌 、收集远程节点上的密钥到日前文件夹

ceph-deploy gatherkeys monster

 

玖 、扩充OSD,就在大家挂载虚拟磁盘的目录

ceph-deploy osd prepare monster:/srv/ceph/osd0
ceph-deploy osd prepare monster:/srv/ceph/osd1

 

10、激活OSD

sudo ceph-deploy osd activate monster:/srv/ceph/osd0
sudo ceph-deploy osd activate monster:/srv/ceph/osd1

  [ceph_deploy][ERROR ] RuntimeError: Failed to execute command:
ceph-disk -v activate –mark-init upstart –mount /srv/ceph/osd0

  激活时相遇如上所示的错误时,使用命令 sudo chown ceph:ceph
/srv/ceph/osd0消除(可是在此之前做过osd的磁盘,境遇这一个题材用那种艺术一般化解不了….)

 

1一 、复制 admin 密钥到别的节点

ceph-deploy admin monster

 

12、验证

sudo ceph health
sudo ceph osd tree 

  

 

发表评论

电子邮件地址不会被公开。 必填项已用*标注